Quatre articles de recherche publiés dans Nature suivez les traces génétiques et les origines géographiques des maladies humaines dans le temps. Les analyses fournissent des images détaillées de la diversité humaine préhistorique et de la migration, tout en proposant une explication de l’augmentation du risque génétique de sclérose en plaques (SEP).
En analysant les données du plus grand ensemble de données au monde à ce jour sur 5 000 génomes humains anciens d’Europe et d’Asie occidentale (Eurasie), de nouvelles recherches ont découvert les pools génétiques humains préhistoriques de l’Eurasie occidentale avec des détails sans précédent.
Les résultats sont présentés dans quatre articles publiés dans le même numéro de Nature par une équipe internationale de chercheurs dirigée par des experts de l’Université de Copenhague et les contributions d’environ 175 chercheurs d’universités et de musées du Royaume-Uni, des États-Unis, d’Allemagne, d’Australie, de Suède, du Danemark, de Norvège, de France, de Pologne, de Suisse, d’Arménie et d’Ukraine. , Russie, Kazakhstan et Italie. Les nombreux chercheurs représentent un large éventail de disciplines scientifiques, notamment l’archéologie, la biologie évolutionniste, la médecine, la recherche sur l’ADN ancien, la recherche sur les maladies infectieuses et l’épidémiologie.
Les découvertes de la recherche présentées dans le Nature les articles sont basés sur des analyses d’un sous-ensemble des 5 000 génomes et comprennent :
Le projet 5 000 génomes humains anciens
L’ensemble de données sans précédent de 5 000 génomes humains anciens a été reconstruit au moyen d’une analyse des os et des dents rendue disponible grâce à un partenariat scientifique avec des musées et des universités d’Europe et d’Asie occidentale. L’effort de séquençage a été réalisé grâce à la puissance de la technologie Illumina.
L’âge des spécimens va du Mésolithique et du Néolithique jusqu’au Moyen Âge en passant par l’âge du bronze, l’âge du fer et la période viking. Le génome le plus ancien de l’ensemble de données provient d’un individu qui a vécu il y a environ 34 000 ans.
« L’objectif initial du projet sur les génomes humains anciens était de reconstruire 1 000 génomes humains anciens d’Eurasie pour en faire un nouvel outil de précision pour la recherche sur les troubles cérébraux », expliquent les trois professeurs de l’Université de Copenhague qui ont eu l’idée en 2018 de l’ADN. ensemble de données, et a initialement décrit le concept du projet : Eske Willerslev, experte en analyse de l’ADN ancien, conjointement à l’Université de Cambridge, et directrice du projet ; Thomas Werge, expert des facteurs génétiques à l’origine des troubles mentaux et directeur de l’Institut de psychiatrie biologique desservant les services de santé mentale de la région de la capitale du Danemark ; et Rasmus Nielsen, expert en analyses statistiques et informatiques de l’ADN ancien, conjointement à l’Université de Californie à Berkeley, aux États-Unis
L’objectif était de produire un ensemble unique de données génomiques anciennes pour étudier les traces et l’histoire évolutive génétique des troubles cérébraux aussi loin que possible afin d’acquérir une nouvelle compréhension médicale et biologique de ces troubles. Cela devait être accompli en comparant les informations des anciens profils ADN avec les données de plusieurs autres disciplines scientifiques.
Parmi les troubles cérébraux initialement identifiés par les trois professeurs comme candidats à cette étude figuraient des maladies neurologiques telles que la maladie de Parkinson, la maladie d’Alzheimer et la sclérose en plaques, ainsi que des troubles mentaux tels que le TDAH et la schizophrénie.
En 2018, les trois professeurs ont ensuite contacté la Fondation Lundbeck, une importante fondation de recherche danoise, pour obtenir un financement afin de compiler l’ensemble spécial de données ADN. Ils ont reçu une subvention de recherche sur cinq ans d’un montant total de 60 millions DKK (environ 8 millions d’euros) pour le projet, qui devait être coordonné à l’Université de Copenhague via un centre nouvellement créé, ensuite baptisé Lundbeck Foundation GeoGenetics Center.
« La raison pour laquelle nous avons accordé une subvention de recherche aussi importante à ce projet, comme l’a fait la Fondation Lundbeck en 2018, était que si tout fonctionnait, cela représenterait un moyen novateur de mieux comprendre comment l’architecture génétique sous-jacente les troubles cérébraux ont évolué au fil du temps. Et les troubles cérébraux constituent notre domaine d’intervention spécifique », déclare Jan Egebjerg, directeur de la recherche à la Fondation Lundbeck.
La Fondation Lundbeck soutient également le consortium iPYSCH, l’une des plus grandes études au monde sur les causes génétiques et environnementales des troubles mentaux tels que l’autisme, le TDAH, la schizophrénie, le trouble bipolaire et la dépression, où l’accent est également mis sur l’élaboration de profils de risque génétiques pour ces troubles. aussi précis que possible.
Les résultats rapportés dans Natureont été étayés par la comparaison de l’ensemble de données génomiques anciennes avec des données génétiques anonymisées du grand consortium danois iPYSCH et des profils ADN de 400 000 individus actuels enregistrés dans la biobanque britannique.
De nombreux défis
Le principe du projet était expérimental, raconte le professeur Werge. « Nous voulions collecter des spécimens humains anciens pour voir ce que nous pourrions en tirer, par exemple pour essayer de comprendre une partie du contexte environnemental de l’évolution des maladies et des troubles. À mon avis, le fait que le projet ait pris une dimension aussi vaste et complexe des proportions qui Nature Je voulais qu’il soit décrit dans quatre articles est tout à fait unique.
Le professeur Willerslev commente que la compilation de l’ensemble des données ADN a posé des défis logistiques majeurs. « Nous avions besoin d’accéder à des spécimens archéologiques de dents et d’os humains dont nous savions qu’ils étaient dispersés dans les musées et autres institutions de la région eurasienne, ce qui nécessitait de nombreux accords de collaboration. Mais une fois qu’ils ont été mis en place, les choses ont vraiment décollé : les données » L’ensemble de données était en plein essor et dépasse désormais les 5 000 génomes humains anciens. La taille de l’ensemble de données a considérablement amélioré à la fois la convivialité et la précision des résultats. «
Le professeur Nielsen était chargé de planifier les analyses statistiques et bioinformatiques des informations glanées sur les dents et les os anciens dans les laboratoires de l’Université de Copenhague. Et il avait affaire à un volume considérable de données, dans lesquelles l’ADN était souvent gravement dégradé.
« Personne n’avait auparavant analysé autant de génomes anciens. Nous devions maintenant découvrir comment gérer des volumes de données aussi importants. Le problème était que les données brutes sont très difficiles à travailler car vous vous retrouvez avec de nombreuses séquences d’ADN courtes avec de nombreuses erreurs. , et ensuite ces séquences doivent être correctement cartographiées à la bonne position dans le génome humain. De plus, il y a le problème de la contamination par tous les micro-organismes présents sur les dents et les os anciens.
« Imaginez que vous ayez un puzzle composé de millions de pièces mélangées à quatre autres jeux de puzzles incomplets, puis que vous mettiez tout cela au lave-vaisselle pendant une heure. Assembler le tout ensuite n’est pas une tâche facile. L’une des clés de notre succès dans Au final, nous avons collaboré avec le Dr Olivier Delanau de l’Université de Lausanne, qui a développé des algorithmes pour surmonter ce problème », explique le professeur Nielsen.
Intérêt international
Des rumeurs selon lesquelles un vaste ensemble de données anciennes sur le génome humain était en cours de compilation ont rapidement circulé dans les cercles scientifiques. Et depuis 2022, l’intérêt est très élevé, affirment les professeurs Werge, Willerslev et Nielsen. « Nous répondons constamment aux demandes de chercheurs du monde entier, en particulier ceux qui étudient les maladies, qui demandent généralement l’accès pour explorer l’ensemble de données sur l’ADN ancien. »
Les quatre Nature les articles démontrent que le vaste ensemble de données de 5 000 génomes sert d’outil de précision capable de fournir de nouvelles informations sur les maladies lorsqu’il est combiné avec des analyses de données actuelles sur l’ADN humain et des apports de plusieurs autres domaines de recherche.
Selon le professeur Willerslev, cela est en soi extrêmement étonnant. « Il ne fait aucun doute qu’un ensemble de données génomiques anciennes de cette taille aura des applications dans de nombreux contextes différents au sein de la recherche sur les maladies. À mesure que de nouvelles découvertes scientifiques dérivées de l’ensemble de 5 000 données génomiques seront publiées, davantage de données seront progressivement mises gratuitement à la disposition de tous les chercheurs. À terme, l’ensemble complet des données sera en libre accès pour tous. »
Plus d’information:
Morten E. Allentoft et al, Génomique des populations de l’Eurasie occidentale post-glaciaire, Nature (2024). DOI : 10.1038/s41586-023-06865-0
Evan K. Irving-Pease et al, Le paysage de sélection et l’héritage génétique des anciens Eurasiens, Nature (2024). DOI : 10.1038/s41586-023-06705-1
William Barrie et al, Un risque génétique élevé de sclérose en plaques est apparu dans les populations pastorales des steppes, Nature (2024). DOI : 10.1038/s41586-023-06618-z
Morten E. Allentoft et al, 100 génomes anciens montrent des changements de population répétés au Danemark néolithique, Nature (2024). DOI : 10.1038/s41586-023-06862-3