Un nouveau génome humain de référence ouvre des régions inexplorées

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Une séquence complète du génome humain a finalement été publiée par un consortium international de scientifiques. Le nouveau génome de référence comble de nombreuses lacunes laissées par les versions antérieures, notamment au niveau des centromères au milieu des chromosomes et des duplications à grande échelle.

Les travaux sont décrits dans une série d’articles publiés le 1er avril dans La science par le consortium Telomere-to-Telomer (T2T). Un certain nombre d’enquêteurs de l’Université de Californie à Davis ont contribué aux études, notamment Megan Dennis, professeure adjointe de biochimie et de médecine moléculaire à l’UC Davis School of Medicine and MIND Institute, avec les étudiants diplômés en génétique intégrative et génomique Daniela Soto et Colin Shew, comme ainsi que Charles Langley, professeur distingué d’évolution et d’écologie à l’UC Davis College of Biological Sciences avec sa fille Sasha Langley, scientifique du projet à l’UC Berkeley.

La séquence originale du génome humain, publiée en 2001, omettait environ huit pour cent de l’ADN, a déclaré Dennis. Les zones laissées de côté comprenaient des duplications presque identiques contenant des gènes fonctionnels ainsi que des centromères et des télomères au milieu et à l’extrémité des chromosomes respectivement. Ces zones contiennent de longues séries de séquences répétées.

« Ce sont des régions importantes mais difficiles à séquencer », a déclaré Dennis.

Séquençage d’un génome, c’est un peu comme découper un livre en bribes de texte, puis essayer de reconstruire le livre en les reconstituant. Les portions de texte qui contiennent beaucoup de mots et de phrases communs ou répétés seraient plus difficiles à mettre à leur place que des morceaux de texte plus uniques.

La technologie antérieure de séquençage de l’ADN ne pouvait lire que des séries de séquences relativement courtes.

« Une avancée majeure dans la technologie a été le séquençage à lecture longue », a déclaré Dennis. Les séquenceurs de nouvelle génération peuvent décoder des morceaux beaucoup plus longs, jusqu’à un million de paires de bases ou « lettres » d’ADN. Cela signifie que les morceaux sont beaucoup plus gros et plus faciles à assembler dans la séquence d’origine.

« Cela change la donne », a déclaré Dennis.

Les chercheurs de l’UC Davis ont contribué au projet en effectuant une partie du séquençage à lecture longue avec des machines au Genome Center et en analysant des variantes et des séquences dupliquées.

Le nouveau génome de référence provient d’un seul échantillon humain, mais pas exactement d’une personne. L’ADN provenait d’une lignée cellulaire dérivée d’un faisceau de cellules appelé taupe hydatiforme. Ceux-ci se forment lorsqu’un ovule dans l’utérus perd son propre génome mais est fécondé par un spermatozoïde. La cellule résultante se retrouve avec deux copies identiques de chaque chromosome, contrairement à la plupart des cellules humaines, qui portent deux copies légèrement différentes. Malgré son origine étrange, rien ne suggère quelque chose d’inhabituel avec le génome de la lignée cellulaire, a déclaré Dennis.

Le sperme provenait d’une personne d’origine européenne. En revanche, le génome de référence humain original a été assemblé à partir de plusieurs personnes, créant des erreurs et des artefacts.

Explorer le centromère

Environ 90% de la nouvelle séquence provient en fait des centromères des chromosomes, a déclaré Langley. Structurellement distinctes et contenant de longues étendues d’ADN répétitif, ces régions sont notoirement difficiles à étudier.

« Nous avions l’habitude de dire que vous avertiriez les jeunes généticiens de ne pas s’aventurer dans le centromère car vous n’en sortirez jamais », a déclaré Langley.

Mais ces jours-ci, les centromères sont un sujet brûlant en biologie. C’est là que la machinerie qui sépare les chromosomes appariés pendant la méiose – formation de spermatozoïdes et d’ovules – s’attache, une étape fondamentale de l’hérédité. Il contient de grandes quantités d’hétérochromatine, ou des zones où l’ADN et les protéines semblent être plus condensés et compacts.

Les généticiens connaissent l’hétérochromatine, considérée comme des taches sombres sur les chromosomes, depuis des décennies. Des réflexions récentes suggèrent que l’hétérochromatine joue un rôle important dans la façon dont les gènes sont activés et désactivés en déplaçant des parties de l’ADN dans une phase différente du reste du chromosome, comme des gouttes d’huile dans l’eau. Cela créerait effectivement des compartiments dans le noyau où des gènes spécifiques pourraient être activés ou désactivés.

Un autre mystère des centromères est de savoir comment et pourquoi ils se forment systématiquement au même endroit, car il n’y a pas de code génétique spécifique pour qu’ils le fassent. Ils sont déterminés « épigénétiquement », c’est-à-dire en dehors du génome. Fondamentalement, vos centromères sont là où ils se trouvent parce que c’est là qu’ils se trouvaient dans le sperme et l’ovule à partir desquels vous avez été conçu.

Les Langley et leurs coauteurs ont pu comparer les séquences de centromères du nouveau génome de référence avec d’autres séquences publiées, fournissant la preuve que les centromères humains peuvent en fait se déplacer un peu. Cela a été trouvé dans d’autres espèces animales.

« Maintenant, nous serons mieux en mesure de comprendre comment ces choses se produisent », a déclaré Langley.

Applications

La possession de la séquence originale du génome humain a été un puissant outil de découverte dans les sciences biomédicales au cours des 20 dernières années. La nouvelle référence aidera les chercheurs à mieux comprendre les variations, en particulier dans les domaines qui n’étaient pas bien couverts auparavant ou avec des erreurs et des artefacts, a déclaré Dennis.

« Il est déjà utilisé pour réanalyser les génomes collectés par le projet 1000 Genomes, découvrant et vérifiant des milliers de nouvelles variantes », a-t-elle déclaré. Le projet 1000 Genomes est une collaboration internationale visant à créer un catalogue de la variation génétique humaine.

Ces nouvelles variantes génétiques confirmées peuvent ensuite, par exemple, être associées à des états pathologiques et à des résultats cliniques en utilisant des données de séquençage de patients, tels que des personnes autistes, a déclaré Dennis.

Le consortium T2T comprend 114 scientifiques dans 33 institutions et est coprésidé par Adam Phillippy, NHGRI et Karen Miga, UC Santa Cruz.

Plus d’information:
Sergey Aganezov et al, Un génome de référence complet améliore l’analyse de la variation génétique humaine, La science (2022). DOI : 10.1126/science.abl3533. www.science.org/doi/10.1126/science.abl3533

ph-tech