C’était comme une carte de New York où il manquait tout Manhattan. Le génome de référence humain a enfin tous ses espaces vides remplis, et voir tout ce que nous avons manqué la première fois est à la fois répétitif et éclairant.
« Nous réalisons qu’il existe de nombreuses variations humaines », déclare la généticienne Rachel O’Neill, directrice de l’Institut de génomique des systèmes d’UConn. Et dans un coup du sort contre-intuitif, la variation vient en grande partie des répétitions.
Une quantité importante de matériel génétique humain s’avère être de longues sections répétitives qui se produisent encore et encore. Bien que chaque être humain ait des répétitions, tout le monde n’en a pas le même nombre. Et la différence dans le nombre de répétitions est l’endroit où se trouve la plupart des variations génétiques humaines.
Cette idée – que les répétitions sont importantes – est l’une des nombreuses découvertes importantes du projet Telomere-2-Telomer (T2T), une collaboration mondiale d’institutions qui ont rempli les sections manquantes de l’assemblage original du génome humain. O’Neill est chercheur principal sur ce projet et auteur de quatre des six articles T2T publiés dans La science le 31 mars.
« Il a fallu l’invention de nouvelles méthodes de séquençage de l’ADN et d’analyse informatique, et le dévouement d’une équipe de scientifiques remarquables, pour compléter la lecture des 8 % du génome humain dont la structure était trop complexe et répétitive pour être résolue 20 Cela valait la peine d’attendre – un riche éventail de caractéristiques architecturales surprenantes est révélé, avec des conséquences majeures pour la compréhension de l’évolution humaine, de la variation et de la fonction biologique », a déclaré Francis Collins, conseiller scientifique de la Maison Blanche et ancien directeur des National Institutes of Santé.
Aussi étonnant qu’il était à l’époque, le projet original du génome humain a laissé environ 8 % du génome vierge.
« C’est l’équivalent d’un chromosome entier dans l’ADN humain », explique O’Neill. Ce dernier 8% comprend de nombreux gènes et des zones répétitives. La plupart des séquences d’ADN nouvellement ajoutées se trouvaient à proximité des télomères répétitifs (extrémités longues et arrière de chaque chromosome) et des centromères (sections médianes denses de chaque chromosome).
Les blancs étaient le résultat de la technologie « à lecture courte » utilisée par le projet du génome humain. C’était la seule technologie de cartographie du génome disponible il y a 20 ans, et elle ne pouvait lire que l’équivalent de quelques mots du code génétique à la fois. Par exemple, imaginez qu’une section du génome se compose de la phrase « Tout travail et pas de jeu fait de Jack un garçon ennuyeux », répétée neuf fois de suite. La technologie de lecture courte n’en révélerait que des morceaux tels que « All work », « Jack a », « makes Jack », et cetera. Les chercheurs ont reconstitué ces courtes sections pour former la phrase « Tout travail et aucun jeu fait de Jack un garçon ennuyeux », mais ils n’avaient aucun moyen de savoir qu’elle avait été répétée neuf fois.
Le projet T2T disposait cependant de meilleurs outils. La nouvelle technologie ADN à lecture longue peut lire des phrases entières, même des paragraphes, à la fois. Ainsi, les chercheurs ont pu voir de gros morceaux, voire des sections complètes, de répétitions.
« Générer une séquence véritablement sans lacunes du génome humain est une étape majeure. Nous aurions aimé le faire il y a 20 ans, mais la technologie devait progresser. Cette nouvelle référence est une base vraiment solide, sans fissures, sur laquelle comprendre biologie humaine. Il n’y a pas de pièces manquantes ! » dit Bob Waterston, biologiste à l’Université de Washington qui a travaillé sur le projet original du génome humain.
De nombreux chercheurs et stagiaires en début de carrière ont joué un rôle central dans le projet T2T. À UConn, Savannah Hoyt, Gabrielle Hartley et Patrick Grady dans le laboratoire de Rachel O’Neill, et Luke Wojenski dans le laboratoire de Leighton Core, ont été profondément impliqués dans le travail. L’une de leurs principales contributions a été l’élaboration d’un recueil des répétitions du génome. Ils ont découvert que les sections répétitives contenaient des éléments mobiles, qui sont des sections capables de sauter d’une partie du génome à l’autre (l’exemple classique est le saut de gènes qui entraîne des changements de couleur dans les grains de maïs, comme du rouge au blanc) ; virus; et de nouvelles répétitions que personne n’avait identifiées auparavant, y compris certaines porteuses de gènes. Certaines des répétitions géantes avec 10, 20 ou 30 copies se répètent dos à dos et contiennent des gènes qui pourraient représenter une grande partie de la diversité humaine. Dans l’exemple de phrase précédent, imaginez que « Jack » est un gène. Une personne peut en avoir 5 exemplaires. Un autre pourrait en avoir 25.
L’équipe T2T a eu le premier aperçu des séquences complètes des parties centrales de chaque chromosome humain. Appelés centromères, ils joignent ensemble les différents bras de chaque chromosome en forme de X. L’équipe d’O’Neill a découvert que les centromères contiennent des éléments mobiles connus ainsi que de nouvelles répétitions. Une grande partie de l’ADN dans le centromère semble être importante pour maintenir l’information génétique d’une cellule à travers les générations. Les centromères sont déjà connus pour jouer un rôle dans la réplication de l’ADN lorsque les cellules se reproduisent, et s’ils modifient leur position dans le chromosome de manière significative, ils peuvent donner naissance à des espèces entièrement nouvelles. Les séquences de centromères complètes et sans lacunes construites par le projet T2T permettront une compréhension beaucoup plus nuancée des centromères humains et de ce qu’ils font. Les prochaines étapes de la recherche en génétique humaine peuvent utiliser l’assemblage complet du génome T2T comme point de départ pour identifier les zones intéressantes de notre ADN.
« La prochaine phase de la recherche séquencera les génomes de nombreuses personnes différentes pour saisir pleinement la diversité humaine, les maladies et notre relation avec nos parents les plus proches, les autres primates », a déclaré O’Neill.
Savannah J. Hoyt et al, Du télomère au télomère : l’état transcriptionnel et épigénétique des éléments répétés humains, La science (2022). DOI : 10.1126/science.abk3112. www.science.org/doi/10.1126/science.abk3112