Oui, les scientifiques ont séquencé l’intégralité du génome humain, mais ils n’ont pas encore terminé

Le génome humain a été séquencé de bout en bout, ce qui signifie que les scientifiques du monde entier ont identifié la plupart des quelque 20 000 gènes codant pour les protéines. Cependant, un groupe international de scientifiques note qu’il y a encore du travail à faire. Les scientifiques soulignent que même si nous avons presque convergé sur l’identité des 20 000 gènes, les gènes peuvent être coupés et épissés pour créer environ 100 000 protéines, et les experts en génétique sont loin d’être d’accord sur la nature de ces 100 000 protéines.

Le groupe, qui s’est réuni l’automne dernier au Cold Spring Harbor Laboratory à New York, a maintenant publié un guide pour prioriser les prochaines étapes dans l’effort visant à compléter le « catalogue » des gènes humains.

« De nombreux scientifiques ont travaillé sur des efforts visant à comprendre pleinement le génome humain, et c’est beaucoup plus difficile et complexe que nous le pensions », déclare Steven Salzberg, Ph.D., professeur émérite Bloomberg de génie biomédical, d’informatique et de biostatistiques à l’Université Bloomberg. Université Johns Hopkins. « Nous avons fourni un état du catalogue des gènes humains et un guide sur ce qui est nécessaire pour le compléter. »

Salzberg, avec l’ingénieur biomédical de Johns Hopkins et professeur agrégé Mihaela Pertea, Ph.D., MS, MSE, le chercheur postdoctoral Ales Varabyou et 19 autres scientifiques, ont offert leurs perspectives sur le catalogue des gènes humains le 4 octobre dans la revue Nature.

Les scientifiques affirment que même si la liste finale des gènes codant pour les protéines est presque complète, les scientifiques n’ont pas encore entièrement catalogué les diverses façons dont un gène peut être coupé ou épissé, ce qui donne lieu à des « isoformes » de protéines légèrement différentes. Certaines isoformes de protéines n’affecteront pas la fonction de la protéine, mais d’autres peuvent être suffisamment différentes pour entraîner un risque accru de développer un trait, une affection ou une maladie particulière.

Pour compléter le catalogue, les scientifiques proposent un aperçu complet de la manière dont chaque gène est exprimé en protéines fonctionnelles et non fonctionnelles et de la forme tridimensionnelle de ces protéines.

Les scientifiques proposent également de se concentrer sur le catalogage des gènes d’ARN non codants. L’ARN est le matériel génétique qui est transcrit par l’ADN et suit un chemin moléculaire pour fabriquer des protéines. Au lieu de protéines, les gènes d’ARN non codants codent pour d’autres types de matériel moléculaire qui remplit une fonction cellulaire.

Enfin, le groupe international souligne l’importance d’améliorer les bases de données couramment utilisées sur les variations génétiques qui causent des maladies, d’améliorer les normes des laboratoires cliniques pour annoter les résultats du séquençage de l’ADN et de développer de nouvelles technologies pour permettre des méthodes plus efficaces et plus précises pour faire correspondre le large éventail de protéines avec leurs produits génétiques.

Plus d’information:
Paulo Amaral et al, L’état du catalogue de gènes humains, Nature (2023). DOI : 10.1038/s41586-023-06490-x

Fourni par la faculté de médecine de l’Université Johns Hopkins

ph-tech