Des outils d’intelligence artificielle prédisent le rôle régulateur et la structure 3D de l’ADN

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Selon deux études récentes menées dans Génétique naturelle. Ces outils pourraient éventuellement jeter un nouvel éclairage sur la façon dont les mutations génétiques conduisent à la maladie et pourraient conduire à une nouvelle compréhension de la façon dont la séquence génétique influence l’organisation spatiale et la fonction de l’ADN chromosomique dans le noyau, a déclaré l’auteur de l’étude, Jian Zhou, Ph.D., professeur adjoint. au département de bioinformatique de Lyda Hill à l’UTSW.

« Pris ensemble, ces deux programmes fournissent une image plus complète de la façon dont les changements dans la séquence d’ADN, même dans les régions non codantes, peuvent avoir des effets dramatiques sur son organisation spatiale et sa fonction », a déclaré le Dr Zhou, membre du Harold C. Simmons Comprehensive. Cancer Center, boursier de la Fondation Lupe Murchison en recherche médicale et boursier du Cancer Prevention and Research Institute of Texas (CPRIT).

Seulement environ 1% de l’ADN humain code des instructions pour fabriquer des protéines. Les recherches des dernières décennies ont montré qu’une grande partie du matériel génétique non codant restant contient des éléments régulateurs – tels que des promoteurs, des amplificateurs, des silencieux et des isolants – qui contrôlent l’expression de l’ADN codant. Comment la séquence contrôle les fonctions de la plupart de ces éléments régulateurs n’est pas bien comprise, a expliqué le Dr Zhou.

Pour mieux comprendre ces composants réglementaires, lui et ses collègues de l’Université de Princeton et du Flatiron Institute ont développé un modèle d’apprentissage en profondeur qu’ils ont nommé Sei, qui trie avec précision ces extraits d’ADN non codant en 40 « classes de séquence » ou tâches, par exemple, en tant qu’amplificateur pour l’activité des gènes des cellules souches ou des cellules cérébrales. Ces 40 classes de séquences, développées à partir de près de 22 000 ensembles de données provenant d’études antérieures étudiant la régulation du génome, couvrent plus de 97 % du génome humain. De plus, Sei peut noter n’importe quelle séquence par son activité prédite dans chacune des 40 classes de séquences et prédire l’impact des mutations sur ces activités.

En appliquant Sei aux données génétiques humaines, les chercheurs ont pu caractériser l’architecture régulatrice de 47 traits et maladies enregistrés dans la base de données UK Biobank et expliquer comment les mutations dans les éléments régulateurs provoquent des pathologies spécifiques. De telles capacités peuvent aider à acquérir une compréhension plus systématique de la façon dont les changements de séquence génomique sont liés aux maladies et à d’autres traits. Les résultats ont été publiés ce mois-ci.

En mai, le Dr Zhou a signalé le développement d’un outil différent, appelé Orca, qui prédit l’architecture 3D de l’ADN dans les chromosomes en fonction de sa séquence. À l’aide d’ensembles de données existants de séquences d’ADN et de données structurelles dérivées d’études antérieures qui ont révélé les plis, les torsions et les virages de la molécule, le Dr Zhou a entraîné le modèle à établir des connexions et a évalué la capacité du modèle à prédire la structure à différentes échelles de longueur.

Les résultats ont montré qu’Orca prédisait les structures d’ADN petites et grandes en fonction de leurs séquences avec une grande précision, y compris pour les séquences portant des mutations associées à divers problèmes de santé, notamment une forme de leucémie et des malformations des membres. Orca a également permis aux chercheurs de générer de nouvelles hypothèses sur la manière dont la séquence d’ADN contrôle sa structure 3D locale et à grande échelle.

Le Dr Zhou a déclaré que lui et ses collègues prévoyaient d’utiliser Sei et Orca, qui sont tous deux accessibles au public sur des serveurs Web et sous forme de code open source, pour explorer davantage le rôle des mutations génétiques dans les manifestations moléculaires et physiques des maladies. cela pourrait éventuellement conduire à de nouvelles façons de traiter ces conditions.

Plus d’information:
Kathleen M. Chen et al, Une carte mondiale basée sur la séquence de l’activité régulatrice pour déchiffrer la génétique humaine, Génétique naturelle (2022). DOI : 10.1038/s41588-022-01102-2

Jian Zhou, Modélisation basée sur les séquences de l’architecture tridimensionnelle du génome de la kilobase à l’échelle chromosomique, Génétique naturelle (2022). DOI : 10.1038/s41588-022-01065-4

Fourni par UT Southwestern Medical Center

ph-tech