Des chercheurs enseignent à l’intelligence artificielle la frustration liée au repliement des protéines

Des scientifiques ont découvert une nouvelle façon de prédire la façon dont les protéines changent de forme lorsqu’elles fonctionnent, ce qui est important pour comprendre leur fonctionnement dans les systèmes vivants. Si les récentes technologies d’intelligence artificielle (IA) ont permis de prédire à quoi ressemblent les protéines au repos, il reste difficile de comprendre comment elles se déplacent, car il n’existe pas suffisamment de données directes issues d’expériences sur les mouvements des protéines pour entraîner les réseaux neuronaux.

Dans une nouvelle étude publié dans le Actes de l’Académie nationale des sciencesPeter Wolynes, de l’Université Rice, et ses collègues en Chine ont combiné des informations sur les paysages énergétiques des protéines avec des techniques d’apprentissage profond pour prédire ces mouvements.

Leur méthode améliore AlphaFold2 (AF2), un outil qui prédit les structures statiques des protéines en lui apprenant à se concentrer sur la « frustration énergétique ». Les protéines ont évolué pour minimiser les conflits énergétiques entre leurs parties, afin qu’elles puissent être canalisées vers leur structure statique. Lorsque les conflits persistent, on dit qu’il y a frustration.

« À partir des structures statiques prédites de l’état fondamental, la nouvelle méthode génère des structures et des voies alternatives pour les mouvements des protéines en trouvant d’abord puis en améliorant progressivement les caractéristiques de frustration énergétique dans les séquences d’alignement de séquences multiples d’entrée qui codent le développement évolutif de la protéine », a déclaré Wolynes, professeur de sciences de la Fondation DR Bullard-Welch et co-auteur de l’étude.

Les chercheurs ont testé leur méthode sur la protéine adénylate kinase et ont découvert que ses mouvements prédits correspondaient aux données expérimentales. Ils ont également réussi à prédire les mouvements fonctionnels d’autres protéines qui changent de forme de manière significative.

« Prédire les structures tridimensionnelles et les mouvements des protéines est essentiel pour comprendre leurs fonctions et concevoir de nouveaux médicaments », a déclaré Wolynes.

L’étude a également examiné le fonctionnement de l’AF2, montrant que la combinaison de la connaissance physique du paysage énergétique avec l’IA permet non seulement de prédire comment les protéines se déplacent, mais explique également pourquoi l’IA surestime l’intégrité structurelle, conduisant uniquement aux structures les plus stables.

La théorie du paysage énergétique, sur laquelle Wolynes et ses collaborateurs ont travaillé au fil des décennies, est un élément clé de cette méthode, mais les codes d’IA récents ont été formés pour prédire uniquement les structures protéiques les plus stables et ignorer les différentes formes que les protéines peuvent prendre lorsqu’elles fonctionnent.

La théorie du paysage énergétique suggère que si l’évolution a sculpté le paysage énergétique des protéines là où elles peuvent se replier dans leurs structures optimales, les écarts par rapport à un paysage parfaitement canalisé qui guide autrement le repliement, appelé frustration locale, sont essentiels aux mouvements fonctionnels des protéines.

En identifiant ces régions frustrées, les chercheurs ont appris à l’IA à ignorer ces régions pour guider ses prédictions, permettant ainsi au code de prédire avec précision des structures protéiques alternatives et des mouvements fonctionnels.

À l’aide d’un outil d’analyse de frustration développé dans le cadre du paysage énergétique, les chercheurs ont identifié des régions frustrées et donc flexibles dans les protéines.

Ensuite, en manipulant les informations évolutives dans les séquences de familles de protéines alignées utilisées par AlphaFold et conformément aux scores de frustration, les chercheurs ont appris à l’IA à reconnaître ces régions frustrées, permettant des prédictions précises de structures et de voies alternatives entre elles, a déclaré Wolynes.

« Cette recherche souligne l’importance de ne pas oublier ou abandonner les méthodes basées sur la physique dans l’ère post-AlphaFold, où l’accent a été mis sur l’apprentissage agnostique à partir de données expérimentales sans aucun apport théorique », a déclaré Wolynes. « L’intégration de l’IA aux connaissances biophysiques aura un impact significatif sur les applications pratiques futures, notamment la conception de médicaments, l’ingénierie enzymatique et la compréhension des mécanismes des maladies. »

Parmi les autres auteurs figurent Xingyue Guana, Wei Wanga et Wenfei Lia du Département de physique de l’Université de Nanjing ; Qian-Yuan Tang du Département de physique de l’Université baptiste de Hong Kong ; Weitong Ren du Laboratoire clé de biophysique de Wenzhou de l’Université de l’Académie chinoise des sciences ; et Mingchen Chen du Laboratoire de Changping à Pékin.

Plus d’informations :
Xingyue Guan et al, Prédiction des mouvements conformationnels des protéines à l’aide de l’analyse de frustration énergétique et d’AlphaFold2, Actes de l’Académie nationale des sciences (2024). DOI: 10.1073/pnas.2410662121

Fourni par l’Université Rice

ph-tech