Comprendre la structure des protéines est essentiel pour démystifier leurs fonctions et développer des médicaments qui les ciblent. À cette fin, une équipe de chercheurs de l’Université Brown a développé un moyen d’utiliser l’apprentissage automatique pour prédire rapidement plusieurs configurations protéiques afin de faire progresser la compréhension de la dynamique et des fonctions des protéines.
UN étude décrivant l’approche a été publié dans Communications naturelles le mercredi 27 mars.
Les auteurs affirment que la technique est précise, rapide, rentable et qu’elle a le potentiel de révolutionner la découverte de médicaments en découvrant beaucoup plus de cibles pour de nouveaux traitements.
Dans le traitement ciblé du cancer, par exemple, les traitements sont conçus pour cibler les protéines qui contrôlent la croissance, la division et la propagation des cellules cancéreuses. L’un des défis pour les biologistes structurels a été de comprendre suffisamment les protéines cellulaires pour identifier les cibles, a déclaré l’auteur de l’étude Gabriel Monteiro da Silva, titulaire d’un doctorat. candidat en biologie moléculaire, biologie cellulaire et biochimie à Brown.
Monteiro da Silva utilise des méthodes informatiques pour modéliser la dynamique des protéines et cherche des moyens d’améliorer les méthodes ou de trouver de nouvelles méthodes qui fonctionnent le mieux dans différentes situations. Pour cette étude, il s’est associé à Brenda Rubenstein, professeure agrégée de chimie et de physique, et à d’autres chercheurs de Brown pour expérimenter une méthode informatique existante basée sur l’IA appelée AlphaFold 2.
Alors que Monteiro da Silva a déclaré que la précision d’AlphaFold 2 a révolutionné la prédiction de la structure des protéines, la méthode a des limites : elle permet aux scientifiques de modéliser les protéines uniquement dans un état statique à un moment précis.
« Au cours de la plupart des processus cellulaires, les protéines changeront de forme de manière dynamique », a déclaré Monteiro da Silva.
« Afin de faire correspondre les cibles protéiques aux médicaments destinés à traiter le cancer et d’autres maladies, nous avons besoin d’une compréhension plus précise de ces changements physiologiques. Nous devons aller au-delà des formes 3D pour comprendre les formes 4D, la quatrième dimension étant le temps. C’est ce que nous avons fait. avec cette approche. »
Monteiro da Silva a utilisé l’analogie d’un cheval pour expliquer les modèles protéiques. La disposition des muscles et des membres du cheval crée des formes différentes selon que le cheval est debout ou au galop ; les molécules de protéines se conforment à différentes formes en raison des arrangements de liaison de leurs atomes constitutifs.
« Imaginez que la protéine soit un cheval », a déclaré Monteiro da Silva. Des méthodes antérieures étaient utilisées pour prédire un modèle de cheval debout. C’était précis, mais cela ne disait pas grand-chose sur le comportement du cheval ou sur son apparence lorsqu’il n’était pas debout.
Dans cette étude, les chercheurs ont pu manipuler les signaux évolutifs de la protéine pour utiliser AlphaFold 2 afin de prédire rapidement plusieurs conformations protéiques, ainsi que la fréquence à laquelle ces structures sont peuplées.
En utilisant l’analogie avec le cheval, la nouvelle méthode permet aux chercheurs de prédire rapidement plusieurs instantanés d’un cheval au galop, ce qui signifie qu’ils peuvent voir comment la structure musculaire du cheval changerait au fur et à mesure de ses mouvements, puis comparer ces différences structurelles.
« Si vous comprenez les multiples instantanés qui composent la dynamique de ce qui se passe avec la protéine, vous pouvez alors trouver de multiples façons différentes de cibler les protéines avec des médicaments et de traiter des maladies », a déclaré Rubenstein, dont les recherches se concentrent sur la structure électronique et la biophysique.
Rubenstein a expliqué que la protéine sur laquelle l’équipe s’est concentrée dans cette étude était celle pour laquelle différents médicaments ont été développés. Pourtant, pendant de nombreuses années, personne ne pouvait comprendre pourquoi certains médicaments réussissaient ou échouaient, a-t-elle déclaré.
« Tout se résumait au fait que ces protéines spécifiques ont de multiples conformations, ainsi qu’à la compréhension de la façon dont les médicaments se lient aux différentes conformations, au lieu de la structure statique unique que ces techniques prédisaient auparavant ; connaître l’ensemble des conformations était incroyablement Il est important de comprendre comment ces médicaments fonctionnent réellement dans le corps », a déclaré Rubenstein.
Accélérer le temps de découverte
Les chercheurs ont noté que les méthodes informatiques existantes sont coûteuses et chronophages.
« Ils sont chers en termes de matériaux, en termes d’infrastructure ; ils prennent beaucoup de temps, et vous ne pouvez pas vraiment faire ces calculs à haut débit. Je suis sûr que j’étais l’un des principaux utilisateurs. de GPU dans le cluster informatique de Brown », a déclaré Monteiro da Silva.
« À plus grande échelle, c’est un problème car il y a beaucoup à explorer dans le monde des protéines : comment la dynamique et la structure des protéines sont impliquées dans des maladies mal comprises, dans la résistance aux médicaments et dans les pathogènes émergents. »
Les chercheurs ont décrit comment Monteiro da Silva avait passé trois ans à utiliser la physique pour comprendre la dynamique et les conformations des protéines. Grâce à leur nouvelle approche basée sur l’IA, le temps de découverte a été réduit à quelques heures seulement.
« Vous pouvez donc imaginer quelle différence cela ferait dans la vie d’une personne : trois ans contre trois heures », a déclaré Rubenstein. « Et c’est pourquoi il était très important que la méthode que nous avons développée soit à haut débit et très efficace. »
En ce qui concerne les prochaines étapes, l’équipe de recherche affine son approche d’apprentissage automatique, la rendant plus précise, plus généralisable et plus utile pour une gamme d’applications.
Plus d’information:
Prédiction à haut débit des distributions conformationnelles des protéines avec AlphaFold2 sous-échantillonné, Communications naturelles (2024). DOI : 10.1038/s41467-024-46715-9