L’apprentissage automatique a résolu le problème du repliement des protéines et a remporté le prix Nobel de chimie 2024

Le prix Nobel de chimie 2024 reconnu Demis Hassabis, John Jumper et David Boulanger pour avoir utilisé l’apprentissage automatique pour relever l’un des plus grands défis de la biologie : prédire la forme 3D des protéines et les concevoir à partir de zéro.

Le prix de cette année se démarque car il récompense la recherche issue d’une entreprise technologique : DeepMind, une start-up de recherche en IA rachetée par Google en 2014. La plupart des précédents prix Nobel de chimie ont été attribués à des chercheurs universitaires. De nombreux lauréats ont ensuite créé des startups pour développer et commercialiser davantage leur travail révolutionnaire. Technologie d’édition génétique CRISPR et points quantiques… mais la recherche, du début à la fin, n’a pas été effectuée dans le domaine commercial.

Bien que les prix Nobel de physique et de chimie soient décernés séparément, il existe un lien fascinant entre les recherches lauréates dans ces domaines en 2024. Le prix de physique est allé voir deux informaticiens qui a jeté les bases de l’apprentissage automatique, tandis que les lauréats de chimie ont été récompensés pour leur utilisation de l’apprentissage automatique pour résoudre l’un des plus grands mystères de la biologie : comment les protéines se replient.

Les prix Nobel 2024 soulignent à la fois l’importance de ce type d’intelligence artificielle et la manière dont la science actuelle dépasse souvent les frontières traditionnelles, mélangeant différents domaines pour obtenir des résultats révolutionnaires.

Le défi du repliement des protéines

Les protéines sont les machines moléculaires de la vie. Ils constituent une partie importante de notre corps, notamment les muscles, les enzymes, les hormones, le sang, les cheveux et le cartilage.

Comprendre la structure des protéines est essentiel car leurs formes déterminent leurs fonctions. En 1972, Christian Anfinsen a remporté le prix Nobel en chimie pour avoir montré que la séquence des éléments constitutifs des acides aminés d’une protéine dicte la forme de la protéinece qui, à son tour, influence sa fonction. Si une protéine ne se replie pas correctement, elle peut ne pas fonctionner correctement et entraîner des maladies telles que Alzheimer, fibrose kystique ou diabète.

La forme globale d’une protéine dépend des minuscules interactions, des attractions et des répulsions, entre tous les atomes des acides aminés qui la composent. Certains veulent être ensemble, d’autres non. La protéine se tord et se replie pour prendre une forme finale basée sur plusieurs milliers de ces interactions chimiques.

Pendant des décennies, l’un des plus grands défis de la biologie consistait à prédire la forme d’une protéine en se basant uniquement sur sa séquence d’acides aminés. Bien que les chercheurs puissent désormais prédire la forme, nous ne comprenons toujours pas comment les protéines adoptent leur forme spécifique et minimisent les répulsions de toutes les interactions interatomiques en quelques microsecondes.

Pour comprendre le fonctionnement des protéines et éviter un mauvais repliement, les scientifiques avaient besoin d’un moyen de prédire la manière dont les protéines se replient, mais résoudre ce casse-tête n’a pas été une tâche facile.

En 2003, biochimiste de l’Université de Washington David Boulanger a écrit Rosetteun programme informatique pour concevoir des protéines. Grâce à cela, il a montré qu’il était possible d’inverser le problème du repliement des protéines en concevoir une forme de protéine puis prédire la séquence d’acides aminés nécessaire à sa création.

C’était un bond en avant phénoménal, mais la forme choisie pour le calcul était simple et les calculs étaient complexes. Un changement de paradigme majeur était nécessaire pour concevoir régulièrement de nouvelles protéines dotées des structures souhaitées.

Une nouvelle ère d’apprentissage automatique

L’apprentissage automatique est un type d’IA dans lequel les ordinateurs apprennent à résoudre des problèmes en analysant de grandes quantités de données. Il a été utilisé dans divers domaines, de jouer au jeu et reconnaissance vocale à véhicules autonomes et recherche scientifique. L’idée derrière l’apprentissage automatique est d’utiliser des modèles cachés dans les données pour répondre à des questions complexes.

Cette approche a fait un grand pas en avant en 2010 lorsque Demis Hassabis a co-fondé Esprit profondune entreprise visant à combiner les neurosciences et l’IA pour résoudre des problèmes du monde réel.

Hassabis, un prodige des échecs à l’âge de 4 ans, a rapidement fait la une des journaux avec AlphaZéroune IA qui a appris toute seule à jouer aux échecs à un niveau surhumain. En 2017, AlphaZero a largement battu le meilleur programme d’échecs informatique au monde, Stockfish-8. La capacité de l’IA à apprendre de son propre gameplay, plutôt que de s’appuyer sur des stratégies préprogrammées, a marqué un tournant dans le monde de l’IA.

Peu de temps après, DeepMind a appliqué des techniques similaires à Go, un ancien jeu de société connu pour son immense complexité. En 2016, son programme IA AlphaGo a battu l’un des meilleurs joueurs du monde, Lee Sedol, dans un match très regardé qui a stupéfié des millions de personnes.

En 2016, Hassabis a réorienté l’attention de DeepMind vers un nouveau défi : le problème du repliement des protéines. Sous la direction de John Jumperchimiste avec une formation en science des protéines, le projet AlphaFold a débuté. L’équipe a utilisé une vaste base de données de structures protéiques déterminées expérimentalement pour former l’IA, ce qui lui a permis d’apprendre les principes du repliement des protéines. Le résultat fut AlphaFold2, une IA capable de prédire la structure 3D des protéines à partir de leurs séquences d’acides aminés avec une précision remarquable.

Il s’agissait d’une avancée scientifique importante. AlphaFold a depuis prédit les structures de plus de 200 millions de protéines, soit essentiellement toutes les protéines que les scientifiques ont séquencées jusqu’à présent. Ce base de données massive de structures protéiques est désormais disponible gratuitement, accélérant la recherche en biologie, en médecine et en développement de médicaments.

Des protéines de synthèse pour lutter contre les maladies

Comprendre comment les protéines se replient et fonctionnent est crucial pour concevoir de nouveaux médicaments. Enzymesun type de protéine, agit comme catalyseur dans les réactions biochimiques et peut accélérer ou réguler ces processus. Pour traiter des maladies telles que le cancer ou le diabète, les chercheurs ciblent souvent des enzymes spécifiques impliquées dans le cheminement de la maladie. En prédisant la forme d’une protéine, les scientifiques peuvent déterminer où de petites molécules – des candidats médicaments potentiels – pourraient s’y lier, ce qui constitue la première étape dans la conception de nouveaux médicaments.

En 2024, DeepMind a lancé AlphaFold3une version améliorée du programme AlphaFold qui non seulement prédit les formes des protéines, mais identifie également les sites de liaison potentiels pour les petites molécules. Cette avancée permet aux chercheurs de concevoir plus facilement des médicaments ciblant précisément les bonnes protéines.

Google a racheté Deepmind pour environ un demi-milliard de dollars en 2014. Google DeepMind a maintenant lancé une nouvelle entreprise, Laboratoires isomorphespour collaborer avec des sociétés pharmaceutiques sur le développement de médicaments dans le monde réel à l’aide de ces prédictions AlphaFold3.

Pour sa part, David Baker a continué d’apporter d’importantes contributions à la science des protéines. Son équipe de l’Université de Washington a développé une méthode basée sur l’IA appelée « hallucination familiale« , qu’ils ont utilisé pour concevoir de toutes nouvelles protéines à partir de zéro. Les hallucinations sont de nouveaux modèles – dans ce cas, des protéines – qui sont plausibles, ce qui signifie qu’ils correspondent bien aux modèles des données d’entraînement de l’IA. Ces nouvelles protéines comprenaient un émetteur de lumière. enzyme, démontrant que l’apprentissage automatique peut aider à créer de nouvelles protéines synthétiques. Ces outils d’IA offrent de nouvelles façons de concevoir des enzymes fonctionnelles et d’autres protéines qui n’auraient jamais pu évoluer naturellement.

L’IA permettra d’ouvrir le prochain chapitre de la recherche

Les réalisations dignes d’un prix Nobel de Hassabis, Jumper et Baker montrent que l’apprentissage automatique n’est pas seulement un outil destiné aux informaticiens : il constitue désormais un élément essentiel de l’avenir de la biologie et de la médecine.

En s’attaquant à l’un des problèmes les plus difficiles de la biologie, les lauréats du prix 2024 ont ouvert de nouvelles possibilités dans la découverte de médicaments, la médecine personnalisée et même notre compréhension de la chimie de la vie elle-même.

Fourni par La conversation

Cet article est republié à partir de La conversation sous licence Creative Commons. Lire le article original.

ph-tech