L’IA et la modélisation biophysique s’unissent pour une nouvelle conception de protéines

Une équipe de recherche interdisciplinaire de l’Université de Leipzig et du Saxon AI Center Scads.ai a développé une nouvelle approche qui intègre des méthodes d’intelligence artificielle (IA) avec la modélisation biophysique. Cette stratégie innovante peut être appliquée au développement de nouvelles thérapies, telles que les anticorps et les vaccins, y compris ceux de la préparation pandémique.

Le projet de recherche, réalisé en collaboration avec l’Université Vanderbilt à Nashville, États-Unis, est le résultat d’un travail préliminaire approfondi dans le développement de médicaments assisté par ordinateur. L’étude a été publié dans la revue Avancées scientifiques.

Les scientifiques pensent que le paysage de recherche actuel dans le domaine de la conception de protéines informatiques s’apparente à une ruée vers l’or, de nombreuses nouvelles méthodes en cours de publication sans validation expérimentale. Cela conduit souvent à des évaluations inexactes des performances des modèles d’IA.

« Nous avons besoin d’urgence de normes pour la description et la disponibilité de ces modèles », explique le professeur Clara Schoeder, chef de groupe de recherche à l’Institute for Drug Discovery. « Nos recherches apportent une contribution importante à cet objectif. »

Les résultats actuels montrent que les méthodes d’IA sont particulièrement bonnes pour suggérer des séquences qui ne perturbent pas le repliement des protéines. Cependant, ils ont du mal à évaluer avec précision les effets des changements d’acides aminés individuels sur le pliage.

« Nos résultats indiquent clairement qu’aucun modèle d’IA ou méthode biophysique n’est idéalement adapté à tous les problèmes de conception », explique le professeur de Humboldt, Jens Meiler, l’un des principaux scientifiques du projet et directeur de l’Institut de découverte de médicaments.

« À l’avenir, nous devrons examiner attentivement le modèle à utiliser à quel point. Notre travail est une première étape vers une plus grande comparabilité entre les différentes méthodes. »

La suite logicielle Biophysical Rosetta, qui est utilisée dans la recherche sur les protéines depuis de nombreuses années, fournit un cadre pour intégrer différentes méthodes d’IA.

Rosetta est utilisée par plus de 100 laboratoires dans le monde et permet aux chercheurs de combiner efficacement différentes approches, telles que les modèles de gros langage (par exemple ESM-2) et le modèle protéinMPNN, avec des méthodes biophysiques. Cette combinaison permet aux chercheurs de comparer et d’analyser les différents comportements des approches de conception.

« Avec ce développement, nous pouvons combiner rapidement et facilement des modèles d’IA avec des méthodes classiques et les utiliser côte à côte », explique le professeur Meiler.

« Cela simplifie considérablement notre travail et nous permet de profiter pleinement de toutes les infrastructures qui ont été développées à Rosetta au cours des 20 dernières années. »

Cela ne signifie pas que le projet de recherche est terminé. Les groupes de recherche dirigés par le professeur Meiler et le professeur Schoeder continueront à affiner et à évaluer expérimentalement les algorithmes développés, en particulier en ce qui concerne la conception des vaccins pour la préparation pandémique.

« Nous étudions quelles méthodes suggèrent de manière fiable des changements d’acides aminés qui pourraient conduire à des candidats vaccinaux », explique le professeur Clara Schoeder.

Malgré les progrès réalisés grâce à l’utilisation de l’IA, le soi-disant problème de notation reste un défi. Cela fait référence à la difficulté de prédire l’effet d’une seule substitution d’acides aminés.

En collaboration avec le Center for Scolable Data Analytics and Artificial Intelligence, SCADS.AI, l’équipe de recherche est optimiste que la combinaison de l’IA et des méthodes biophysiques augmentera l’efficacité de la conception des protéines.

Plus d’informations:
Moritz Ertelt et al, les méthodes d’apprentissage automatique auto-supervisées pour la conception des protéines améliorent l’échantillonnage mais pas l’identification des variantes de haute augmentation, Avancées scientifiques (2025). Doi: 10.1126 / sciadv.adr7338

Fourni par l’Université de Leipzig

ph-tech