Un outil d’IA prédit la fonction de protéines inconnues

Un nouvel outil d’intelligence artificielle (IA) qui tire des conclusions logiques sur la fonction de protéines inconnues promet d’aider les scientifiques à comprendre le fonctionnement interne de la cellule.

Développé par Maxat Kulmanov, chercheur en bioinformatique à KAUST, et ses collègues, l’outil surpasse les méthodes analytiques existantes pour prévoir les fonctions des protéines et est même capable d’analyser des protéines sans correspondance claire dans les ensembles de données existants.

La recherche apparaît dans Intelligence des machines naturelles.

Le modèle, appelé DeepGO-SE, tire parti de grands modèles de langage similaires à ceux utilisés par les outils d’IA générative tels que Chat-GPT. Il utilise ensuite l’implication logique pour tirer des conclusions significatives sur les fonctions moléculaires, basées sur des principes biologiques généraux sur le fonctionnement des protéines.

Il permet essentiellement aux ordinateurs de traiter logiquement les résultats en construisant des modèles d’une partie du monde – dans ce cas, la fonction des protéines – et en déduisant le scénario le plus plausible basé sur le bon sens et le raisonnement sur ce qui devrait se produire dans ces modèles mondiaux.

« Cette méthode a de nombreuses applications », explique Robert Hoehndorf, responsable du groupe de recherche en bio-ontologie KAUST, qui a supervisé ces recherches, « notamment lorsqu’il est nécessaire de raisonner sur des données et des hypothèses générées par un réseau neuronal ou un autre modèle d’apprentissage automatique. « 

Kulmanov et Hoehndorf ont collaboré avec Stefan Arold de KAUST, ainsi qu’avec des chercheurs de l’Institut suisse de bioinformatique, pour évaluer la capacité du modèle à déchiffrer les fonctions de protéines dont le rôle dans l’organisme est inconnu.

L’outil a utilisé avec succès des données concernant la séquence d’acides aminés d’une protéine mal comprise et ses interactions connues avec d’autres protéines et a prédit avec précision ses fonctions moléculaires. Le modèle était si précis que DeepGO-SE a été classé parmi les 20 premiers sur plus de 1 600 algorithmes lors d’un concours international d’outils de prédiction de fonctions.

L’équipe KAUST utilise désormais cet outil pour étudier les fonctions de protéines énigmatiques découvertes dans les plantes qui prospèrent dans l’environnement extrême du désert d’Arabie saoudite. Ils espèrent que les résultats seront utiles pour identifier de nouvelles protéines destinées à des applications biotechnologiques et aimeraient que d’autres chercheurs adoptent cet outil.

Comme l’explique Kulmanov, « la capacité de DeepGO-SE à analyser des protéines non caractérisées peut faciliter des tâches telles que la découverte de médicaments, l’analyse des voies métaboliques, les associations de maladies, l’ingénierie des protéines, le dépistage de protéines d’intérêt spécifiques et bien plus encore. »

Plus d’information:
Prédiction de la fonction des protéines comme implication sémantique approximative, Intelligence des machines naturelles (2024). DOI : 10.1038/s42256-024-00795-w

Fourni par l’Université des sciences et technologies du roi Abdallah

ph-tech