Un nouvel outil d’IA capture le comportement des protéines dans leur contexte

Un poisson sur terre agite toujours ses nageoires, mais les résultats sont nettement différents lorsque ce poisson est dans l’eau. Attribué Pour le célèbre informaticien Alan Kay, l’analogie est utilisée pour illustrer le pouvoir du contexte pour éclairer les questions étudiées.

Pour la première fois dans le domaine de l’intelligence artificielle (IA), un outil appelé PINNACLE incarne la vision de Kay en matière de compréhension du comportement des protéines dans leur contexte propre, tel que déterminé par les tissus et les cellules dans lesquels ces protéines agissent et avec lesquels elles interagissent. Notamment, PINNACLE surmonte certaines des limites des modèles d’IA actuels, qui ont tendance à analyser le fonctionnement et le dysfonctionnement des protéines, mais le font de manière isolée, un type de cellule et de tissu à la fois.

Le développement du nouveau modèle d’IA, décrit dans Méthodes de la naturea été menée par des chercheurs de la faculté de médecine de Harvard.

« Le monde naturel est interconnecté et PINNACLE permet d’identifier ces liens, que nous pouvons utiliser pour acquérir des connaissances plus détaillées sur les protéines et des médicaments plus sûrs et plus efficaces », a déclaré l’auteur principal de l’étude, Marinka Zitnik, professeur adjoint d’informatique biomédicale à l’Institut Blavatnik de HMS. « Il surmonte les limites des modèles actuels, sans contexte, et suggère la direction future pour améliorer les analyses des interactions protéiques. »

Cette avancée, notent les chercheurs, pourrait faire progresser la compréhension actuelle du rôle des protéines dans la santé et la maladie et éclairer de nouvelles cibles médicamenteuses pour concevoir des thérapies plus précises et mieux adaptées.

PINNACLE est disponible gratuitement aux scientifiques du monde entier.

Un grand pas en avant

Il est difficile de démêler les interactions entre les protéines et les effets de leurs voisins biologiques contigus. Les outils d’analyse actuels jouent un rôle crucial en fournissant des informations sur les propriétés structurelles et les formes des protéines individuelles. Ces outils ne sont cependant pas conçus pour aborder les nuances contextuelles de l’environnement protéique global. Au lieu de cela, ils produisent des représentations protéiques qui sont indépendantes du contexte, ce qui signifie qu’elles manquent d’informations contextuelles sur le type de cellule et le type de tissu.

Les protéines jouent cependant des rôles différents selon le contexte cellulaire et tissulaire dans lequel elles évoluent, et également selon que le tissu ou la cellule est sain ou malade. Les modèles de représentation d’une seule protéine ne peuvent pas identifier les fonctions des protéines qui varient selon la multitude de contextes.

En ce qui concerne le comportement des protéines, c’est l’emplacement, l’emplacement, l’emplacement

Composées de vingt acides aminés différents, les protéines constituent les éléments constitutifs des cellules et des tissus et sont indispensables à toute une gamme de fonctions biologiques essentielles à la vie, du transport de l’oxygène dans tout le corps à la contraction des muscles pour respirer et marcher, en passant par la digestion et la lutte contre les infections, entre autres.

Les scientifiques estiment que le nombre de protéines dans le corps humain varie entre 20 000 et des centaines de milliers.

Les protéines interagissent entre elles mais aussi avec d’autres molécules, telles que l’ADN et l’ARN.

L’interaction complexe entre les protéines et entre elles crée des réseaux complexes d’interactions protéiques. Situés dans et parmi d’autres cellules, ces réseaux s’engagent dans de nombreuses interactions complexes avec d’autres protéines et réseaux protéiques.

L’avantage de PINNACLE réside dans sa capacité à reconnaître que le comportement des protéines peut varier selon la cellule et le type de tissu. La même protéine peut avoir une fonction différente dans une cellule pulmonaire saine, dans une cellule rénale saine ou dans une cellule du côlon malade.

PINNACLE met en lumière la manière dont ces cellules et tissus influencent différemment les mêmes protéines, ce qui n’est pas possible avec les modèles actuels. En fonction du type de cellule spécifique dans lequel réside un réseau de protéines, PINNACLE peut déterminer quelles protéines participent à certaines conversations et lesquelles restent silencieuses. Cela permet à PINNACLE de mieux décoder le dialogue entre les protéines et le type de comportement et, en fin de compte, de prédire des cibles médicamenteuses étroitement adaptées aux protéines défectueuses qui donnent lieu à des maladies.

PINNACLE ne remplace pas mais complète les modèles à représentation unique, ont noté les chercheurs, dans la mesure où il peut analyser les interactions protéiques dans divers contextes cellulaires.

Ainsi, PINNACLE pourrait permettre aux chercheurs de mieux comprendre et prédire la fonction des protéines et aider à élucider les processus cellulaires vitaux et les mécanismes des maladies.

Cette capacité peut aider à identifier les protéines « médicamenteuses » qui serviront de cibles à des médicaments particuliers, ainsi qu’à prévoir les effets de divers médicaments sur différents types de cellules. Pour cette raison, PINNACLE pourrait devenir un outil précieux pour les scientifiques et les développeurs de médicaments, leur permettant de cibler des cibles potentielles beaucoup plus efficacement.

Une telle optimisation du processus de découverte de médicaments est absolument nécessaire, a déclaré Zitnik, qui est également membre associé du corps professoral de l’Institut Kempner pour l’étude de l’intelligence naturelle et artificielle de l’Université Harvard.

Il faut parfois 10 à 15 ans et cela peut coûter jusqu’à un milliard de dollars pour mettre un nouveau médicament sur le marché. Le chemin entre la découverte et le médicament est notoirement cahoteux et le résultat final est souvent imprévisible. près de 90 pour cent des candidats médicaments ne devenez pas des médicaments.

Bâtir et former PINNACLE

En utilisant des données sur les cellules humaines provenant d’un atlas multiorganique complet, combinées à de multiples réseaux d’interactions protéine-protéine, d’interactions entre types de cellules et de tissus, les chercheurs ont formé PINNACLE pour produire des représentations graphiques panoramiques de protéines englobant 156 types de cellules et 62 tissus et organes.

PINNACLE a généré à ce jour près de 395 000 représentations multidimensionnelles, contre environ 22 000 représentations possibles dans les modèles monoprotéiques actuels. Chacun de ses 156 types de cellules comprend des réseaux d’interactions protéiques riches en contexte d’environ 2 500 protéines.

Les nombres actuels de types de cellules, de tissus et d’organes ne constituent pas les limites supérieures du modèle. Les types de cellules évalués à ce jour proviennent de donneurs humains vivants et couvrent la plupart, mais pas tous, des types de cellules du corps humain. De plus, de nombreux types de cellules n’ont pas encore été identifiés, tandis que d’autres sont rares ou difficiles à sonder, comme les neurones du cerveau.

Pour diversifier le répertoire cellulaire de PINNACLE, Zitnik prévoit d’utiliser une plateforme de données comprenant des dizaines de millions de cellules échantillonnées sur l’ensemble du corps humain.

Plus d’informations :
Michelle M. Li et al., Modèles d’IA contextuels pour la biologie des protéines unicellulaires, Méthodes de la nature (2024). DOI : 10.1038/s41592-024-02341-3

Fourni par la Harvard Medical School

ph-tech