Comment l’intelligence artificielle peut améliorer la détection des protéines

Une equipe de recherche internationale cree des composes azotes jusque la

Les petites protéines jouent un rôle essentiel dans la régulation de la réponse immunitaire, de l’inflammation et des maladies neurodégénératives. Afin de mieux les détecter et les étudier, les scientifiques de l’Institut Max-Planck pour la science de la lumière ont combiné l’une des méthodes de microscopie les plus efficaces, appelée iSCAT, avec l’intelligence artificielle.

Les molécules biologiques telles que les protéines sont des constituants centraux de tous les systèmes vivants et dictent toutes les réactions physiologiques dans les conditions de santé et de maladie. En particulier, de nombreuses petites protéines jouent un rôle essentiel dans la régulation de la réponse immunitaire, de l’inflammation et des maladies neurodégénératives. Des méthodes de détection de protéines rapides et non invasives peuvent donc nous aider à créer des améliorations dans les domaines du diagnostic des maladies et du développement de médicaments.

Les méthodes traditionnelles de détection des protéines impliquent de marquer la protéine avec une étiquette fluorescente ou radioactive, afin de les suivre et de les détecter. Cependant, ces méthodes se sont avérées assez coûteuses et chronophages. Encore plus problématique est le fait que ces marqueurs peuvent altérer la fonction de la protéine étudiée, rendant les données recueillies peu fiables. Alors que l’intérêt scientifique pour les fonctions des protéines s’est accru ces dernières années, l’intérêt pour les méthodes de détection sans étiquette s’est également accru. L’une de ces méthodes, qui est désormais largement considérée comme l’une des techniques de détection de protéines sans étiquette et en temps réel les plus efficaces et les plus sensibles, est la microscopie à diffusion interférométrique (iSCAT).

iSCAT est basé sur la détection sensible de la lumière diffusée par des protéines individuelles par interférométrie. Au fur et à mesure que les protéines individuelles se déposent d’un tampon sur une lamelle couvre-objet, la minuscule ombre de la protéine projetée sur un appareil photo donne des informations sur sa taille et sa masse. Par conséquent, la méthode est également connue sous le nom de photométrie de masse. Cependant, une combinaison de sources de bruit techniques et de fluctuations de fond de type chatoiement a précédemment limité la sensibilité de la détection iSCAT aux protéines supérieures à environ 40 KDa.

Utiliser l’IA pour repousser les limites de la microscopie

Afin de pousser encore plus loin la sensibilité d’iSCAT, une équipe de MPL autour du directeur général Vahid Sandoghdar composée de l’ingénieur électricien Mahyar Dahmardeh, de l’informaticien Houman Mirzaalian et du physico-chimiste Hisham Mazal a collaboré avec Harald Köstler de la Friedrich-Alexander-Universität Erlangen Nürnberg (FAU) pour utiliser deux techniques d’apprentissage automatique pour détecter des protéines à seulement 10 kDa ou moins.

Dans un article publié dans Méthodes naturelles, ils ont montré comment ils peuvent utiliser l’algorithme iForest en combinaison avec la technique FastDVDnet pour obtenir ce résultat. Les deux sont des techniques d’apprentissage automatique dites non supervisées, ce qui signifie qu’elles n’ont pas besoin d’être d’abord formées sur un ensemble de données étiqueté. L’apprentissage automatique non supervisé est hautement souhaitable en microscopie car il permet d’identifier des modèles et des relations dans de grands ensembles de données sans connaître le modèle d’imagerie sous-jacent. Ceci est particulièrement important lorsque la limite de détection se situe à la limite du niveau de bruit et qu’il y a un manque de données étiquetées pour entraîner le réseau.

FastDVDnet est une technique avancée de débruitage d’image qui supprime le bruit des images de microscopie à l’aide de réseaux de neurones profonds. Il est optimisé pour le traitement parallèle, ce qui lui permet de traiter de très grands ensembles de données en un temps relativement court. Dans ce cas, les chercheurs ont utilisé FastDVDnet pour identifier les images iSCAT de protéines à partir des séquences vidéo enregistrées. Les caractéristiques spatio-temporelles extraites par FastDVDnet ont ensuite été utilisées par iForest pour regrouper les données iSCAT.

L’algorithme d’apprentissage automatique non supervisé de la forêt d’isolement (iForest) est couramment utilisé pour les tâches de détection d’anomalies. Il est particulièrement bien adapté à la microscopie car il peut traiter des données de grande dimension avec un grand nombre de caractéristiques, ce qui donne des résultats plus précis et complets. Ceci est particulièrement utile lors de l’analyse des données de microscopie, où l’identification de caractéristiques rares ou anormales devient importante. Par exemple, la détection d’anomalies iForest peut être utilisée pour détecter la présence de structures rares dans un tissu biologique ou pour identifier des cellules avec des morphologies inhabituelles. Cet algorithme peut aider à identifier des caractéristiques rares ou inhabituelles que les méthodes d’analyse traditionnelles pourraient très bien ignorer.

Le professeur Vahid Sandoghdar se souvient du travail acharné de son équipe, mais il se réjouit également déjà du prochain défi : « Nous avons parcouru un long chemin depuis notre premier rapport sur la détection de petites protéines sans étiquette dans Communication Nature en 2014. Nous sommes déterminés à repousser la limite de détection à la fois en améliorant les méthodes de mesure physique et en développant des algorithmes d’apprentissage automatique plus sophistiqués. Il n’y a vraiment aucune raison fondamentale pour laquelle nous ne devrions pas être en mesure de détecter des molécules inférieures à 1kDa, se rapprochant du poids d’une seule molécule lipidique. »

Plus d’information:
Mahyar Dahmardeh et al, L’apprentissage automatique auto-supervisé repousse la limite de sensibilité dans la détection sans étiquette de protéines uniques inférieures à 10 kDa, Méthodes naturelles (2023). DOI : 10.1038/s41592-023-01778-2

Fourni par l’Institut Max Planck pour la science de la lumière

ph-tech