Un nouvel outil informatique aide à interpréter les modèles d’IA en génomique

L’intelligence artificielle continue de se frayer un chemin dans de nombreux aspects de nos vies. Mais qu’en est-il de la biologie, l’étude de la vie elle-même ? L’IA peut passer au crible des centaines de milliers de données génomiques pour identifier de nouvelles cibles thérapeutiques potentielles. Bien que ces connaissances génomiques puissent sembler utiles, les scientifiques ne savent pas exactement comment les modèles d’IA actuels parviennent à leurs conclusions. Aujourd’hui, un nouveau système nommé SQUID arrive sur la scène, armé pour ouvrir la boîte noire de logique interne trouble de l’IA.

SQUID, abréviation de Surrogate Quantitative Interpretability for Deepnets, est un outil informatique créé par les scientifiques du Cold Spring Harbor Laboratory (CSHL). Il est conçu pour aider à interpréter la manière dont les modèles d’IA analysent le génome. Comparé à d’autres outils d’analyse, SQUID est plus cohérent, réduit le bruit de fond et peut conduire à des prédictions plus précises sur les effets des mutations génétiques.

Comment ça marche tellement mieux ? Selon Peter Koo, professeur adjoint au CSHL, la clé réside dans la formation spécialisée de SQUID.

« Les outils que les gens utilisent pour essayer de comprendre ces modèles proviennent en grande partie d’autres domaines comme la vision par ordinateur ou le traitement du langage naturel. Bien qu’ils puissent être utiles, ils ne sont pas optimaux pour la génomique. Ce que nous avons fait avec SQUID, c’est tirer parti de décennies d’expérience. connaissances quantitatives en génétique pour nous aider à comprendre ce que ces réseaux neuronaux profonds apprennent », explique Koo.

SQUID fonctionne en générant d’abord une bibliothèque de plus de 100 000 séquences d’ADN variantes. Il analyse ensuite la bibliothèque de mutations et leurs effets à l’aide d’un programme appelé MAVE-NN (Multiplex Assays of Variant Effects Neural Network). Cet outil permet aux scientifiques de réaliser simultanément des milliers d’expériences virtuelles. En effet, ils peuvent « repérer » les algorithmes derrière les prédictions les plus précises d’une IA donnée. Leur « capture » informatique pourrait ouvrir la voie à des expériences plus ancrées dans la réalité.

« In silico [virtual] les expériences ne remplacent pas les expériences réelles en laboratoire. Néanmoins, ils peuvent être très instructifs. Ils peuvent aider les scientifiques à formuler des hypothèses sur le fonctionnement d’une région particulière du génome ou sur la manière dont une mutation pourrait avoir un effet cliniquement pertinent », explique Justin Kinney, professeur agrégé au CSHL et co-auteur de l’étude.

Il existe des tonnes de modèles d’IA dans la mer. De plus en plus de personnes entrent dans les eaux chaque jour. Koo, Kinney et leurs collègues espèrent que SQUID aidera les scientifiques à trouver ceux qui répondent le mieux à leurs besoins spécialisés.

Bien que cartographié, le génome humain reste un terrain incroyablement difficile. SQUID pourrait aider les biologistes à naviguer plus efficacement dans le domaine, les rapprochant ainsi des véritables implications médicales de leurs découvertes.

La recherche est publiée dans la revue Intelligence des machines naturelles.

Plus d’information:
Interpréter les mécanismes cis-régulateurs des réseaux de neurones génomiques profonds à l’aide de modèles de substitution, Intelligence des machines naturelles, DOI : 10.1038/s42256-024-00851-5

Fourni par le laboratoire Cold Spring Harbor

ph-tech