Un nouvel outil de science des données accélère considérablement l’analyse moléculaire de notre environnement

Une équipe de recherche dirigée par des scientifiques de l’Université de Californie à Riverside a développé un flux de travail informatique pour analyser de grands ensembles de données dans le domaine de la métabolomique, l’étude des petites molécules présentes dans les cellules, les biofluides, les tissus et des écosystèmes entiers.

Plus récemment, l’équipe a appliqué ce nouvel outil informatique à l’analyse des polluants présents dans l’eau de mer du sud de la Californie. L’équipe a rapidement capturé les profils chimiques des environnements côtiers et mis en évidence les sources potentielles de pollution.

« Nous souhaitons comprendre comment ces polluants s’introduisent dans l’écosystème », explique Daniel Petras, professeur adjoint de biochimie à l’université de Californie à Riverside, qui a dirigé l’équipe de recherche. « Déterminer quelles molécules de l’océan sont importantes pour la santé environnementale n’est pas simple en raison de la grande diversité chimique de l’océan. Le protocole que nous avons développé accélère considérablement ce processus. Un tri plus efficace des données signifie que nous pouvons comprendre plus rapidement les problèmes liés à la pollution des océans. »

Petras et ses collègues rapport dans le journal Protocoles de la nature que leur protocole est conçu non seulement pour les chercheurs expérimentés mais aussi à des fins pédagogiques, ce qui en fait une ressource idéale pour les étudiants et les scientifiques en début de carrière. Ce flux de travail informatique est accompagné d’une application Web accessible avec une interface utilisateur graphique qui rend l’analyse des données métabolomiques accessible aux non-experts et leur permet d’obtenir des informations statistiques sur leurs données en quelques minutes.

« Cet outil est accessible à un large éventail de chercheurs, des débutants aux experts, et est conçu pour être utilisé en conjonction avec le logiciel de réseau moléculaire que mon groupe développe », a déclaré Mingxun Wang, co-auteur et professeur adjoint d’informatique et d’ingénierie à l’UCR. « Pour les débutants, les directives et le code que nous fournissons facilitent la compréhension des étapes courantes de traitement et d’analyse des données. Pour les experts, il accélère l’analyse reproductible des données, leur permettant de partager leurs flux de travail et leurs résultats d’analyse statistique des données. »

Petras a expliqué que le document de recherche est unique, servant de ressource pédagogique de grande envergure organisée par un groupe de recherche virtuel appelé Virtual Multiomics Lab, ou VMOL. Avec plus de 50 scientifiques participants du monde entier, VMOL est une communauté en accès libre. Son objectif est de simplifier et de démocratiser le processus d’analyse chimique, en le rendant accessible aux chercheurs du monde entier, quels que soient leur parcours ou leurs ressources.

« Je suis extrêmement fier de voir comment ce projet a évolué pour devenir quelque chose d’impactant, impliquant des experts et des étudiants du monde entier », a déclaré Abzer Pakkir Shah, doctorant dans le groupe de Petras et premier auteur de l’article. « En supprimant les barrières physiques et économiques, VMOL propose une formation en spectrométrie de masse computationnelle et en science des données et vise à lancer des projets de recherche virtuels comme une nouvelle forme de science collaborative. »

Tous les logiciels développés par l’équipe sont gratuits et accessibles au public. Le développement du logiciel a été lancé lors d’une école d’été sur la métabolomique non ciblée en 2022 à l’Université de Tübingen, où l’équipe a également lancé VMOL.

Petras espère que le protocole sera particulièrement utile aux chercheurs environnementaux ainsi qu’aux scientifiques travaillant dans le domaine biomédical et aux chercheurs effectuant des études cliniques sur la science du microbiome.

« La polyvalence de notre protocole s’étend à un large éventail de domaines et de types d’échantillons, notamment la chimie combinatoire, l’analyse du dopage et la contamination des traces d’aliments, de produits pharmaceutiques et d’autres produits industriels », a-t-il déclaré.

Petras a obtenu son master en biotechnologie à l’Université des sciences appliquées de Darmstadt et son doctorat en biochimie à l’Université technique de Berlin. Il a effectué des recherches postdoctorales à l’UC San Diego, où il s’est concentré sur le développement de méthodes de métabolomique environnementale à grande échelle. En 2021, il a lancé le laboratoire de métabolomique fonctionnelle à l’Université de Tübingen. En janvier 2024, il a rejoint l’UCR, où son laboratoire se concentre sur le développement et l’application de méthodes basées sur la spectrométrie de masse pour visualiser et évaluer les échanges chimiques au sein des communautés microbiennes.

Plus d’informations :
Abzer K. Pakkir Shah et al, Analyse statistique des résultats de réseaux moléculaires basés sur des caractéristiques à partir de données métabolomiques non ciblées, Protocoles de la nature (2024). DOI : 10.1038/s41596-024-01046-3

Fourni par l’Université de Californie – Riverside

ph-tech