Un nouvel outil de visualisation de données conçu par un doctorant de Georgia Tech aide une équipe d’écologistes microbiens, de géobiologistes et d’océanographes à mieux comprendre la manière dont les micro-organismes des grands fonds interagissent avec leur environnement.
Ce qui a commencé comme un stage à la NASA s’est transformé en une opportunité unique pour Adam Coscia, étudiant en quatrième année de doctorat. Coscia a travaillé sous la supervision d’une équipe interdisciplinaire de chercheurs collaboratifs de Caltech, du Jet Propulsion Laboratory (JPL) que Caltech gère pour la NASA et de l’ArtCenter College of Design.
Les mentors de Coscia l’ont recommandé à une équipe de recherche de Caltech dirigée par Victoria Orphan, une écologiste microbienne renommée qui étudie les communautés microbiennes dans l’océan et leur fonctionnement dans les habitats des sédiments des fonds marins profonds.
Orphan et son équipe, l’Orphan Lab de Caltech, mènent leurs recherches depuis 2004. Ils ont récemment décidé d’adopter une approche de visualisation des données pour enregistrer leurs découvertes et planifier de futures expéditions.
« Historiquement, nos ensembles de données étaient distincts et se trouvaient dans des feuilles de calcul Excel distinctes », a déclaré Orphan. « Peut-être qu’à la fin, nous ferons une analyse statistique pour trouver des corrélations dans ces données. Ensuite, nous les comparerons à nos cartes. Nous n’avions aucun moyen de consolider tout cela sous un seul et même toit, ce qui nous permettrait d’en apprendre davantage sur ces écosystèmes. »
Orphan a déclaré que son équipe effectue généralement une ou deux expéditions de recherche au large de la côte californienne chaque année. Ils passent trois semaines à utiliser des véhicules télécommandés (ROV) pour collecter des échantillons de sédiments au fond de l’océan. Le temps étant compté, il est essentiel d’identifier les emplacements des meilleurs échantillons.
Orphan est également chercheur adjoint au Monterey Bay Aquarium Research Institute (MBARI) et travaille avec le Seafloor Mapping Lab. Le laboratoire utilise un système de relevé à basse altitude monté sur un ROV pour produire des cartes détaillées de la topographie des fonds marins.
Pour aider l’Orphan Lab à travailler efficacement avec des données topographiques et photographiques, Coscia a conçu Voir en profondeurun navigateur Web interactif qui peut annoter et représenter graphiquement des données à l’aide de modèles de visualisation 3D et de cartes environnementales.
« L’idée est qu’une fois que vous avez les échantillons et que vous êtes intéressé par une zone spécifique avec des échantillons antérieurs, vous pouvez entrer et annoter sur la carte où collecter les échantillons ensuite avec notre outil de dessin », a déclaré Coscia.
« Nous nous sommes concentrés sur le processus d’exploration et de prise de notes avec des cartes et des données et sur de nouvelles façons de les visualiser. Les scientifiques peuvent dessiner et cartographier tous leurs échantillons en temps réel. Ils peuvent référencer des données spécifiques beaucoup plus facilement et déterminer où l’équipe doit se rendre pour obtenir les meilleurs échantillons. »
L’Orphan Lab a embarqué DeepSee en direct à bord de son navire pour ses deux expéditions les plus récentes. Orphan a constaté une efficacité accrue dans la planification des expéditions.
« L’infrastructure mise en place par Adam fera de cet outil un outil utile non seulement pour mon groupe, mais aussi pour d’autres océanographes et scientifiques dans d’autres domaines, partout où il existe une distribution spatiale d’informations que vous souhaitez connecter à d’autres métadonnées », a-t-elle déclaré.
Orphan accueille chaque année de nouveaux chercheurs dans son laboratoire du Caltech, et DeepSee a accéléré le processus de mise à niveau des nouveaux arrivants.
« Nous pouvons les intégrer beaucoup plus facilement et leur donner une idée des données disponibles et de l’endroit où nous avons collecté les informations d’une manière beaucoup plus claire que s’ils se référaient à une feuille de calcul Excel », a-t-elle déclaré.
DeepSee crée également des modèles de données 3D sous le fond marin à l’aide de l’interpolation de données, qui estime de nouveaux points de données en fonction de la plage d’un ensemble de points de données connus. À l’aide des points de données connus, DeepSee comble les lacunes de la qualité des données estimées que les chercheurs peuvent trouver dans des endroits proches ou plus loin sous la surface où les échantillons ont été collectés.
« On ne peut rien voir visuellement sous le fond marin », explique Coscia. « Il faudrait aller creuser. Mais nos modèles 3D montrent que l’on peut avoir des données suggérant un point chaud à quelques mètres seulement sous le fond. Cela permet de savoir où prélever les échantillons. »
Coscia souhaite intégrer des modèles d’apprentissage automatique (ML) dans une future version de DeepSee qui utilisera les données collectées pour prédire les futurs sites d’échantillonnage. Cependant, la précision du modèle ML nécessite beaucoup plus de données.
Coscia espère que la version actuelle de l’outil sera adoptée afin que les chercheurs puissent plus facilement intégrer l’apprentissage automatique dans leur travail.
Pour l’instant, la version actuelle a de nombreuses utilisations, a-t-il déclaré.
« Pouvoir organiser et visualiser ses données, notamment à l’aide de cartes, est toujours précieux », a-t-il déclaré. « Ma passion est d’aider les chercheurs et les scientifiques à visualiser leurs données de manière nouvelle et utile. »
Coscia est l’auteur d’un article sur le développement de DeepSee, qu’il a présenté en mai lors de la Conférence sur les facteurs humains dans les systèmes informatiques (CHI 2024) à Honolulu, Hawaï.