Dans un étude publié dans la revue Sciences de l’environnement et écotechnologiedes chercheurs de l’Université des sciences et technologies de Huazhong ont introduit le « Meta-Sorter », une méthode basée sur l’IA qui exploite les réseaux neuronaux et transfère l’apprentissage pour améliorer considérablement l’étiquetage du biome pour des milliers d’échantillons de microbiome dans la base de données MGnify, en particulier ceux contenant des informations incomplètes.
L’approche Meta-Sorter comprend deux étapes cruciales. Premièrement, un modèle de réseau neuronal est méticuleusement construit à l’aide de 118 592 échantillons microbiens provenant de 134 biomes et de leur ontologie de biome respective, affichant un AUROC moyen impressionnant de 0,896. Ce modèle classe avec précision les échantillons avec des informations détaillées sur le biome, servant de base solide pour des analyses ultérieures.
Deuxièmement, pour relever le défi des échantillons nouvellement introduits présentant des caractéristiques différentes, les chercheurs ont intégré l’apprentissage par transfert avec 34 209 échantillons nouvellement ajoutés provenant de 35 biomes, dont huit nouveaux. Le modèle de réseau neuronal de transfert a atteint un AUROC moyen exceptionnel de 0,989, prédisant avec succès les informations sur le biome pour les échantillons nouvellement introduits annotés comme « biome mixte ».
Les résultats de Meta-Sorter sont en effet impressionnants, atteignant un taux de précision global de 96,7 % dans la classification des échantillons parmi les 16 507 dépourvus d’annotations détaillées du biome. Cette avancée résout efficacement le problème des erreurs en cascade et ouvre de nouvelles possibilités passionnantes pour la découverte de connaissances dans diverses disciplines scientifiques, en particulier dans la recherche environnementale.
De plus, le succès de Meta-Sorter s’étend au raffinement de l’annotation du biome pour les échantillons sous-annotés ou mal annotés. Son attribution intelligente et automatique de classifications précises à des échantillons ambigus fournit des informations précieuses au-delà de la littérature originale, tandis que la différenciation des échantillons en catégories environnementales spécifiques améliore la fiabilité et la validité des conclusions de la recherche.
Avec le développement continu de protocoles standardisés pour la soumission des données et l’incorporation d’informations supplémentaires sur les métadonnées, Meta-Sorter est sur le point de révolutionner la façon dont les chercheurs analysent et interprètent les échantillons de la communauté microbienne. En fin de compte, cela mènera à des découvertes plus précises et plus pertinentes dans le domaine de la recherche sur le microbiome et au-delà.
Plus d’information:
Nan Wang et al, Affiner l’étiquetage du biome pour des échantillons de communauté microbienne à grande échelle : tirer parti des réseaux neuronaux et de l’apprentissage par transfert, Sciences de l’environnement et écotechnologie (2023). DOI : 10.1016/j.ese.2023.100304
Fourni par la Société chinoise des sciences de l’environnement