In einem Studie in der Zeitschrift veröffentlicht Umweltwissenschaften und ÖkotechnologieForscher der Huazhong University of Science and Technology haben „Meta-Sorter“ eingeführt, eine KI-basierte Methode, die neuronale Netze und Transferlernen nutzt, um die Biomkennzeichnung für Tausende von Mikrobiomproben in der MGnify-Datenbank deutlich zu verbessern, insbesondere für solche mit unvollständigen Informationen.
Der Meta-Sorter-Ansatz umfasst zwei entscheidende Schritte. Zunächst wird ein neuronales Netzwerkmodell sorgfältig anhand von 118.592 mikrobiellen Proben aus 134 Biomen und ihrer jeweiligen Biom-Ontologie erstellt, das einen beeindruckenden durchschnittlichen AUROC von 0,896 aufweist. Dieses Modell klassifiziert Proben genau mit detaillierten Biominformationen und dient als solide Grundlage für weitere Analysen.
Um zweitens die Herausforderung neu eingeführter Proben mit unterschiedlichen Eigenschaften zu bewältigen, integrierten die Forscher Transferlernen mit 34.209 neu hinzugefügten Proben aus 35 Biomen, darunter acht neuartige. Das Transfer-Neuronale-Netzwerk-Modell erreichte einen hervorragenden durchschnittlichen AUROC von 0,989 und konnte Biominformationen für neu eingeführte Proben mit der Anmerkung „Gemischtes Biom“ erfolgreich vorhersagen.
Die Ergebnisse von Meta-Sorter sind in der Tat beeindruckend und erreichen eine Gesamtgenauigkeitsrate von 96,7 % bei der Klassifizierung von Proben unter den 16.507 fehlenden detaillierten Biomenanmerkungen. Dieser Durchbruch löst effektiv das Problem kaskadierender Fehler und eröffnet spannende neue Möglichkeiten für die Wissensentdeckung in verschiedenen wissenschaftlichen Disziplinen, insbesondere in der Umweltforschung.
Darüber hinaus erstreckt sich der Erfolg von Meta-Sorter auf die Verfeinerung der Biom-Annotation für unter- und falsch annotierte Proben. Die intelligente und automatische Zuweisung präziser Klassifizierungen zu mehrdeutigen Proben liefert wertvolle Erkenntnisse über die Originalliteratur hinaus, während die Differenzierung von Proben in bestimmte Umweltkategorien die Zuverlässigkeit und Gültigkeit von Forschungsergebnissen erhöht.
Mit der fortlaufenden Entwicklung standardisierter Protokolle für die Datenübermittlung und die Einbeziehung zusätzlicher Metadateninformationen wird Meta-Sorter die Art und Weise, wie Forscher mikrobielle Gemeinschaftsproben analysieren und interpretieren, revolutionieren. Letztendlich wird es zu genaueren und aufschlussreicheren Entdeckungen im Bereich der Mikrobiomforschung und darüber hinaus führen.
Mehr Informationen:
Nan Wang et al., Verfeinerung der Biomkennzeichnung für groß angelegte Proben mikrobieller Gemeinschaften: Nutzung neuronaler Netze und Transferlernen, Umweltwissenschaften und Ökotechnologie (2023). DOI: 10.1016/j.ese.2023.100304
Zur Verfügung gestellt von der Chinesischen Gesellschaft für Umweltwissenschaften