Der weltweite Arzneimittelverbrauch wächst jedes Jahr rasant und erreicht im Jahr 2020 4 Milliarden Dosen. Da immer mehr Arzneimittel vom menschlichen Körper verstoffwechselt werden und in Abwasser- und Abwasseraufbereitungsanlagen gelangen, nehmen auch die Menge und Art der darin enthaltenen Spurenstoffe zu .
Wenn diese Spurenstoffe in Flüsse und Meere gelangen und als Wasserquellen genutzt werden, können sie schädliche Auswirkungen auf die Umwelt und die menschliche Gesundheit haben, einschließlich Karzinogenese und endokriner Störungen. Daher sind Technologien erforderlich, um die Eigenschaften und das Verhalten dieser Spurenstoffe schnell und genau vorherzusagen. Die Analyse unbekannter Spurenstoffe erfordert jedoch teure Ausrüstung, qualifizierte Experten und viel Zeit.
Ein Team des Korea Institute of Science and Technology (KIST) unter der Leitung von Hong Seok-won, Leiter des Forschungszentrums für Wasserressourcen und -zyklen, und Son Moon, einem leitenden Forscher, hat eine Technologie entwickelt, um neu auftretende Spurenstoffe anhand ihrer physikalisch-chemischen Eigenschaften zu klassifizieren und ihre Konzentrationen mithilfe von Clustering und vorhersagebasierter Technologie der künstlichen Intelligenz vorhersagen.
Die Forscher verwendeten selbstorganisierende Karten, eine KI-Technik, die Daten auf der Grundlage ihrer Ähnlichkeiten in Karten gruppiert, um 29 bekannte Spurenstoffe, darunter medizinische Verbindungen und Koffein, auf der Grundlage von Informationen wie physikalisch-chemischen Eigenschaften, funktionellen Gruppen und biologischen Reaktionsmechanismen zu klassifizieren. Die Forschung ist veröffentlicht im Tagebuch npj Sauberes Wasser.
Anschließend wurden Random Forests, eine maschinelle Lerntechnik, die Daten in Teilmengen klassifiziert, weiterentwickelt, um die Eigenschaften und Konzentrationsänderungen neuer Spurenstoffe vorherzusagen.
Wenn ein neuer Spurenstoff zu einem Cluster in der selbstorganisierenden Karte gehört, können die Eigenschaften anderer Stoffe in diesem Cluster verwendet werden, um vorherzusagen, wie sich die Eigenschaften und die Konzentration des neuen Spurenstoffs ändern werden.
Als Ergebnis der Anwendung dieses Clustering- und Vorhersage-KI-Modells (selbstorganisierende Karte und zufälliger Wald) auf 13 neue Spurenstoffe war die Vorhersagegenauigkeit von etwa 0,75 ausgezeichnet und übertraf die Vorhersagegenauigkeit von 0,40 bestehender KI-Techniken, die biologische Informationen verwenden, bei weitem.
Im Vergleich zu herkömmlichen, auf Formeln basierenden Vorhersagemethoden hat das datengesteuerte Analysemodell des KIST-Forschungsteams den Vorteil, nur die physikalisch-chemischen Eigenschaften von Spurenstoffen einzugeben und effizient zu identifizieren, wie sich die Konzentration neuer Spurenstoffe im Abwasserbehandlungsprozess durch Clustering mit verändern wird Stoffe mit ähnlichen Daten.
Darüber hinaus kann das datengesteuerte KI-Modell künftig dazu genutzt werden, die Konzentration neuer Substanzen wie etwa gesellschaftlich besorgniserregender Medikamente vorherzusagen.
„Es kann nicht nur auf tatsächliche Abwasseraufbereitungsanlagen angewendet werden, sondern auch auf die meisten Wasseraufbereitungsanlagen, in denen neue Spurenstoffe vorhanden sind, und kann schnelle und genaue Daten im politischen Entscheidungsprozess für entsprechende Vorschriften liefern“, sagte Dr. Seokwon Hong und Dr. Moon Sohn von KIST.
„Da maschinelles Lernen zum Einsatz kommt, wird sich die Genauigkeit der Vorhersage verbessern, wenn relevante Daten gesammelt werden.“
Mehr Informationen:
Seung Ji Lim et al, Clustering von Mikroschadstoffen und Schätzung der Geschwindigkeitskonstanten von Sorption und biologischem Abbau mithilfe von Ansätzen des maschinellen Lernens, npj Sauberes Wasser (2023). DOI: 10.1038/s41545-023-00282-6