In einer Rezension veröffentlicht in MaschinenbauWissenschaftler erforschen das aufstrebende Gebiet des maschinellen Lernens (ML) und seine Anwendungen in der Chemie. Dieser umfassende Aufsatz mit dem Titel „Maschinelles Lernen für die Chemie: Grundlagen und Anwendungen“ zielt darauf ab, die Lücke zwischen Chemikern und modernen ML-Algorithmen zu schließen und Einblicke in das Potenzial von ML für die Revolutionierung der chemischen Forschung zu geben.
Im letzten Jahrzehnt haben ML und künstliche Intelligenz (KI) bemerkenswerte Fortschritte gemacht und uns der Verwirklichung intelligenter Maschinen näher gebracht. Das Aufkommen von Deep-Learning-Methoden und verbesserten Datenspeicherfunktionen hat bei diesem Fortschritt eine entscheidende Rolle gespielt. ML hat in Bereichen wie der Bild- und Spracherkennung bereits Erfolge gezeigt und erlangt nun große Aufmerksamkeit im Bereich der Chemie, die durch komplexe Daten und vielfältige organische Moleküle gekennzeichnet ist.
Allerdings stehen Chemiker bei der Einführung von ML-Anwendungen oft vor Herausforderungen, da sie mit modernen ML-Algorithmen nicht vertraut sind. Chemiedatensätze weisen typischerweise eine Tendenz zu erfolgreichen Experimenten auf, während eine ausgewogene Perspektive die Einbeziehung sowohl erfolgreicher als auch fehlgeschlagener Experimente erfordert. Darüber hinaus stellt die unvollständige Dokumentation der Synthesebedingungen in der Literatur zusätzliche Herausforderungen dar.
Die Computerchemie, in der Datensätze zuverlässig aus quantenmechanischen Berechnungen erstellt werden können, hat ML-Anwendungen eher akzeptiert. Dennoch benötigen Chemiker ein grundlegendes Verständnis von ML, um das Potenzial der Datenaufzeichnung und ML-gesteuerter Experimente nutzen zu können.
Dieser Aufsatz dient als Einführung in beliebte Chemiedatenbanken, zweidimensionale (2D) und dreidimensionale (3D) Funktionen, die in ML-Modellen verwendet werden, und beliebte ML-Algorithmen. Es befasst sich mit drei spezifischen Bereichen der Chemie, in denen ML erhebliche Fortschritte gemacht hat: Retrosynthese in der organischen Chemie, ML-potentialbasierte Atomsimulation und ML für heterogene Katalyse.
Diese Anwendungen haben entweder die Forschung beschleunigt oder innovative Lösungen für komplexe Probleme bereitgestellt. Der Rückblick endet mit einer Diskussion zukünftiger Herausforderungen in diesem Bereich.
Die rasante Weiterentwicklung der Rechenkapazitäten und die Entwicklung neuer ML-Algorithmen deuten darauf hin, dass noch spannendere ML-Anwendungen am Horizont stehen, die die Landschaft der chemischen Forschung im ML-Zeitalter umgestalten werden. Während die Zukunft in einem sich so schnell entwickelnden Bereich schwer vorherzusagen ist, ist es unbestreitbar, dass die Entwicklung von ML-Modellen zu einer verbesserten Zugänglichkeit, Allgemeingültigkeit, Genauigkeit, Intelligenz und letztendlich zu einer höheren Produktivität führen wird.
Die Integration von ML-Modellen mit dem Internet bietet eine vielversprechende Möglichkeit, ML-Vorhersagen weltweit zu teilen.
Allerdings stellt die Übertragbarkeit von ML-Modellen in der Chemie aufgrund der vielfältigen Elementtypen und komplexen Materialien eine häufige Herausforderung dar. Vorhersagen bleiben oft auf lokale Datensätze beschränkt, was zu einer geringeren Genauigkeit über den Datensatz hinaus führt.
Um dieses Problem anzugehen, werden neue Techniken wie das Potenzial des globalen neuronalen Netzwerks (G-NN) und verbesserte ML-Modelle mit passenderen Parametern untersucht. Während ML-Wettbewerbe in der Datenwissenschaft außergewöhnliche Algorithmen hervorgebracht haben, besteht in der Chemie ein Bedarf an offeneren ML-Wettbewerben, um junge Talente zu fördern.
Spannend ist, dass End-to-End-Lernen, das die endgültige Ausgabe aus Roheingaben und nicht aus entworfenen Deskriptoren generiert, vielversprechend für intelligentere ML-Anwendungen ist. AlphaFold2 nutzt beispielsweise die eindimensionale (1D) Struktur eines Proteins, um dessen 3D-Struktur vorherzusagen. Auch im Bereich der heterogenen Katalyse hat ein End-to-End-KI-Modell Reaktionswege erfolgreich gelöst. Diese fortschrittlichen ML-Modelle können auch zur Entwicklung intelligenter Experimentalroboter für Hochdurchsatzexperimente beitragen.
Da sich das Gebiet des maschinellen Lernens weiterhin rasant weiterentwickelt, ist es für Chemiker und Forscher von entscheidender Bedeutung, über seine Anwendungen in der Chemie auf dem Laufenden zu bleiben. Diese Übersicht dient als wertvolle Ressource und bietet einen umfassenden Überblick über die Grundlagen von ML und sein Potenzial in verschiedenen Bereichen der Chemie. Mit der Integration von ML-Modellen und den gemeinsamen Anstrengungen der wissenschaftlichen Gemeinschaft ist die Zukunft der chemischen Forschung vielversprechend.
Mehr Informationen:
Yun-Fei Shi et al, Maschinelles Lernen für die Chemie: Grundlagen und Anwendungen, Maschinenbau (2023). DOI: 10.1016/j.eng.2023.04.013