Feinstruktursensitives Deep-Learning-Framework zur Vorhersage katalytischer Eigenschaften mit hoher Präzision

Die Feinstruktur der katalytischen Oberfläche hat einen erheblichen Einfluss auf strukturempfindliche Reaktionen, und man geht davon aus, dass Hochdurchsatz-Screening (HT) und maschinelles Lernen (ML) die potenziellen Regeln dieser Effekte effektiv erforschen und die Entwicklung des Katalysators beschleunigen können. Allerdings sind die berichteten ML-Gerüste zu grob, um eine genaue Vorhersage der katalytischen Leistung zu ermöglichen.

Derzeit sind Deskriptoren und Diagramme die beiden am häufigsten verwendeten Konvertierungsmethoden. Bei der Konstruktion von Deskriptoren werden jedoch häufig atomare Verbindungen außer Acht gelassen, was es für ML-Modelle schwierig macht, detaillierte geometrische Informationen zu erfassen, die für die katalytische Leistung am relevantesten sind.

Das graphbasierte ML-Modell verliert während des Prozesses der Knotenaktualisierung zwangsläufig die Informationen zur geometrischen Anordnung von Adsorptionsstellen, und die Komplexität des neuronalen Netzwerks zur Nachrichtenübermittlung führt zu seiner Unempfindlichkeit gegenüber elektronischen oder geometrischen Strukturen und zu einer schlechten Interpretierbarkeit. Daher mangelt es immer noch an interpretierbaren ML-Frameworks, die gleichzeitig die Merkmale elektronischer und geometrischer Feinstrukturen in der heterogenen Katalyse erfassen können.

Kürzlich hat ein Forschungsteam unter der Leitung von Prof. Yong Wang von der Zhejiang-Universität, China, ein ML-Framework für datenerweiterte Faltungs-Neuronale Netzwerke (CNN) namens GLCNN erstellt, das „globale und lokale“ Funktionen kombiniert. Dieses Framework kann die ursprünglichen Feinstrukturen ohne komplizierte Kodierungsmethoden erfassen, indem es katalytische Oberflächen und Adsorptionsstellen in zweidimensionale Gitter bzw. eindimensionale Deskriptoren umwandelt.

Durch die Hinzufügung von Datenerweiterung (Data Augmentation, DA) kann der Datensatz erweitert und eine durch unzureichende chemische Datensätze verursachte Überanpassung gemildert werden. Das GLCNN-Framework hat die Adsorptionsenergien von OH an einer Reihe analoger kohlenstoffbasierter Übergangsmetall-Einzelatomkatalysatoren (TMSACs) mit einem mittleren absoluten Fehler (MAE) von weniger als 0,1 eV genau vorhergesagt und unterschieden, was das beste Ergebnis beliebter Modelle darstellt Bisher an großen Datensätzen trainiert. Die Ergebnisse wurden veröffentlicht in Chinesisches Journal für Katalyse .

Beim Vergleich von GLCNN mit deskriptor- oder graphbasierten Modellen wurde festgestellt, dass das Vergleichsmodell die OH-Adsorptionsenergie von Katalysatoren, die IB- und IIB-Übergangsmetalle oder cis/trans-Konfigurationen enthalten, nicht genau vorhersagen kann. Die Vorhersageleistung des GLCNN-Modells ist deutlich besser als die des Vergleichsmodells, was darauf hinweist, dass die Kombination von Gittern und Deskriptoren die elektronischen und feinen geometrischen Informationen katalytisch aktiver Zentren besser widerspiegeln kann.

Im Gegensatz zu herkömmlichen CNN- und Deskriptor-basierten Modellen mit einseitiger Merkmalsextraktion kann dieses feinstrukturempfindliche ML-Framework die Schlüsselfaktoren, die die katalytische Leistung beeinflussen, sowohl aus geometrischen als auch aus chemischen/elektronischen Merkmalen, wie z. B. Symmetrie- und Koordinationselementen, durch unvoreingenommene Interpretation extrahieren Analyse.

Die Analyse der Merkmalsbedeutung für den Deskriptorenteil zeigt, dass die elektronische Struktur und das Symmetrieelement der Adsorptionsstellen entscheidend sind und die Bedeutung von Metallen stärker ist als ihre Koordinationsumgebung. Die Visualisierungsanalyse auf jeder Ebene zeigt, dass GLCNN automatisch geometrische Informationen chemischer Strukturen extrahieren kann, die der menschlichen Intuition entsprechen.

Mit zunehmender Tiefe der Schichten sucht GLCNN schrittweise nach der Richtung der Merkmalsextraktion auf der Grundlage grundlegender katalytischer Kenntnisse und extrahiert abstraktere hochdimensionale Merkmale, die der Vorhersage der Adsorptionsenergie förderlich sind. Dieses Framework bietet eine praktikable Lösung für das hochpräzise HT-Screening heterogener Katalysatoren mit einem breiten physikalischen und chemischen Raum.

Mehr Informationen:
Yuzhuo Chen et al., Feinstruktursensitives Deep-Learning-Framework zur Vorhersage katalytischer Eigenschaften mit hoher Präzision, Chinesisches Journal für Katalyse (2023). DOI: 10.1016/S1872-2067(23)64467-5

Zur Verfügung gestellt von der Chinesischen Akademie der Wissenschaften

ph-tech