In ihrem Papier veröffentlicht in Wissenschaft im Dezember 2021 zeigte ein DeepMind-Team, wie neuronale Netze verwendet werden können, um Elektronenwechselwirkungen in chemischen Systemen genauer zu beschreiben als bestehende Methoden. Ein Team von Forschern von Skoltech, dem Zelinsky Institute of Organic Chemistry, der HSE University, Yandex und der Kyungpook National University zeigt in ihrem Kommentar in Wissenschaft dass die Fähigkeit von DeepMind AI, das Verhalten solcher Systeme zu verallgemeinern, nicht aus den veröffentlichten Ergebnissen folgt und eine erneute Betrachtung erfordert.
Zu wissen, wo sich die Elektronen in einem Molekül befinden, kann viel dazu beitragen, seine Struktur, seine Eigenschaften und seine Reaktivität zu erklären. Chemiker verwenden Methoden der Dichtefunktionaltheorie (DFT), Annäherungen an die Schrödinger-Gleichung, um genaue und recheneffiziente Modelle von Molekülen und Materialien zu erstellen. Es gibt jedoch bekannte Umstände, unter denen DFT-Tools versagen. Einer sagt voraus, wie Atome Elektronen teilen; In einem berühmten Beispiel sagen DFT-Methoden fälschlicherweise voraus, dass selbst wenn ein Chlor- und ein Natriumatom unendlich weit voneinander entfernt sind, das Chloratom einen Bruchteil eines der Elektronen des Natriumatoms behält.
Solche Fehler entstehen, weil DFT-Gleichungen nur Annäherungen an die physikalische Realität sind. Forscher des DeepMind-Projekts für maschinelles Lernen sagen, dass ihr neuronales Netzwerk diesen Teil-eines-Elektronen-Fehlers eliminiert und genauere Vorhersagen macht als herkömmliche DFT-Methoden
„Im Kern ist die DFT eine Methode zur Lösung der Schrödinger-Gleichung. Ihre Genauigkeit wird durch ihren Austauschkorrelationsteil bestimmt, der leider unbekannt ist. Bis heute wurden über 400 verschiedene Annäherungen für diesen Teil vorgeschlagen“, sagt Petr Zhyliaev , leitender Forschungswissenschaftler bei Skoltech.
„Eine Möglichkeit, einen guten Austausch-Korrelations-Teil zu bauen, besteht darin, Informationen darüber von fortgeschritteneren numerischen Methoden als der Dichtefunktionaltheorie zu übertragen, die jedoch um Größenordnungen weniger recheneffizient sind. In ihrer Arbeit verwendete DeepMind ein Neuronal Netzwerk als universellen Interpolator, um den Austausch-Korrelations-Teil des Funktionals zu lernen. Ihr Versuch war bei weitem nicht der erste, aber einer der ehrgeizigsten.“
DeepMind konstruierte ein auf neuronalen Netzwerken basierendes Dichtefunktional mit der Bezeichnung DM21, das auf Bruchelektronensystemen wie einem Wasserstoffatom mit einem halben Elektron trainiert wurde. Um seine Überlegenheit zu beweisen, haben die Autoren DM21 an einem Satz gestreckter Dimere (genannt BBB-Satz) getestet, z. B. zwei Wasserstoffatome in großem Abstand mit insgesamt einem Elektron.
Das DM21-Funktional zeigt erwartungsgemäß eine hervorragende Leistung auf dem BBB-Testset und übertrifft bei weitem alle getesteten klassischen DFT-Funktionale und DM21m, die identisch mit DM21 trainiert wurden, jedoch ohne die Bruchelektronensysteme im Trainingsset.
Obwohl dies so aussehen mag, als hätte DM21 die Physik hinter den Bruchelektronensystemen verstanden, zeigt ein genauerer Blick, dass alle Dimere im BBB-Set den Systemen im Train-Set sehr ähnlich werden. Tatsächlich sind atomare Wechselwirkungen aufgrund der Lokalität der elektroschwachen Wechselwirkungen nur bei kurzen Abständen stark, außerhalb derer sich die beiden Atome im Wesentlichen so verhalten, als ob sie nicht wechselwirken würden (siehe Abbildung oben).
„Neuronale Netze sind in gewisser Weise wie Menschen: Sie bekommen lieber die richtige Antwort aus dem falschen Grund, als umgekehrt. Daher ist es nicht so schwer, ein neuronales Netz zu trainieren, sondern es zu beweisen.“ hat die physikalischen Gesetze gelernt, anstatt sich die richtigen Antworten zu merken. Das Testen eines neuronalen Netzes an Systemen, die es während des Trainings gesehen hat, ist vergleichbar mit der Prüfung eines Schülers mit einer Aufgabe, die er vor fünf Minuten von einem Lehrer gelöst gesehen hat“, erklärt Michael Medvedev, der Leiter von Gruppe für Theoretische Chemie am Zelinsky-Institut für Organische Chemie der Russischen Akademie der Wissenschaften.
Daher ist das BBB-Testset kein richtiges: Es testet nicht das DM21-Verständnis der Bruchelektronensysteme: DM21 kann leicht mit dem Auswendiglernen davonkommen. Auch eine gründliche Analyse der anderen vier Beweise für die DM21-Handhabung solcher Systeme führte zu keinem entscheidenden Ergebnis: Nur seine gute Genauigkeit auf dem SIE4x4-Set kann zuverlässig sein, obwohl selbst dort ein klarer Trend des Fehlerwachstums mit der Entfernung darauf hindeutet DM21 ist nicht ganz frei von Problemen mit Fractional-Electron-Systemen.
Die Verwendung von Fractional-Electrons-Systemen im Trainingsset ist nicht die einzige Neuheit in der Arbeit von DeepMind. Ihre Idee, die physikalischen Beschränkungen über den Trainingssatz in ein neuronales Netzwerk einzuführen, sowie der Ansatz, durch Training des korrekten chemischen Potenzials einen physikalischen Sinn aufzuerlegen, werden in Zukunft wahrscheinlich weit verbreitet bei der Konstruktion von DFT-Funktionalen für neuronale Netzwerke verwendet.
Igor S. Gerasimov et al., Kommentar zu „Pushing the Frontiers of Density Functionals by Solving the Fractional Electron Problem“ Wissenschaft (2022). DOI: 10.1126/science.abq3385