Les scientifiques doutent que l’IA de DeepMind soit aussi bonne pour les systèmes à charge fractionnaire qu’il n’y paraît

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Dans leur journal publié dans La science en décembre 2021, une équipe de DeepMind a montré comment les réseaux neuronaux peuvent être utilisés pour décrire les interactions électroniques dans les systèmes chimiques avec plus de précision que les méthodes existantes. Une équipe de chercheurs de Skoltech, de l’Institut Zelinsky de chimie organique, de l’Université HSE, de Yandex et de l’Université nationale de Kyungpook montrent dans leur commentaire en La science que la capacité de DeepMind AI à généraliser le comportement de tels systèmes ne découle pas des résultats publiés et nécessite une révision.

Savoir où se trouvent les électrons dans une molécule peut contribuer grandement à expliquer sa structure, ses propriétés et sa réactivité. Les chimistes utilisent des méthodes de théorie fonctionnelle de la densité (DFT), des approximations de l’équation de Schrödinger, pour créer des modèles précis et efficaces de calcul de molécules et de matériaux. Mais il existe des circonstances bien connues où les outils DFT échouent. L’un prédit comment les atomes partagent les électrons ; dans un exemple célèbre, les méthodes DFT prédisent à tort que même lorsqu’un atome de chlore et un atome de sodium sont infiniment éloignés, l’atome de chlore conserve une fraction de l’un des électrons de l’atome de sodium.

De telles erreurs surviennent parce que les équations DFT ne sont que des approximations de la réalité physique. Les chercheurs du projet d’apprentissage automatique DeepMind affirment que leur réseau de neurones élimine cette erreur de la partie d’un électron et fait des prédictions plus précises que les méthodes DFT traditionnelles

« À la base, la DFT est une méthode de résolution de l’équation de Schrödinger. Sa précision est déterminée par sa partie échange-corrélation, qui est malheureusement inconnue. À ce jour, plus de 400 approximations distinctes pour cette partie ont été proposées », explique Petr Zhyliaev. , chercheur senior chez Skoltech.

« Une façon de construire une bonne partie d’échange-corrélation est de transférer des informations à son sujet à partir de méthodes numériques plus » avancées « que la théorie de la fonctionnelle de la densité, qui sont cependant des ordres de grandeur moins efficaces en termes de calcul. Dans leur travail, DeepMind a utilisé un neural réseau en tant qu’interpolateur universel pour apprendre la partie échange-corrélation de la fonctionnelle. Leur tentative n’était pas de loin la première, mais c’est l’une des plus ambitieuses.

DeepMind a construit une fonctionnelle de densité basée sur un réseau de neurones désignée sous le nom de DM21, formée sur des systèmes à électrons fractionnaires, tels qu’un atome d’hydrogène avec un demi-électron. Pour prouver sa supériorité, les auteurs ont testé DM21 sur un ensemble de dimères étirés (appelé ensemble BBB), par exemple, deux atomes d’hydrogène à grande distance avec un total d’un électron.

Comme prévu, la fonctionnelle DM21 montre une excellente performance sur l’ensemble de test BBB, dépassant de loin toutes les fonctionnelles DFT classiques testées et DM21m, entraînées de manière identique à DM21 mais sans les systèmes à électrons fractionnaires dans l’ensemble d’apprentissage.

Bien que cela puisse sembler que DM21 a compris la physique derrière les systèmes à électrons fractionnaires, un examen plus approfondi montre que tous les dimères de l’ensemble BBB deviennent très similaires aux systèmes de la rame. En effet, du fait de la localité des interactions électrofaibles, les interactions atomiques ne sont fortes qu’à de courtes distances, hors desquelles les deux atomes se comportent essentiellement comme s’ils n’interagissaient pas (voir figure ci-dessus).

« D’une certaine manière, les réseaux de neurones sont comme les humains : ils préfèrent obtenir la bonne réponse pour la mauvaise raison, puis l’inverse. Par conséquent, il n’est pas si difficile de former un réseau de neurones que de prouver qu’il a appris les lois physiques au lieu de mémoriser les bonnes réponses. Tester un réseau de neurones sur des systèmes qu’il a vus pendant la formation revient à examiner un écolier avec une tâche qu’il a vu un enseignant résoudre il y a à peine cinq minutes », explique Michael Medvedev, le chef de Groupe de chimie théorique à l’Institut Zelinsky de chimie organique de l’Académie russe des sciences.

Ainsi, l’ensemble de test BBB n’est pas approprié : il ne teste pas la compréhension du DM21 des systèmes d’électrons fractionnaires : le DM21 peut facilement s’en tirer avec la mémorisation. Une analyse approfondie des quatre autres preuves de la gestion DM21 de tels systèmes n’a pas non plus conduit à une conclusion décisive : seule sa bonne précision sur l’ensemble SIE4x4 peut être fiable, bien que même là, une tendance claire de la croissance des erreurs avec la distance suggère que DM21 n’est pas complètement exempt de problèmes avec les systèmes à électrons fractionnaires.

L’utilisation de systèmes à électrons fractionnaires dans l’ensemble d’apprentissage n’est pas la seule nouveauté dans les travaux de DeepMind. Leur idée d’introduire les contraintes physiques dans un réseau neuronal via l’ensemble d’entraînement, ainsi que l’approche pour imposer le sens physique par l’entraînement sur le potentiel chimique correct, sont susceptibles d’être largement utilisées dans la construction des fonctionnelles DFT du réseau neuronal à l’avenir.

Plus d’information:
Igor S. Gerasimov et al, Commentaire sur « Repousser les frontières des fonctionnelles de densité en résolvant le problème de l’électron fractionnaire, » La science (2022). DOI : 10.1126/science.abq3385

Fourni par l’Institut des sciences et technologies de Skolkovo

ph-tech