Energie, Masse, Geschwindigkeit. Diese drei Variablen bilden Einsteins ikonische Gleichung E=MC2. Aber woher wusste Einstein überhaupt von diesen Konzepten? Ein erster Schritt zum Verständnis der Physik ist die Identifizierung relevanter Variablen. Ohne das Konzept von Energie, Masse und Geschwindigkeit könnte nicht einmal Einstein die Relativitätstheorie entdecken. Aber können solche Variablen automatisch entdeckt werden? Dies könnte die wissenschaftliche Entdeckung erheblich beschleunigen.
Diese Frage stellten Forscher von Columbia Engineering einem neuen KI-Programm. Das Programm wurde entwickelt, um physikalische Phänomene durch eine Videokamera zu beobachten und dann zu versuchen, nach dem minimalen Satz grundlegender Variablen zu suchen, die die beobachtete Dynamik vollständig beschreiben. Die Studie wurde am 25. Juli in veröffentlicht Naturinformatik.
Die Forscher begannen damit, das System mit rohem Videomaterial von Phänomenen zu füttern, für die sie bereits die Antwort kannten. Zum Beispiel speisten sie ein Video eines schwingenden Doppelpendels ein, von dem bekannt ist, dass es genau vier „Zustandsvariablen“ hat – den Winkel und die Winkelgeschwindigkeit jedes der beiden Arme. Nach ein paar Stunden Analyse lieferte die KI die Antwort: 4.7.
„Wir dachten, diese Antwort wäre nah genug“, sagte Hod Lipson, Direktor des Creative Machines Lab in der Fakultät für Maschinenbau, wo die Arbeit hauptsächlich durchgeführt wurde. „Vor allem, da die KI nur auf rohes Videomaterial zugreifen konnte, ohne jegliche Kenntnisse in Physik oder Geometrie. Aber wir wollten wissen, was die Variablen tatsächlich sind, nicht nur ihre Anzahl.“
Die Forscher fuhren dann fort, die tatsächlichen Variablen zu visualisieren, die das Programm identifizierte. Das Extrahieren der Variablen selbst war nicht einfach, da das Programm sie nicht intuitiv und für Menschen verständlich beschreiben kann. Nach einigem Nachforschen stellte sich heraus, dass zwei der vom Programm gewählten Variablen ungefähr den Winkeln der Arme entsprachen, aber die anderen beiden bleiben ein Rätsel.
„Wir haben versucht, die anderen Variablen mit allem und jedem zu korrelieren, was uns einfiel: Winkel- und Lineargeschwindigkeiten, kinetische und potentielle Energie und verschiedene Kombinationen bekannter Größen“, erklärte Dr. Boyuan Chen, jetzt Assistenzprofessor an der Duke University. der die Arbeit leitete. „Aber nichts schien perfekt zusammenzupassen.“ Das Team war zuversichtlich, dass die KI einen gültigen Satz von vier Variablen gefunden hatte, da sie gute Vorhersagen machte, „aber wir verstehen die mathematische Sprache, die sie spricht, noch nicht“, erklärte er.
Nachdem sie eine Reihe anderer physikalischer Systeme mit bekannten Lösungen validiert hatten, speisten die Forscher Videos von Systemen ein, für die sie die explizite Antwort nicht kannten. Die ersten Videos zeigten einen „Lufttänzer“, der sich vor einem örtlichen Gebrauchtwagenparkplatz bewegte. Nach einigen Stunden Analyse gab das Programm acht Variablen zurück. Ein Video einer Lavalampe produzierte ebenfalls acht Variablen. Dann speisten sie einen Videoclip mit Flammen aus einer Ferienkaminschleife ein, und das Programm gab 24 Variablen zurück.
Besonders interessant war die Frage, ob der Variablensatz für jedes System einzigartig war oder ob bei jedem Neustart des Programms ein anderer Satz erzeugt wurde.
„Ich habe mich immer gefragt, wenn wir jemals auf eine intelligente außerirdische Rasse gestoßen wären, hätten sie die gleichen physikalischen Gesetze entdeckt wie wir, oder könnten sie das Universum auf andere Weise beschreiben?“ sagte Lipson. „Vielleicht erscheinen einige Phänomene rätselhaft komplex, weil wir versuchen, sie mit dem falschen Satz von Variablen zu verstehen. In den Experimenten war die Anzahl der Variablen bei jedem Neustart der KI gleich, aber die spezifischen Variablen waren jedes Mal anders. Also ja, Es gibt alternative Möglichkeiten, das Universum zu beschreiben, und es ist durchaus möglich, dass unsere Entscheidungen nicht perfekt sind.“
Die Forscher glauben, dass diese Art von KI Wissenschaftlern helfen kann, komplexe Phänomene aufzudecken, für die das theoretische Verständnis mit der Datenflut nicht Schritt halten kann – Bereiche, die von der Biologie bis zur Kosmologie reichen. „Obwohl wir in dieser Arbeit Videodaten verwendet haben, könnte jede Art von Array-Datenquelle verwendet werden – beispielsweise Radar-Arrays oder DNA-Arrays“, erklärte Kuang Huang, Ph.D., der Co-Autor des Papiers.
Die Arbeit ist Teil des jahrzehntelangen Interesses von Qiang Du, Professor für Mathematik der Lipson and Fu Foundation, an der Entwicklung von Algorithmen, die Daten in wissenschaftliche Gesetze destillieren können. Frühere Softwaresysteme wie die Eureqa-Software von Lipson und Michael Schmidt konnten physikalische Gesetzmäßigkeiten freier Form aus experimentellen Daten destillieren, aber nur, wenn die Variablen im Voraus identifiziert wurden. Was aber, wenn die Variablen noch unbekannt sind?
Lipson, der auch James-und-Sally-Scapa-Professor für Innovation ist, argumentiert, dass Wissenschaftler viele Phänomene möglicherweise falsch interpretieren oder nicht verstehen, einfach weil sie keine guten Variablen haben, um die Phänomene zu beschreiben.
„Seit Jahrtausenden wussten die Menschen, dass sich Objekte schnell oder langsam bewegen, aber erst als die Begriffe Geschwindigkeit und Beschleunigung formal quantifiziert wurden, konnte Newton sein berühmtes Bewegungsgesetz F = MA entdecken“, bemerkte Lipson. Variablen, die Temperatur und Druck beschreiben, mussten identifiziert werden, bevor Gesetze der Thermodynamik formalisiert werden konnten, und so weiter für jeden Winkel der wissenschaftlichen Welt. Die Variablen sind ein Vorläufer jeder Theorie.
„Welche anderen Gesetze fehlen uns, nur weil wir die Variablen nicht haben?“ fragte Du, der die Arbeit mitleitete.
Das Papier wurde auch von Sunand Raghupathi und Ishaan Chandratreya mitverfasst, die halfen, die Daten für die Experimente zu sammeln.
Boyuan Chen et al, Automatisierte Entdeckung fundamentaler Variablen, die in experimentellen Daten verborgen sind, Naturinformatik (2022). DOI: 10.1038/s43588-022-00281-6