Astronomen wenden Techniken des maschinellen Lernens an, um in einem Meer von Daten Quasare aus dem frühen Universum zu finden

Quasare sind extrem leuchtkräftige galaktische Kerne, in denen Gas und Staub, die in ein zentrales supermassives Schwarzes Loch fallen, enorme Lichtmengen aussenden. Aufgrund ihrer außergewöhnlichen Helligkeit sind diese Objekte bei hohen Rotverschiebungen, also großen Entfernungen, sichtbar.

Eine höhere Rotverschiebung deutet nicht nur darauf hin, dass ein Quasar weiter entfernt ist, sondern auch, dass er weiter zurückliegt. Astronomen interessieren sich für die Erforschung dieser alten Objekte, weil sie Hinweise auf die Entwicklung unseres Universums in seiner frühen Jugend enthalten.

Kandidaten für Quasare mit hoher Rotverschiebung werden zunächst anhand ihrer Farbe identifiziert – sie sind sehr rot – und müssen dann als solche bestätigt werden, indem man sich einzelne Beobachtungen ihrer Spektren ansieht. Einige Kandidaten mit hoher Rotverschiebung können jedoch fälschlicherweise von weiteren Untersuchungen ausgeschlossen werden, da ihr Erscheinungsbild durch Gravitationslinsen verzerrt wird.

Dieses Phänomen tritt auf, wenn sich zwischen uns und einem entfernten Objekt ein massereiches Objekt, beispielsweise eine Galaxie, befindet. Die Masse der Galaxie krümmt den Raum und wirkt ein wenig wie eine Lupe. Dadurch wird der Weg des Lichts des entfernten Objekts gekrümmt, was zu einem verzerrten Bild des Objekts führt.

Diese Ausrichtung kann zwar von Vorteil sein – die Gravitationslinse vergrößert das Bild des Quasars, wodurch es heller und leichter erkennbar wird –, sie kann jedoch auch das Erscheinungsbild des Quasars täuschend verändern.

Störendes Licht von Sternen in der dazwischenliegenden Linsengalaxie kann den Quasar bläulicher erscheinen lassen, während die Krümmung der Raumzeit ihn verschmiert oder vervielfacht erscheinen lassen kann. Beide Effekte führen dazu, dass er als Quasarkandidat wahrscheinlich ausscheidet.

Ein Team von Astronomen unter der Leitung von Xander Byrne, Astronom an der Universität Cambridge und Hauptautor des Papier Präsentation dieser Ergebnisse im Monatliche Mitteilungen der Royal Astronomical Societyhatten sich zum Ziel gesetzt, die Linsenquasare wiederzuentdecken, die bei früheren Untersuchungen übersehen worden waren.

Byrne machte sich im umfangreichen Datenarchiv des Dark Energy Survey (DES) auf die Suche nach diesen fehlenden Schätzen. DES wurde mit der vom Department of Energy hergestellten Dark Energy Camera durchgeführt, die am 4-Meter-Teleskop Víctor M. Blanco am Cerro Tololo Inter-American Observatory der US-amerikanischen National Science Foundation montiert ist, einem Programm des NSF NOIRLab.

Die Herausforderung bestand also darin, eine Methode zu finden, um diese kosmischen Juwelen aus dem riesigen Ozean der Daten zu heben.

Der vollständige DES-Datensatz enthält mehr als 700 Millionen Objekte. Byrne reduzierte dieses Archiv, indem er die Daten mit Bildern aus anderen Durchmusterungen verglich, um unwahrscheinliche Kandidaten herauszufiltern, darunter Objekte, bei denen es sich wahrscheinlich um Braune Zwerge handelte, die, obwohl sie sich in fast jeder Hinsicht völlig von Quasaren unterscheiden, auf Bildern diesen überraschend ähnlich sehen können. Dieser Prozess ergab einen viel überschaubareren Datensatz mit 7.438 Objekten.

Byrne musste bei der Suche nach diesen 7.438 Objekten die Effizienz maximieren, wusste aber, dass herkömmliche Techniken die von ihm gesuchten Quasare mit hoher Rotverschiebung wahrscheinlich übersehen würden. „Um zu vermeiden, dass Quasare mit hoher Rotverschiebung vorzeitig aussortiert werden, haben wir einen Algorithmus für kontrastives Lernen angewendet, und der hat wunderbar funktioniert.“

Kontrastives Lernen ist eine Art Algorithmus der künstlichen Intelligenz (KI), bei dem sequenzielle Entscheidungen jeden Datenpunkt in eine Gruppe einordnen, je nachdem, was er ist oder nicht ist. „Es mag wie Zauberei erscheinen“, sagte Byrne, „aber der Algorithmus verwendet nicht mehr Informationen als das, was bereits in den Daten vorhanden ist. Beim maschinellen Lernen geht es darum, herauszufinden, welche Datenbits nützlich sind.“

Byrnes Entscheidung, sich nicht auf die visuelle Interpretation durch den Menschen zu verlassen, brachte ihn dazu, einen unbeaufsichtigten KI-Prozess in Betracht zu ziehen, was bedeutet, dass der Algorithmus selbst den Lernprozess steuert und nicht ein Mensch.

Überwachte maschinelle Lernalgorithmen basieren auf einer sogenannten „Ground-Level Truth“, die von einem menschlichen Programmierer definiert wird. Der Prozess könnte beispielsweise mit der Beschreibung einer Katze beginnen und Entscheidungen wie „Dies ist/ist kein Bild einer Katze. Dies ist/ist kein Bild einer schwarzen Katze“ durchlaufen.

Im Gegensatz dazu verlassen sich unbeaufsichtigte Algorithmen nicht auf diese anfängliche, vom Menschen festgelegte Definition als Grundlage für ihre Entscheidungen. Stattdessen sortiert der Algorithmus jeden Datenpunkt nach Ähnlichkeiten mit den anderen Datenpunkten im Satz. In diesem Fall würde der Algorithmus Ähnlichkeiten zwischen Bildern mehrerer Tiere finden und sie als Katze, Hund, Giraffe, Pinguin usw. gruppieren.

Ausgehend von Byrnes 7.438 Objekten sortierte der unbeaufsichtigte Algorithmus die Objekte in Gruppen. Das Team bediente sich einer geographischen Analogie und bezeichnete die Datengruppierungen als Archipel. (Der Begriff impliziert keine räumliche Nähe zwischen den Objekten. Es sind ihre Eigenschaften, die sie „nahe“ beieinander gruppieren, nicht ihre Positionen am Himmel.)

Innerhalb dieses Archipels wurde eine kleine „Insel“-Untergruppe von Objekten als mögliche Quasarkandidaten zusammengefasst. Unter diesen Kandidaten stachen vier wie Edelsteine ​​aus einem Kieselhaufen hervor.

Mithilfe von Archivdaten des Gemini-Süd-Teleskops, einer Hälfte des Internationalen Gemini-Observatoriums, das vom NSF NOIRLab betrieben wird, bestätigte Byrne, dass drei der vier Kandidaten auf der „Quasarinsel“ tatsächlich Quasare mit hoher Rotverschiebung sind. Und einer davon ist höchstwahrscheinlich die kosmische Beute, die Byrne zu finden hoffte – ein gravitativ linsenförmiger Quasar mit hoher Rotverschiebung. Das Team plant nun weitere Aufnahmen, um die linsenförmige Natur des Quasars zu bestätigen.

„Wenn sich die Entdeckung eines einzigen linsenförmigen Quasars in einer Stichprobe von vier Zielen bestätigt, wäre die Erfolgsquote bemerkenswert hoch! Und wenn diese Suche mit Standardsuchmethoden durchgeführt worden wäre, wäre dieses Juwel wahrscheinlich verborgen geblieben.“

Byrnes Arbeit ist ein cleveres Beispiel dafür, wie KI Astronomen bei der Suche in immer größeren Datenschätzen helfen könnte. In den kommenden Jahren werden massive Zuflüsse astronomischer Daten erwartet, und zwar mit der laufenden fünfjährigen Untersuchung des Dark Energy Spectroscopic Instrument sowie mit der bevorstehenden Legacy Survey und Space and Time, die ab 2025 vom Vera C. Rubin Observatory durchgeführt werden.

Mehr Informationen:
Xander Byrne et al, Quasar Island – drei neue z ∼ 6 Quasare, darunter ein linsenförmiger Kandidat, identifiziert mit kontrastivem Lernen, Monatliche Mitteilungen der Royal Astronomical Society (2024). DOI: 10.1093/mnras/stae902

Zur Verfügung gestellt von NSFs NOIRLab

ph-tech