Eine Gruppe von Wissenschaftlern unter der Leitung des Leibniz-Instituts für Astrophysik Potsdam (AIP) und des Instituts für Kosmoswissenschaften der Universität Barcelona (ICCUB) hat ein neuartiges Modell des maschinellen Lernens verwendet, um Daten für 217 Millionen Sterne zu verarbeiten, die von der Gaia-Mission in einem beobachtet wurden äußerst effiziente Art und Weise.
Die Ergebnisse sind mit herkömmlichen Methoden zur Schätzung von Sternparametern konkurrenzfähig. Dieser neue Ansatz eröffnet spannende Möglichkeiten, Eigenschaften wie interstellare Extinktion und Metallizität in der gesamten Milchstraße zu kartieren und so zum Verständnis der Sternpopulationen und der Struktur unserer Galaxie beizutragen.
Mit der dritten Datenveröffentlichung der Gaia-Weltraummission der Europäischen Weltraumorganisation erhielten Astronomen Zugang zu verbesserten Messungen für 1,8 Milliarden Sterne, was eine riesige Datenmenge für die Erforschung der Milchstraße liefert.
Die effiziente Analyse eines so großen Datensatzes birgt jedoch Herausforderungen. In der Studie untersuchten die Forscher den Einsatz von maschinellem Lernen, um mithilfe der spektrophotometrischen Daten von Gaia wichtige Sterneigenschaften abzuschätzen. Das Modell wurde auf hochwertigen Daten von 8 Millionen Sternen trainiert und erzielte zuverlässige Vorhersagen mit geringen Unsicherheiten.
Die Arbeit ist veröffentlicht im Tagebuch Astronomie und Astrophysik.
„Die zugrunde liegende Technik, die als Extreme Gradient-Boosted Trees bezeichnet wird, ermöglicht die Schätzung präziser Sterneigenschaften wie Temperatur, chemische Zusammensetzung und interstellare Staubverdunkelung mit beispielloser Effizienz. Das entwickelte maschinelle Lernmodell SHBoost erledigt seine Aufgaben, einschließlich Modelltraining und Vorhersage, innerhalb von vier Stunden auf einer einzigen GPU – ein Prozess, der zuvor zwei Wochen und 3.000 Hochleistungsprozessoren erforderte“, sagt Arman Khalatyan vom AIP und Erstautor der Studie.
„Die Methode des maschinellen Lernens reduziert somit die Rechenzeit, den Energieverbrauch und den CO2-Ausstoß erheblich.“ Dies ist das erste Mal, dass eine solche Technik erfolgreich auf Sterne aller Art gleichzeitig angewendet wurde.
Das Modell trainiert mit hochwertigen spektroskopischen Daten aus kleineren Sterndurchmusterungen und wendet diese Erkenntnisse dann auf Gaias große dritte Datenveröffentlichung (DR3) an, wobei wichtige Sternparameter ausschließlich unter Verwendung photometrischer und astrometrischer Daten sowie der niedrig aufgelösten XP-Spektren von Gaia extrahiert werden.
„Die hohe Qualität der Ergebnisse reduziert den Bedarf an zusätzlichen ressourcenintensiven spektroskopischen Beobachtungen bei der Suche nach guten Kandidaten für weitere Studien, wie etwa seltene metallarme oder supermetallreiche Sterne, die für das Verständnis der frühesten Phasen von entscheidender Bedeutung sind.“ der Entstehung der Milchstraße“, sagt Cristina Chiappini vom AIP.
Diese Technik erweist sich als entscheidend für die Vorbereitung zukünftiger Beobachtungen mit Multiobjektspektroskopie, wie z. B. 4MIDABLE-LR, eine große Untersuchung der Galaktischen Scheibe und des Galaktischen Bulge, die Teil des 4MOST-Projekts am Europäischen Südobservatorium (ESO) sein wird. in Chile.
„Der neue Modellansatz liefert umfassende Karten der gesamten chemischen Zusammensetzung der Milchstraße und bestätigt die Verteilung junger und alter Sterne. Die Daten zeigen die Konzentration metallreicher Sterne in den inneren Regionen der Galaxie, einschließlich Balken und Bulge, mit enormem Ausmaß.“ statistische Aussagekraft“, fügt Friedrich Anders vom ICCUB hinzu.
Das Team nutzte das Modell auch, um junge, massereiche heiße Sterne in der gesamten Galaxie zu kartieren und dabei entfernte, wenig erforschte Regionen hervorzuheben, in denen sich Sterne bilden. Die Daten zeigen auch, dass es in unserer Milchstraße eine Reihe von „stellaren Hohlräumen“ gibt, also Bereiche, die nur sehr wenige junge Sterne beherbergen. Darüber hinaus zeigen die Daten, wo die dreidimensionale Verteilung des interstellaren Staubs noch schlecht aufgelöst ist.
Während Gaia weiterhin Daten sammelt, macht die Fähigkeit maschineller Lernmodelle, die riesigen Datensätze schnell und nachhaltig zu verarbeiten, sie zu einem unverzichtbaren Werkzeug für die zukünftige astronomische Forschung.
Der Erfolg des Ansatzes zeigt das Potenzial des maschinellen Lernens, die Big-Data-Analyse in der Astronomie und anderen wissenschaftlichen Bereichen zu revolutionieren und gleichzeitig nachhaltigere Forschungspraktiken zu fördern.
Weitere Informationen:
A. Khalatyan et al, Übertragung spektroskopischer Sternmarkierungen auf 217 Millionen Gaia DR3 XP-Sterne mit SHBoost, Astronomie und Astrophysik (2024). DOI: 10.1051/0004-6361/202451427. An arXiv: DOI: 10.48550/arxiv.2407.06963