Wie Wissenschaftler den Empfehlungsalgorithmus angewendet haben, um die Ankunftszeiten von CMEs zu antizipieren

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Koronale Massenauswürfe (CMEs) sind eruptive Sonnenereignisse. Sie werden oft mit Sonneneruptionen und Filamenten in Verbindung gebracht. CMEs können Weltraumwetterereignisse wie geomagnetische Stürme, hochenergetische Elektronenstürme, heiße Plasmainjektionen, ionosphärische Stürme und eine erhöhte Dichte in der oberen Atmosphäre verursachen.

Große CME-Ereignisse können sich auf Kommunikation, Navigationssysteme, Luftfahrtaktivitäten und sogar Stromnetze auswirken. Um potenzielle Schäden und Vermögensverluste zu vermeiden, muss die Ankunft der CMEs in zwei Teilen genau vorhergesagt werden. Wird der CME die Erde „treffen“ oder „verfehlen“? Wenn die Vorhersage „getroffen“ ist, lautet die nächste Frage, was die erwartete Ankunftszeit des CME ist.

In einer kürzlich erschienenen Forschungsarbeit in Raumfahrt: Wissenschaft & TechnologieYurong Shi vom National Space Science Center, Chinese Academy of Sciences, wandte den Empfehlungsalgorithmus an, der verwendet werden könnte, um Prognostikern ähnliche historische CME-Ereignisse zu empfehlen, um die Ankunftszeit von CMEs vorherzusagen, und bewies, dass Empfehlungsalgorithmus und logistische Regression zusammenwirken können um Prognostikern eine Option zur Verbesserung der Vorhersageergebnisse zu bieten.

Zunächst wurden Daten und Methodik aufbereitet. Der Autor wählte Proben aus insgesamt 30.321 CME-Ereignissen aus, die von 1996 bis 2020 aus dem SOHO/LASCO CME-Katalog gesammelt wurden. Oversampling wurde verwendet, um die unausgeglichenen Daten zu lösen, und es wurden 181 positive Proben (CMEs, die die Erde erreichten) und 3486 erhalten negative Proben (CMEs, die die Erde nicht erreicht haben).

Außerdem werden 8 charakteristische Parameter durch die Auswahl charakteristischer Parameter gesammelt, einschließlich Winkelbreite, Mittelpositionswinkel (CPA), Messpositionswinkel (MPA), Lineargeschwindigkeit, Anfangsgeschwindigkeit, Endgeschwindigkeit, Geschwindigkeit bei 20 Sonnenradien, Masse. Ein vollständiger und einheitlicher dimensionsloser Datensatz der 8 charakteristischen Parameter wurde erstellt und war bereit, die Entwicklung des Vorhersagemodells zu erleichtern. Um nach dem historischen Ereignis zu suchen, das dem angegebenen CME-Ereignis am ähnlichsten ist, verwenden die Autoren außerdem zwei Distanzen, die häufig beim maschinellen Lernen und der künstlichen Intelligenz des Computers verwendet werden: Kosinusdistanz und euklidische Distanz, die sich beide während des Experiments als gut erwiesen haben.

Anschließend wurde das Experiment, eine kontrollierte Studie, konzipiert. Die erste Stufe ist die Datenerhebung. Insgesamt 3.667 Proben mit 8 charakteristischen Parametern werden zufällig in zwei gleich große Untergruppen aufgeteilt. Eine (1.833 Proben) ist für das Krafttraining und die andere (1.834 Proben) für den anschließenden Empfehlungstest. Während der Krafttrainingsphase verwendete der Autor 1.466 Trainingsbeispiele, die als Trainingssatz dienten, um Gewichte sowohl nach dem logistischen Regressionsverfahren als auch nach dem Empfehlungsalgorithmus zu trainieren, während der Rest (367 Beispiele) als Validierungssatz diente.

Kurz gesagt werden insgesamt 6 Experimente durchgeführt, um Gewichte zu trainieren, und somit werden 6 Sätze von Gewichtungskoeffizienten erhalten, wobei 4 aus dem logistischen Regressionsalgorithmus und 2 aus dem Empfehlungsalgorithmus stammen. Zum Vergleich wurden zwei logistische Regressionssysteme angenommen. Eine davon war die Logit-Funktion, die im Python-basierten statsmodels-Modul bereitgestellt und als „sm.logit“ bezeichnet wird. Der andere, ebenfalls auf Python basierende, war der LogisticRegression-Klassifikator, der in der Bibliothek scikit-learn (sklearn) bereitgestellt und als „sk.LR“ bezeichnet wird.

Im Vergleich aller Modelle schnitt das sm.logit-Modell sowohl im Validierungsset als auch im Testset am besten ab. Es war sinnvoll, in dieser speziellen Arbeit im nächsten Schritt die Gewichte von sm.logit als optimale Gewichte zu wählen. Außerdem ist ersichtlich, dass das Trainieren der Gewichte charakteristischer Parameter mit den Empfehlungsalgorithmen sehr zeitaufwändig war, aber es war einfacher, die Gewichte durch logistische Regression zu erhalten. Daher wurde ein neuer Versuch unternommen, die durch die logistische Regression gewonnenen Gewichte auf den Empfehlungsalgorithmus anzuwenden. Die Durchführbarkeit einer solchen Operation wurde in der Endphase, der Empfehlungstestphase, getestet.

Zusammenfassend hat der Autor zunächst die Gewichte der charakteristischen Parameter von CMEs basierend auf logistischer Regression berechnet und sie dann in den Empfehlungsalgorithmus eingespeist, um die ähnlichsten historischen Ereignisse als Referenz für die CME-Effektivitätsprognose bereitzustellen. Es kann festgestellt werden, dass in jeder Fähigkeitsbewertung das Modell, das die Gewichte der logistischen Regression auf den Empfehlungsalgorithmus anwendet, besser war als das, das den Empfehlungsalgorithmus allein verwendet, sodass dieses Hybridmodell durchführbar war. Eine solche Behandlung vermied das Trainieren der Empfehlungsgewichte, um Zeit und Computerressourcen zu sparen.

Derzeit ist die Anwendung des Empfehlungsalgorithmus zur Vorhersage von CMEs in der Literatur sehr selten. Der Autor hat bewiesen, dass, sobald das logistische Regressionsmodell die Wirksamkeit für eine CME bestätigt, der Empfehlungsalgorithmus verwendet werden kann, um ähnliche historische Ereignisse zu empfehlen. Die Empfehlung ähnlicher historischer Ereignisse als anschauliche Referenz für Prognostiker ist eine große Verbesserung des Prognosedienstes im Gegensatz zu den binären „Ja“- oder „Nein“-Prognosen, die nur vom logistischen Regressionsmodell bereitgestellt werden. Weltraumwetterforscher können diese Methode möglicherweise nutzen, um eine vergleichende Analyse durchzuführen.

Mehr Informationen:
Yurong Shi et al, Auswirkungen von CMEs auf die Erde basierend auf logistischer Regression und Empfehlungsalgorithmus, Raumfahrt: Wissenschaft & Technologie (2022). DOI: 10.34133/2022/9852185

Bereitgestellt von Beijing Institute of Technology Press Co., Ltd

ph-tech