Sonneneruptionen sind Sonnenstürme, die durch Magnetfelder im Bereich der Sonnenaktivität ausgelöst werden. Wenn diese Flare-Strahlung in die Nähe der Erde gelangt, erhöht die Photoionisation die Elektronendichte in der D-Schicht der Ionosphäre, was zu einer Absorption von hochfrequenter Funkkommunikation, Szintillation von Satellitenkommunikation und verstärkten Hintergrundrauschinterferenzen mit Radar führt.
Statistiken und Erfahrungen zeigen, dass je größer die Eruption ist, desto wahrscheinlicher wird sie von anderen Sonnenausbrüchen wie einem solaren Protonenereignis begleitet und desto schwerwiegender sind die Auswirkungen auf die Erde, wodurch die Raumfahrt, Kommunikation, Navigation, Energieübertragung und beeinträchtigt werden andere technische Systeme.
Die Bereitstellung von Vorhersageinformationen über die Wahrscheinlichkeit und Intensität von Fackelausbrüchen ist ein wichtiges Element zu Beginn der operationellen Weltraumwettervorhersage. Die Modellstudie zur Vorhersage von Sonneneruptionen ist ein notwendiger Teil der genauen Vorhersage von Sonneneruptionen und hat einen wichtigen Anwendungswert. In einer kürzlich erschienenen Forschungsarbeit in Raumfahrt: Wissenschaft & TechnologieHong Chen vom College of Science, Huazhong Agricultural University, kombinierte den k-Means-Clustering-Algorithmus und mehrere CNN-Modelle, um ein Warnsystem zu entwickeln, das vorhersagen kann, ob in den nächsten 48 Stunden eine Sonneneruption auftreten wird.
Zunächst stellte der Autor die in der Arbeit verwendeten Daten vor und analysierte sie unter statistischen Gesichtspunkten, um eine Grundlage für das Design des Warnsystems für Sonneneruptionen zu schaffen. Um den Projektionseffekt zu reduzieren, wurde das Zentrum des aktiven Bereichs innerhalb von ±30° des Zentrums der Sonnenscheibe ausgewählt. Danach beschriftete der Autor die Daten gemäß den von NOAA bereitgestellten Sonneneruptionsdaten, einschließlich der Start- und Endzeiten der Eruptionen, der Nummer der aktiven Region, der Größe der Eruptionen usw.
Es gab ein ernsthaftes Ungleichgewicht zwischen der Anzahl positiver und negativer Proben im Datensatz. Um das Ungleichgewicht von positiven und negativen Proben zu mildern, wurde ein Prinzip gefunden, die Ereignisse auszuwählen, die so viele positive Proben wie möglich haben. Der Autor visualisierte die Wahrscheinlichkeitsdichteverteilung jedes Merkmals in allen negativen Proben und allen positiven Proben. Es konnte leicht festgestellt werden, dass die Wahrscheinlichkeitsdichteverteilungen der negativen Proben alle negativ schiefe Verteilungen waren und die Eigenschaften positiver Proben im Allgemeinen größer waren als die der negativen Proben. Somit war es möglich, Ereignisse mit positiven Stichproben anhand der Merkmalswerte jedes Ereignisses herauszufiltern.
Anschließend baute der Autor die gesamte Pipeline mit einer Methode, die die folgenden zwei Schritte umfasste: Datenvorverarbeitung und Modelltraining. Um die Datenvorverarbeitung durchzuführen, wurde K-Means, eine nicht überwachte Clustering-Methode, verwendet, um Ereignisse zu gruppieren, um Ereignisse, die nur negative Stichproben enthalten, so weit wie möglich zu verringern.
Nach k-Means-Clustering wurden alle Ereignisse in drei Kategorien eingeteilt, nämlich Kategorie A, Kategorie B und Kategorie C. Der Autor fand heraus, dass das Verhältnis positiver Proben in Kategorie C 0,340633 beträgt, was viel größer ist als das des gesamten Datensatzes. Daher wurden nur die Daten der Kategorie C als Eingabedaten für die nächste Stufe des Algorithmus ausgewählt.
In der zweiten Stufe waren die vom Autor verwendeten neuronalen Netze Resnet18, Resnet34 und Xception, die üblicherweise im Deep Learning verwendet werden. Drei Viertel der Proben in Kategorie C wurden zufällig ausgewählt. Bei jedem Ereignis handelte es sich um Trainingsdaten für die neuronalen Netzwerkmodelle, und der Rest der Proben wurde als Validierungsdaten im Prozess des Trainingsmodells betrachtet.
Um den Einfluss der Dimension zu vermeiden, standardisierte der Autor auch die Originaldaten. Die Standardisierungsmethode unterschied sich von den üblicherweise verwendeten. Gemäß der Standardisierungsberechnungsformel wurde, wenn das Etikett einer Probe von dem neuronalen Netzwerk als 1 vorhergesagt wurde, diese Probe als ein Signal einer Sonneneruption angesehen, die in den nächsten 48 Stunden auftreten würde. Aber wenn es auf 0 vorhergesagt wird, wäre die Wahrscheinlichkeit des Auftretens einer Sonneneruption in den nächsten 48 Stunden so gering, dass sie ignoriert werden könnte.
Anschließend führte der Autor Experimente durch und diskutierte die Ergebnisse. Der Autor gab zunächst eine Einführung in das experimentelle Setting und führte dann mehrere Ablationsexperimente und Vergleiche mit verschiedenen Modellen durch, um die Verbesserung des k-Means-Clustering-Algorithmus und der Boosting-Strategie zu verifizieren. Außerdem führte der Autor Vergleiche zwischen der im Experiment verwendeten Methode und anderen 13 binären Klassifizierungsalgorithmen durch, die üblicherweise verwendet werden, um ihre Vorhersageleistung zu präsentieren.
Die experimentellen Ergebnisse zeigten, dass die Vorhersageleistung des Modells, das mehrere neuronale Netze integriert, besser war als die eines einzelnen konvolutionellen neuronalen Netzes. Schließlich wurden die Vorhersageergebnisse von Resnet18, Resnet34 und Xception durch die Boosting-Strategie kombiniert. Bei allen Netzwerken kann der Rückruf nach dem Clustering unverändert oder sogar stark reduziert sein. Die Präzision musste jedoch deutlich zunehmen.
Nach dem Clustering würde zwar die Rate positiver Proben stark verbessert, von 5 % auf 34 %, jedoch würden auch fast 40 % der Informationen positiver Proben verloren gehen. Der Autor war der Ansicht, dass dies der Hauptgrund dafür war, dass die Erinnerung unverändert blieb oder sogar abnahm. Dies bedeutete auch, dass die Anzahl der im Experiment vorhergesagten positiven Proben geringer war als die ohne Clustering, aber die Wahrscheinlichkeit, dass eine vorhergesagte positive Probe ein echtes Positiv war, war höher.
Im Gegensatz zu dem Phänomen, dass die Vorhersageleistung anderer binärer Klassifikationsverfahren nach dem Clustering abnahm oder sogar sehr schlecht war, verbesserte sich die Leistung der Methode des Autors nach dem Clustering um mehr als 9%. Zusammenfassend bestand das zweistufige Frühwarnsystem für Sonneneruptionen aus einem unüberwachten Clustering-Algorithmus (k-means) und mehreren CNN-Modellen, wobei ersteres die positive Abtastrate erhöhen sollte und letzteres die Vorhersageergebnisse der CNN-Modelle integrierte um die Vorhersageleistung zu verbessern.
Die Ergebnisse des Experiments bewiesen die Wirksamkeit der Methode.
Jun Chen et al., Zweistufige Vorhersage von Sonneneruptionen basierend auf Convolutional Neural Networks, Raumfahrt: Wissenschaft & Technologie (2022). DOI: 10.34133/2022/9761567
Bereitgestellt von Beijing Institute of Technology Press Co., Ltd