Machine learning in Solar Flare Forecasting: Comparing a Long Short-Term Memory Network and a Three-Dimensional Convolutional Neural Network for Solar Flare Forecasting

Loading...
Thumbnail Image

Files

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.

Department

Major/Subject

Mcode

SCI3095

Language

en

Pages

21

Series

Abstract

The adverse effects of solar flares on space weather have been known for over a hundred years. Predicting the stronger flares is essential for mitigating their effects, which include, for example, radio blackouts, halts in satellite observations, and coronal mass ejections (CMEs). The prediction task is difficult due to the complicated nature of solar flares. However, machine learning (ML) models can be utilized to help with the task as there is an abundance of quasi-continuous data from the Sun. In this paper, I compare and analyze a long short-term memory (LSTM) network and a three-dimensional convolutional neural network (3D CNN) which are used to forecast whether an active region (AR) will produce a ≥C- or ≥M-class flare within the next 24 hours. The models are trained on the Space-weather HMI Active Region Patches (SHARP) data. Several performance metrics are used to assess the results, such as true skill statistic (TSS). The TSS scores for the ≥C (≥M) models are 0.612 and 0.756 (0.792 and 0.826) for the LSTM network and 3D CNN, respectively. Based on the TSS scores and other metrics, the 3D CNN models outperform the LSTM network models. I present possible reasons for the difference in performance, for example the uneven data split. I also suggest the following improvements for both models: the data imbalance problem should be addressed in the preprocessing phase; both magnetogram images and physical features could be trained on to improve prediction; and larger datasets spanning multiple solar cycles should be utilized.

Auringonpurkausten haitalliset vaikutukset avaruussäälle ovat olleet tiedossa jo yli sadan vuoden ajan. Voimakkaimpien auringonpurkausten ennustaminen on välttämätöntä niiden vaikutusten lieventämiseksi, joita ovat esimerkiksi radiopimennykset, satelliittihavaintojen pysähdykset ja koronan massapurkaukset. Ennustaminen on haastavaa auringonpurkausten monimutkaisuuden vuoksi. Koneoppimismalleja voidaan käyttää ennustamisen apuna, sillä auringosta on olemassa runsaasti näennäisjatkuvaa dataa. Tässä työssä verrataan pitkä lyhytkestomuistiverkkoa (LSTM) ja kolmiulotteista konvoluutioneuroverkkoa (3D CNN), joiden avulla ennustetaan, tuottaako aktiivinen alue ≥C- tai ≥M-luokan auringonpurkauksen seuraavan 24 tunnin aikana. Mallit ovat koulutettu Space-weather HMI Active Region Patches -datan avulla. Useita suoritusmittareita, kuten tositaitotunnuslukua (TSS), käytettiin tulosten arviointiin. 3D CNN:n ja LSTM:n TSS-pisteet ≥C-malleille (≥M-malleille) ovat 0,612 ja 0,756 (0,792 ja 0,826), edellä mainitussa järjestyksessä. TSS-pisteiden ja muiden mittareiden perusteella 3D CNN -mallit suoriutuvat LSTM-malleja paremmin. Tässä työssä esitetään mahdollisia eroja suorituseroihin, joita on esimerkiksi datan epätasainen jako. Työssä ehdotetaan lisäksi seuraavia parannuksia molemmille malleille. Datan luokkaepätasapaino-ongelma tulisi käsitellä esikäsittelyvaiheessa. Sekä magnetogrammikuvia että fyysisiä ominaisuuksia voitaisiin käyttää mallien kouluttamisessa ennustamisen parantamiseksi. Ennustamisessa tulisi käyttää suurempia tietoaineistoja, jotka kattavat useita auringonpilkkujaksona.

Description

Supervisor

Korpi-Lagg, Maarit

Thesis advisor

Weigt, Dale

Other note

Citation