Machine Learning in Solar Flare Forecasting

No Thumbnail Available
Files
Ranta-Nilkku_Lauri_2023.pdf (1.02 MB)
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Bachelor's thesis
Electronic archive copy is available locally at the Harald Herlin Learning Centre. The staff of Aalto University has access to the electronic bachelor's theses by logging into Aaltodoc with their personal Aalto user ID. Read more about the availability of the bachelor's theses.
Date
2023-12-27
Department
Major/Subject
Tietotekniikka
Mcode
SCI3027
Degree programme
Teknistieteellinen kandidaattiohjelma
Language
en
Pages
22
Series
Abstract
Numerous studies have developed methods for solar flare forecasting; however, most of them provide differing predictions despite the same event of interest. This literature review evaluates the current state solar flare forecasting methods with an emphasis on machine learning techniques. The main finding are the multiple reasons to the sheer difficulty of accurately forecasting these rare events, such as the major class imbalance in the amount of strong and weak flares and the complex and dynamic nature of the Sun that often requires time-series forecasting techniques. New machine learning methods show increased accuracy and great potential in understanding complex patterns, but are greatly limited due to the complexity of implementing them as well as the poor data quality. The lack of an established performance assessment process and a shared benchmark dataset further hinder the progress due to the results from different studies being effectively incomparable. The creation and spread of such datasets and benchmarking practices as well as increased cross-disciplinary work between physicists and computer scientists are crucial next steps in improving the results from machine learning based solar flare forecasting models.

Auringonpurkausten eli roihujen ennustamiseen kehitetään jatkuvasti uusia malleja, mutta parhaidenkin mallien tuottamat ennusteet usein poikkeavat toisistaan. Tällöin on mahdotonta tietää, mihin ennusteeseen voi luottaa. Tilanne ei ole ongelmallinen ainoastaan roihujen operatiivisessa monitoroinnissa mutta myös uusien mallien kehittämisessä, sillä mallien ja niissä käytettyjen algoritmien laatua on vaikea vertailla keskenään. Tässä kirjallisuustutkimuksessa syvennytään arvioimaan roihujen ennustemallien nykytilaa sekä roihujen ennustamiseen liittyviä haasteita. Erityistä huomiota kiinnitetään koneoppimiseen perustuviin malleihin ja koneoppimistekniikoiden tuomiin uusiin haasteisiin. Roihujen ennustamisessa keskitytään lähinnä voimakkaiden roihujen ennustamiseen, sekä erityisesti niiden erottamiseen heikoista roihuista, sillä ainoastaan voimakkailla roihuilla on haitallinen vaikutus moderniin infrastruktuuriin. Kaikista roihuista vain muutama prosentti on edes keskivahvoja, mikä tuottaa ongelmia koneoppimismalleille, jotka toimivat paremmin ennustettavien luokkien ollessa tasapainossa. Koneoppimismalleja rajoittaa suuresti myös niiden ohjelmoinnin monimutkaisuus sekä kouluttamiseen käytettävien tietoaineistojen puutteellisuus ja epätarkkuus. Toisaalta koneoppimismallit ovat erityisen hyviä sisäistämään Auringon moniulotteista ja dynaamista luonnetta, mikä on aiheuttanut ongelmia perinteisemmille, tilastotieteisiin perustuville malleille. Perinteisemmät mallit ymmärtävät ainoastaan erikseen niille ohjeistettuja vuorovaikutuksia, eivätkä ne kykene hyödyntämään yhtä moniulotteista tietoa kuin koneoppimismallit. Vaikka uutta tutkimusta roihujen ennustamisesta tehdään taukoamatta, vakiintuneen suorituskyvyn arviointiprosessin sekä yhteisen tietoaineiston puuttuminen hidastavat konkreettista edistymistä merkittävästi. Tässä kirjallisuustutkimuksessa havittiin eri tutkimustulosten olevan käytännössä vertailukelvottomia, sillä pienetkin eriävät päätökset koneoppimismallien ohjelmoinnissa ja kouluttamisessa voivat johtaa erilaisiin tuloksiin. Yleisimmässä tapauksessa mallin kouluttamiseen käytettävä tietoaineisto muodostetaan tai esikäsitellään eri tavalla eri tutkimuksissa. Tämän jälkeen on mahdotonta tietää, mikä yksittäinen valinta aiheutti uudessa tutkimuksessa saavutetun suorituskyvyn, vai johtuvatko erot yksinkertaisesti tietoaineiston erilaisuudesta. Joissain tapauksissa ilmeisen hyvä suorituskyky voi myös olla kyseenalainen, sillä se riippuu paljon mallin arviointiin käytetystä prosessista. Ratkaisevia seuraavia askeleita koneoppimiseen perustuvien roihujen ennustemallien parantamiseksi ovatkin vakiintuneen arviointiprosessin ja yhteisen tietoaineiston käyttöönotto sekä monitieteinen yhteistyö fyysikoiden ja tietojenkäsittelytieteilijöiden välillä. Roihujen ennustaminen on monimutkainen ongelma, jonka ratkaisemiseen vaaditaan syvää tietämystä molemmilta tieteenhaaroilta.
Description
Supervisor
Savioja, Lauri
Thesis advisor
Weigt, Dale
Keywords
auringonpurkaus, roihu, koneoppiminen, ennustaminen, avaruussää
Other note
Citation