Forecasting Prescription Medication Utilization: A Comparative Study of SARIMA, Prophet, XGBoost and LSTM Models

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorBardhi, Ornela
dc.contributor.authorRipatti, Vili
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.schoolSchool of Scienceen
dc.contributor.supervisorLinna, Riku
dc.date.accessioned2025-03-17T18:02:55Z
dc.date.available2025-03-17T18:02:55Z
dc.date.issued2025-02-12
dc.description.abstractPredictive analytics in healthcare is essential for improving patient outcomes, managing limited resources, and addressing the growing complexities of drug demand and supply. Accurate forecasting of prescription drug utilization enables healthcare providers and policymakers to make informed decisions, reduce costs, and ensure timely availability of medications. This study evaluates the performance of four widely used forecasting models, SARIMA, Prophet, XGBoost, and LSTM, in 97 cardio-related ATC codes using a dataset from the Swedish National Board of Health and Welfare (2009–2023). The effectiveness of the models was compared by using root mean square error (RMSE), the mean absolute error (MAE), and the mean absolute percentage error (MAPE) as evaluation metrics. The results indicate that SARIMA consistently outperforms other models, accurately capturing seasonal patterns, abrupt shifts, and long-term trends, securing first place in three quarters of cases. LSTM demonstrated strong performance in handling datasets with nonlinear dependencies but occasionally struggled with abrupt trend shifts. XGBoost delivered moderate results, particularly for simpler datasets, yet struggled with high volatility, leading to reduced accuracy in unstable time series. Prophet, while robust to missing data, was less effective in capturing complex temporal dynamics, leading to higher errors in datasets with irregular trends. These findings underscore the importance of aligning model selection with dataset characteristics to optimize forecasting outcomes. By highlighting the strengths and limitations of these models, this research contributes to the growing body of knowledge on predictive modeling in healthcare, offering valuable insights for pen
dc.description.abstractTerveydenhuollossa käytettävät ennustemallit ovat keskeisen tärkeitä potilastulosten parantamiseksi, rajallisten resurssien hallitsemiseksi sekä lääkkeiden kysynnän ja tarjonnan kasvavien haasteiden ratkaisemiseksi. Reseptilääkkeiden määräämisen täsmällinen ennustaminen mahdollistaa terveydenhuollon toimijoiden sekä päättäjien tehdä tietoon perustuvia päätöksiä, vähentää kustannuksia sekä varmistaa lääkkeiden saatavuuden. Tässä tutkimuksessa arvioidaan neljän laajalti käytetyn ennustemallin – SARIMA:n, Prophet:in, XGBoost:in ja LSTM:n – suorituskykyä 97:ssä sydän- ja verisuonitauteihin liittyvässä ATC-koodissa hyödyntäen Ruotsin terveys- ja hyvinvointiviraston aineistoa vuosilta 2009–2023. Mallien onnistumista mitataan jäännösvirhehajonnalla (RMSE), keski-itseisvirheellä (MAE) sekä keskimääräisellä absoluuttisella virheellä (MAPE). Tulokset osoittavat, että SARIMA suoriutuu yksiselitteisesti muita malleja paremmin. SARIMA onnistuu mallintamaan tarkasti kausittaisia vaihteluita, äkillisiä muutoksia sekä pitkän aikavälin trendejä, saavuttaen parhaan sijan kolmessa neljäsosassa tapauksista. LSTM osoitti vahvaa suorituskykyä epälineaaristen riippuvuussuhteiden käsittelyssä, mutta kohtasi ajoittain haasteita äkillisten trendimuutosten kanssa. XGBoost tuotti kohtalaisia tuloksia erityisesti yksinkertaisemmissa aineistoissa, mutta kärsi korkean volatiliteetin aiheuttamista haasteista, mikä johti heikentyneeseen tarkkuuteen epävakaissa aikasarjoissa. Prophet, vaikkakin mukautuu tehokkaasti puuttuvaan dataan, oli heikko tulkitsemaan monimutkaisia ajallisen dynamiikan aikasarjoja. Tämä johti suuriin virheisiin aineistoissa, joissa oli epäsäännöllisiä trendejä. Nämä löydökset korostavat mallivalinnan ja aineiston ominaispiirteiden yhteensovittamisen merkitystä ennustetarkkuuden optimoimiseksi. Tuomalla esiin mallien vahvuudet ja rajoitteet tämä tutkimus kartuttaa terveydenhuollon ennustavan mallintamisen tietoperustaa, tarjoten arvokkaita näkemyksiä ammattilaisille, jotka pyrkivät tehostamaan lääkkeiden käytön hallintaan liittyvää päätöksentekoa.fi
dc.format.extent64
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/134569
dc.identifier.urnURN:NBN:fi:aalto-202503172817
dc.language.isoenen
dc.programmeMaster's Programme in Life Science Technologiesen
dc.programme.majorComplex Systemsen
dc.subject.keywordreseptilääkkeetfi
dc.subject.keywordennustaminenfi
dc.subject.keywordaikasarja-analyysifi
dc.subject.keywordkooneoppiminenfi
dc.subject.keywordhyperparametrien hienosäätöen
dc.subject.keywordeksogeeniset muuttujaten
dc.titleForecasting Prescription Medication Utilization: A Comparative Study of SARIMA, Prophet, XGBoost and LSTM Modelsen
dc.titleReseptilääkkeiden käytön ennustaminen: vertaileva tutkimus SARIMA-, Prophet-, XGBoost- ja LSTM-malleistafi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
master_Ripatti_Vili_2025.pdf
Size:
1.6 MB
Format:
Adobe Portable Document Format