Forecasting Prescription Medication Utilization: A Comparative Study of SARIMA, Prophet, XGBoost and LSTM Models

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Master's thesis

Department

Major/Subject

Mcode

Language

en

Pages

64

Series

Abstract

Predictive analytics in healthcare is essential for improving patient outcomes, managing limited resources, and addressing the growing complexities of drug demand and supply. Accurate forecasting of prescription drug utilization enables healthcare providers and policymakers to make informed decisions, reduce costs, and ensure timely availability of medications. This study evaluates the performance of four widely used forecasting models, SARIMA, Prophet, XGBoost, and LSTM, in 97 cardio-related ATC codes using a dataset from the Swedish National Board of Health and Welfare (2009–2023). The effectiveness of the models was compared by using root mean square error (RMSE), the mean absolute error (MAE), and the mean absolute percentage error (MAPE) as evaluation metrics. The results indicate that SARIMA consistently outperforms other models, accurately capturing seasonal patterns, abrupt shifts, and long-term trends, securing first place in three quarters of cases. LSTM demonstrated strong performance in handling datasets with nonlinear dependencies but occasionally struggled with abrupt trend shifts. XGBoost delivered moderate results, particularly for simpler datasets, yet struggled with high volatility, leading to reduced accuracy in unstable time series. Prophet, while robust to missing data, was less effective in capturing complex temporal dynamics, leading to higher errors in datasets with irregular trends. These findings underscore the importance of aligning model selection with dataset characteristics to optimize forecasting outcomes. By highlighting the strengths and limitations of these models, this research contributes to the growing body of knowledge on predictive modeling in healthcare, offering valuable insights for p

Terveydenhuollossa käytettävät ennustemallit ovat keskeisen tärkeitä potilastulosten parantamiseksi, rajallisten resurssien hallitsemiseksi sekä lääkkeiden kysynnän ja tarjonnan kasvavien haasteiden ratkaisemiseksi. Reseptilääkkeiden määräämisen täsmällinen ennustaminen mahdollistaa terveydenhuollon toimijoiden sekä päättäjien tehdä tietoon perustuvia päätöksiä, vähentää kustannuksia sekä varmistaa lääkkeiden saatavuuden. Tässä tutkimuksessa arvioidaan neljän laajalti käytetyn ennustemallin – SARIMA:n, Prophet:in, XGBoost:in ja LSTM:n – suorituskykyä 97:ssä sydän- ja verisuonitauteihin liittyvässä ATC-koodissa hyödyntäen Ruotsin terveys- ja hyvinvointiviraston aineistoa vuosilta 2009–2023. Mallien onnistumista mitataan jäännösvirhehajonnalla (RMSE), keski-itseisvirheellä (MAE) sekä keskimääräisellä absoluuttisella virheellä (MAPE). Tulokset osoittavat, että SARIMA suoriutuu yksiselitteisesti muita malleja paremmin. SARIMA onnistuu mallintamaan tarkasti kausittaisia vaihteluita, äkillisiä muutoksia sekä pitkän aikavälin trendejä, saavuttaen parhaan sijan kolmessa neljäsosassa tapauksista. LSTM osoitti vahvaa suorituskykyä epälineaaristen riippuvuussuhteiden käsittelyssä, mutta kohtasi ajoittain haasteita äkillisten trendimuutosten kanssa. XGBoost tuotti kohtalaisia tuloksia erityisesti yksinkertaisemmissa aineistoissa, mutta kärsi korkean volatiliteetin aiheuttamista haasteista, mikä johti heikentyneeseen tarkkuuteen epävakaissa aikasarjoissa. Prophet, vaikkakin mukautuu tehokkaasti puuttuvaan dataan, oli heikko tulkitsemaan monimutkaisia ajallisen dynamiikan aikasarjoja. Tämä johti suuriin virheisiin aineistoissa, joissa oli epäsäännöllisiä trendejä. Nämä löydökset korostavat mallivalinnan ja aineiston ominaispiirteiden yhteensovittamisen merkitystä ennustetarkkuuden optimoimiseksi. Tuomalla esiin mallien vahvuudet ja rajoitteet tämä tutkimus kartuttaa terveydenhuollon ennustavan mallintamisen tietoperustaa, tarjoten arvokkaita näkemyksiä ammattilaisille, jotka pyrkivät tehostamaan lääkkeiden käytön hallintaan liittyvää päätöksentekoa.

Description

Supervisor

Linna, Riku

Thesis advisor

Bardhi, Ornela

Other note

Citation