On predicting performance in heart failure patients

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2022-08-23

Department

Major/Subject

Systems and Operations Research

Mcode

SCI3055

Degree programme

Master’s Programme in Mathematics and Operations Research

Language

en

Pages

55+3

Series

Abstract

Heart failure is one of the leading causes of death in western elderly populations. However, treatments for it are progressing continuously. Due to the more effective treatments, the life expectancy of heart failure patients is increasing. At the same time the elderly populations are growing, and the prevalence of heart failure is larger in elderly populations. These drivers together lead to the amount of heart failure patients growing in the future. A longer life, however, is not necessarily worthwhile, if the quality of life is not preserved simultaneously. One important factor in quality of life is the independent performance of the patients. Hence, it is crucial that also research on the performance of the patients is conducted. In this work, the performance of heart failure patients is predicted with a six-month prediction interval. The data used consists of elderly Finnish home care customers. The prediction model applied is a random forest classifier, which, as a machine learning algorithm, offers more flexibility compared to the traditional statistical methods. The performance of the random forest is compared to a simple reference model. Based on the results, we can state that the random forest performs slightly better than the reference model in binary classification, when compared with the AUC measure. In a more complicated task, e.g. multi-class classification or regression task, the advantage of the random forest might increase.

Sydämen vajaatoiminta on yksi johtavista kuolinsyistä länsimaisessa ikääntyneessä väestössä. Sen hoito kuitenkin kehittyy jatkuvasti, mikä johtaa pidempiin elinajanodotuksiin diagnoosin saaneilla. Ikääntyneiden määrä on myös kasvussa, ja sydämen vajaatoiminnan esiintyvyys on suurempi vanhemmissa ikäryhmissä. Edellä mainitut tekijät yhdessä johtavat siihen, että sydämen vajaatoimintapotilaiden määrä tulee kasvamaan tulevaisuudessa. Pidempi elämä ei kuitenkaan välttämättä ole arvokasta, mikäli potilaan elämänlaatua ei pystytä säilyttämään samanaikaisesti. Potilaan itsenäinen toimintakyky vaikuttaa suuresti elämänlaatuun. Siksi sydämen vajaatoimintapotilaiden toimintakyvyn tutkiminen on ensiarvoisen tärkeää. Tässä työssä pyritään ennustamaan sydämen vajaatoimintapotilaiden toimintakykyä kuuden kuukauden aikajänteellä. Aineisto koostuu ikääntyneistä suomalaisista kotihoidon asiakkaista. Ennustusmenetelmänä käytetään satunnaismetsää, joka tarjoaa koneoppimismenetelmänä enemmän joustavuutta verrattuna perinteisiin tilastollisiin menetelmiin. Satunnaismetsän ennustuskykyä verrataan yksinkertaiseen verrokkimalliin. Tuloksien perusteella voidaan todeta, että AUC-luvulla mitattuna satunnaismetsä tarjoaa hieman etua verrattuna yksinkertaiseen vertailumalliin, kun ennustustehtävä on binaarinen luokittelu. Vaikeammassa ennustustehtävässä, esimerkiksi regressio- tai moniluokkaisessa ennustuksessa, ero satunnaismetsän hyväksi saattaisi muodostua suuremmaksikin.

Description

Supervisor

Ilmonen, Pauliina

Thesis advisor

Nuutinen, Mikko

Keywords

machine learning, prediction, random forest, heart failure, performance, elderly

Other note

Citation