Predictive modelling of depression treatment outcomes using video game-based cognitive performance data

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2024-05-20

Department

Major/Subject

Bioinformatics and Digital Health

Mcode

SCI3092

Degree programme

Master’s Programme in Life Science Technologies

Language

en

Pages

46

Series

Abstract

An estimated 5% (3–7%) of the adult population suffer from major depressive disorder (MDD) globally. There are several effective treatments for MDD. However, there is no consistent method to find a suitable treatment and nearly a third (30.9%) of MDD patients suffer from treatment-resistant depression (TRD). The major reason for a lack of universally effective treatment is that MDD is a highly heterogeneous disease, meaning that symptom profiles and effective treatment are often individual. Machine learning applications could provide clinical tools for finding personalised treatments. Supervised classification algorithms have been tested with multiple data modalities predicting treatment outcome of MDD patients, but no clinical relevance has been achieved. MDD has been reported to be linked to mild cognitive impairment, and this has inspired research to find cognitive predictors for treatment outcome. However, currently, there are no studies that have investigated video game-based cognitive performance features for predicting treatment outcomes in digital therapeutic (DTx) interventions. This work investigated whether multidimensional behavioural cognitive performance data alongside symptom questionnaires could be used to predict the treatment outcomes of depression patients. This data was gathered from a video game-based DTx intervention. More precisely, data collected from the initial quarter of the intervention period were used to classify the change in the scores of the PHQ-9 questionnaire from the beginning to the end of the intervention. Analysis included a total of 108 depression patients and 125 features. Seven different classifiers were tested on the task, including logistic regression, support vector machine, K-neighbours, Naive Bayes, and three tree-based methods. Secondary research questions included which classifier achieved the highest performance and which cognitive domain showed the largest feature importance. Out of seven classifiers, logistic regression (accuracy 54.5%), support vector machine (accuracy 54%) and K-neighbours classifier (accuracy 52.6%) performed the best, but none of the classifiers achieved significant accuracy compared to chance level (p-value = 0.17 for logistic regression). The highest predictive strength was observed in features related to attention, cognitive control, processing speed and mental rotation.

Arviolta noin 5% (3–7%) aikuisväestöstä kärsii maailmanlaajuisesti masennuksesta. Masennukseen on olemassa useita toimivia hoitokeinoja. Kuitenkaan ei ole olemassa yleistä menetelmää sopivan hoidon löytämiseksi. Lähes kolmannes (30,9%) masennuspotilaista kärsii masennuksesta, joihin hoidot eivät tehoa. Pääasiallinen syy sille, ettei kaikille sopivaa hoitomuotoa ole, on masennuksen heterogeeninen luonne. Tämä tarkoittaa sitä, että masennukselle oireprofiilit ja toimiva hoito ovat usein yksilöllisiä. Koneoppimisalgoritmit voisivat tarjota työkaluja yksilöllisten hoitojen löytämiseksi. Ohjattuja luokittelualgoritmeja on kokeiltu useilla erilaisilla datamuodoilla ennustamaan masennuspotilaiden hoitovastetta, mutta kliinistä merkitystä ei ole saavutettu. Masennuksen on yhdistetty lievään kognitiiviseen heikentymiseen, ja tämä on ohjannut tutkimusta kokeilemaan kognitiivista suorituskykyä ennustamaan hoitovastetta. Kuitenkaan vielä ei ole kokeiltu videopeleihin perustuvista digitaalisista hoitomuodoista kerättyjä kognitiivisen suorituskyvyn muuttujia ennustamaan hoitotuloksia. Tässä työssä tutkittiin, voisiko moniulotteista kognitiivista suorituskykyä mittaavaa dataa yhdessä oirekyselyiden kanssa käyttää ennustamaan masennuspotilaiden hoitovastetta. Data kerättiin videopelimäisestä digitaalisesta hoitomuodosta. Hoitojakso oli kokonaisuudessaan 12 viikkoa. Ensimmäisen neljänneksen aikana kerättyjä tietoja käytettiin luokittelemaan PHQ-9-kyselylomakkeen kokonaispisteiden muutosta jakson alusta loppuun. Analyysiin sisällytettiin yhteensä 108 masennuspotilasta ja 125 muuttujaa. Työssä vertailtiin seitsemää eri luokittelualgoritmia, mukaan lukien logistinen regressio, tukivektorikone, K-naapurit, Naiivi Bayes ja kolme puupohjaista menetelmää: päätöspuu, satunnaismetsä ja gradienttitehostus. Toissijaisiin tutkimuskysymyksiin kuului, mikä luokittelija saavutti korkeimman suorituskyvyn ja minkä kognitiivisen osa-alueen muuttujat ovat merkittävimpiä ennustuksessa. Seitsemästä luokittelijasta parhaiten suoriutuivat logistinen regressio (tarkkuus 54,5%), tukivektorikone (tarkkuus 54%) ja K-naapurit luokittelija (tarkkuus 52,6%). Kuitenkaan yksikään luokittelijoista ei saavuttanut merkittävää tarkkuutta verrattuna sattumaan (p-arvo=0,17 logistiselle regressiolle). Merkittävimmät muuttujat ennustuksessa mittasivat tarkkaavaisuuden, kognitiivisen hallinnan, prosessointinopeuden ja mentaalisen rotaation osa-alueita.

Description

Supervisor

Palva, Matias

Thesis advisor

Juvonen, Joonas
Liu, Wenya

Keywords

depression, treatment outcome prediction, classification, video game

Other note

Citation