Generative Models for Analysing Longitudinal Data

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2024-03-11

Department

Major/Subject

Complex Systems

Mcode

SCI3060

Degree programme

Master’s Programme in Life Science Technologies

Language

en

Pages

61

Series

Abstract

Longitudinal data is a datatype that contains repeated observations of the same instances over a period of time. It arises in various fields, such as medical, social, and natural sciences. Observed data is often high-dimensional and partially observable. This makes it challenging to analyse with traditional methods. In this thesis, the potential usefulness of generative models to analyse such data is examined with two different experiments. In the first experiment, the capability of the longitudinal variational autoencoder (L-VAE) to predict adverse events in a biomedical setting is evaluated. In the second experiment, a novel model, Gaussian Process Mixture Variational Autoencoder (GPMVAE), is presented to predict unknown event subtypes. In both experiments, the results were promising and showed evidence for generative models to be valuable tools for analysing longitudinal data.

Longitudinaalinen data määritellään tietoaineistoksi, joka sisältää toistuvia havaintoja samoista tapahtumista tietyn ajanjakson aikana. Sitä esiintyy eri tieteenaloilla kuten lääketieteessä, yhteiskuntatieteessä sekä luonnontieteissä. Havainnoitu data on usein moniulotteista ja vain osittain havaittavissa. Tämä tekee siitä vaikeasti analysoitavan perinteisillä menetelmillä. Tässä opinnäytetyössä selvitetään kahdella eri kokeella generatiivisten mallien käyttökelpoisuutta tällaisen datan analysoinnissa. Ensimmäisessä kokeessa arvioidaan longitudinaalisen variational autoencoder-mallin (L-VAE) kykyä ennustaa haittatapahtumia biolääketieteellisestä datasta. Toisessa kokeessa esitellään uusi malli; Gaussian prosessinen yhdistelmä variaatioautoenkooderi (GPMVAE), mikä pyrkii löytämään tapahtumista tuntemattomia alatyyppejä. Molemmissa kokeissa tulokset olivat lupaavia ja antoivat näyttöä generatiivisten mallien hyödyllisyydestä longitudinaalisen datan analysoinnissa.

Description

Supervisor

Lähdesmäki, Harri

Thesis advisor

Lähdesmäki, Harri
Ögretir, Mine

Keywords

longitudinal data, generative models, Gaussian processes, deep learning

Other note

Citation