Generative Models for Analysing Longitudinal Data
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2024-03-11
Department
Major/Subject
Complex Systems
Mcode
SCI3060
Degree programme
Master’s Programme in Life Science Technologies
Language
en
Pages
61
Series
Abstract
Longitudinal data is a datatype that contains repeated observations of the same instances over a period of time. It arises in various fields, such as medical, social, and natural sciences. Observed data is often high-dimensional and partially observable. This makes it challenging to analyse with traditional methods. In this thesis, the potential usefulness of generative models to analyse such data is examined with two different experiments. In the first experiment, the capability of the longitudinal variational autoencoder (L-VAE) to predict adverse events in a biomedical setting is evaluated. In the second experiment, a novel model, Gaussian Process Mixture Variational Autoencoder (GPMVAE), is presented to predict unknown event subtypes. In both experiments, the results were promising and showed evidence for generative models to be valuable tools for analysing longitudinal data.Longitudinaalinen data määritellään tietoaineistoksi, joka sisältää toistuvia havaintoja samoista tapahtumista tietyn ajanjakson aikana. Sitä esiintyy eri tieteenaloilla kuten lääketieteessä, yhteiskuntatieteessä sekä luonnontieteissä. Havainnoitu data on usein moniulotteista ja vain osittain havaittavissa. Tämä tekee siitä vaikeasti analysoitavan perinteisillä menetelmillä. Tässä opinnäytetyössä selvitetään kahdella eri kokeella generatiivisten mallien käyttökelpoisuutta tällaisen datan analysoinnissa. Ensimmäisessä kokeessa arvioidaan longitudinaalisen variational autoencoder-mallin (L-VAE) kykyä ennustaa haittatapahtumia biolääketieteellisestä datasta. Toisessa kokeessa esitellään uusi malli; Gaussian prosessinen yhdistelmä variaatioautoenkooderi (GPMVAE), mikä pyrkii löytämään tapahtumista tuntemattomia alatyyppejä. Molemmissa kokeissa tulokset olivat lupaavia ja antoivat näyttöä generatiivisten mallien hyödyllisyydestä longitudinaalisen datan analysoinnissa.Description
Supervisor
Lähdesmäki, HarriThesis advisor
Lähdesmäki, HarriÖgretir, Mine
Keywords
longitudinal data, generative models, Gaussian processes, deep learning