Exploring Latent Structure in Continuous Glucose Monitor Data

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2021-06-14

Department

Major/Subject

Bioinformatics and Digital Health

Mcode

SCI3092

Degree programme

Master’s Programme in Life Science Technologies

Language

en

Pages

65+5

Series

Abstract

Diabetes mellitus is a growing problem in both developing and developed countries, affecting the lives of over 422 million people worldwide. The traditional way of diagnosing and detecting diabetes has been using single time point measurements. However, the arrival of continuous glucose monitoring (CGM) systems has enabled access to the blood glucose time series. The blood glucose time series provided by CGM technology have been utilised in numerous use-cases such as forecasting blood glucose values and classifying diabetes via supervised learning methods, detecting abnormal patterns via unsupervised learning methods, and designing blood glucose control algorithms using reinforcement learning methods. This thesis explores the applicability of supervised learning methods for capturing the latent structure in an individual's blood glucose dynamics. Furthermore, we experiment with the usefulness of the captured latent structure in two use-cases, classification between subjects diagnosed with type 2 diabetes (T2D) and prediabetes and predicting blood sugar surges to a hyperglycemic level. Using CGM data from 62 subjects diagnosed with either T2D or prediabetes, we used Linear Regression and Kernel Regression to model blood glucose time series. After fitting the regression models, we extracted the regression coefficients and used them as a glucose profile vector characterising the latent structure in the blood glucose data. The extracted blood glucose profile was shown to improve performance in glycemic variability based T2D/prediabetes classification. In the hyperglycemia prediction, the glucose profile did not have a notable impact on the performance. Thesis results suggest that regression coefficients could capture relevant information about an individual's blood glucose dynamics, but further research and clinical validation is required due to the small sample size (N=62) and possible inaccuracies in the CGM technology. Furthermore, the achieved results should be compared with current medically validated methods for assessing blood glucose dynamics.

Diabetes mellitus on kasvava maailmanlaajuinen ongelma sekä kehittyneissä, että kehittyvissä maissa. Maailmanlaajuisesti diabetes mellitus vaikuttaa arviolta 422 miljoonan ihmisen elämään. Nykyinen tapa tunnistaa diabetes mellitus perustuu pääosin hetkittäisen verensokeriarvojen tarkasteluun, esimerkiksi oraaliseen glukoosikokeeseen ja paastoverensokeriin. Jatkuvan glukoosimonitoroinnin (CGM) myötä on kyetty tutkimaan myös yksilöiden verensokerin aikasarjoja. CGM-teknologian tuottamaa verensokeriaikasarjaa on hyödynnetty lukuisissa koneoppimisen sovelluksissa. Ohjatun oppimisen sovelluksia ovat olleet veren glukoositasojen ennustaminen, hyper- ja hypoglykemian ennustaminen ja diabeteksen diagnosointi. Ohjaamattomassa oppimisessa tutkimus on keskittynyt verensokeriaikasarjojen piilevän rakenteen tutkimukseen. Vahvistusoppimisessa tutkimus on keskittynyt verensokerin säätelyalgoritmien kehitykseen. Tässä diplomityössä tutkitaan ohjattujen oppimismenetelmien soveltuvuutta piilevän rakenteen tutkimiseen yksilön verensokerin dynamiikassa. Kokeellisessa osuudessa tutkimme piilevän rakenteen hyödyllisyyttä kahdessa käyttötapauksessa, tyypin 2 diabeetikoiden (T2D) ja esidiabeetikoiden luokittelussa ja hetkittäisen korkean verensokerin ennustuksessa. Hyödyntäen T2D tai esidiabetesdiagnoosin saaneiden koehenkilöiden monitorointidataa, käytimme lineaarisia regressiomalleja ja kernel-regressiota verensokerin aikasarjan mallintamiseen. Regressiomallien sovittamisen jälkeen erotimme malleista regressiokertoimet, joita käytimme yksilön verensokerin dynamiikan piilevää rakennetta kuvaavina verensokeriprofiilivektoreina. Erotettu verensokeriprofiili lisäsi tarkkuutta glykeemiseen vaihteluun perustuvassa T2D ja esidiabeetikoiden luokittelussa. Korkean verensokerin ennustamisessa verensokeriprofiili ei tuottanut merkittävää parannusta mallin suorituskykyyn. Diplomityön tulosten perusteella regressikertoimet voivat mahdollisesti sisältää merkityksellistä tietoa yksilön verensokerin käyttäytymisestä. Saatuja tuloksia tulee tarkastella kriittisesti pienen otoksen (N=62) ja CGM-teknologian mahdollisten epätarkkuuksien vuoksi. Lisäksi saatuja tuloksia tulisi verrata olemassa oleviin lääketieteellisiin glukoosin vaihtelevuuden arviointimenetelmiin.

Description

Supervisor

Rousu, Juho

Thesis advisor

Szedmak, Sandor
Hakaste, Liisa

Keywords

continuous glucose monitor, blood glucose, diabetes, prediabetes, supervised learning

Other note

Citation