Exploring Latent Structure in Continuous Glucose Monitor Data

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2021-06-14
Department
Major/Subject
Bioinformatics and Digital Health
Mcode
SCI3092
Degree programme
Master’s Programme in Life Science Technologies
Language
en
Pages
65+5
Series
Abstract
Diabetes mellitus is a growing problem in both developing and developed countries, affecting the lives of over 422 million people worldwide. The traditional way of diagnosing and detecting diabetes has been using single time point measurements. However, the arrival of continuous glucose monitoring (CGM) systems has enabled access to the blood glucose time series. The blood glucose time series provided by CGM technology have been utilised in numerous use-cases such as forecasting blood glucose values and classifying diabetes via supervised learning methods, detecting abnormal patterns via unsupervised learning methods, and designing blood glucose control algorithms using reinforcement learning methods. This thesis explores the applicability of supervised learning methods for capturing the latent structure in an individual's blood glucose dynamics. Furthermore, we experiment with the usefulness of the captured latent structure in two use-cases, classification between subjects diagnosed with type 2 diabetes (T2D) and prediabetes and predicting blood sugar surges to a hyperglycemic level. Using CGM data from 62 subjects diagnosed with either T2D or prediabetes, we used Linear Regression and Kernel Regression to model blood glucose time series. After fitting the regression models, we extracted the regression coefficients and used them as a glucose profile vector characterising the latent structure in the blood glucose data. The extracted blood glucose profile was shown to improve performance in glycemic variability based T2D/prediabetes classification. In the hyperglycemia prediction, the glucose profile did not have a notable impact on the performance. Thesis results suggest that regression coefficients could capture relevant information about an individual's blood glucose dynamics, but further research and clinical validation is required due to the small sample size (N=62) and possible inaccuracies in the CGM technology. Furthermore, the achieved results should be compared with current medically validated methods for assessing blood glucose dynamics.

Diabetes mellitus on kasvava maailmanlaajuinen ongelma sekä kehittyneissä, että kehittyvissä maissa. Maailmanlaajuisesti diabetes mellitus vaikuttaa arviolta 422 miljoonan ihmisen elämään. Nykyinen tapa tunnistaa diabetes mellitus perustuu pääosin hetkittäisen verensokeriarvojen tarkasteluun, esimerkiksi oraaliseen glukoosikokeeseen ja paastoverensokeriin. Jatkuvan glukoosimonitoroinnin (CGM) myötä on kyetty tutkimaan myös yksilöiden verensokerin aikasarjoja. CGM-teknologian tuottamaa verensokeriaikasarjaa on hyödynnetty lukuisissa koneoppimisen sovelluksissa. Ohjatun oppimisen sovelluksia ovat olleet veren glukoositasojen ennustaminen, hyper- ja hypoglykemian ennustaminen ja diabeteksen diagnosointi. Ohjaamattomassa oppimisessa tutkimus on keskittynyt verensokeriaikasarjojen piilevän rakenteen tutkimukseen. Vahvistusoppimisessa tutkimus on keskittynyt verensokerin säätelyalgoritmien kehitykseen. Tässä diplomityössä tutkitaan ohjattujen oppimismenetelmien soveltuvuutta piilevän rakenteen tutkimiseen yksilön verensokerin dynamiikassa. Kokeellisessa osuudessa tutkimme piilevän rakenteen hyödyllisyyttä kahdessa käyttötapauksessa, tyypin 2 diabeetikoiden (T2D) ja esidiabeetikoiden luokittelussa ja hetkittäisen korkean verensokerin ennustuksessa. Hyödyntäen T2D tai esidiabetesdiagnoosin saaneiden koehenkilöiden monitorointidataa, käytimme lineaarisia regressiomalleja ja kernel-regressiota verensokerin aikasarjan mallintamiseen. Regressiomallien sovittamisen jälkeen erotimme malleista regressiokertoimet, joita käytimme yksilön verensokerin dynamiikan piilevää rakennetta kuvaavina verensokeriprofiilivektoreina. Erotettu verensokeriprofiili lisäsi tarkkuutta glykeemiseen vaihteluun perustuvassa T2D ja esidiabeetikoiden luokittelussa. Korkean verensokerin ennustamisessa verensokeriprofiili ei tuottanut merkittävää parannusta mallin suorituskykyyn. Diplomityön tulosten perusteella regressikertoimet voivat mahdollisesti sisältää merkityksellistä tietoa yksilön verensokerin käyttäytymisestä. Saatuja tuloksia tulee tarkastella kriittisesti pienen otoksen (N=62) ja CGM-teknologian mahdollisten epätarkkuuksien vuoksi. Lisäksi saatuja tuloksia tulisi verrata olemassa oleviin lääketieteellisiin glukoosin vaihtelevuuden arviointimenetelmiin.
Description
Supervisor
Rousu, Juho
Thesis advisor
Szedmak, Sandor
Hakaste, Liisa
Keywords
continuous glucose monitor, blood glucose, diabetes, prediabetes, supervised learning
Other note
Citation