Using machine learning to detect overtraining syndrome

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Electrical Engineering | Master's thesis

Department

Mcode

Language

en

Pages

94

Series

Abstract

Successful exercise training requires overloading that induces temporary performance decrements. With adequate recovery, functional overreaching enhances performance, while inadequate recovery leads to non-functional overreaching and, if prolonged, to overtraining syndrome (OTS). Currently, diagnosing OTS lacks reliable indicators and diagnostic criteria. Cardiopulmonary exercise testing (CPET) provides functional insight into the components of physical performance. However, interpreting the vast amounts of data produced on a breath-by-breath and beat-by-beat basis relies on heavy simplification leading to information loss. This study explores whether a machine (ML) or deep learning (DL) model utilizing breath-by-breath and/or beat-by-beat CPET data can detect active OTS, and whether it can detect it with higher accuracy and sensitivity than conventional CPET variables. A retrospective registry with 528 individuals (n=454 control, n=74 OTS) containing clinical, conventional CPET variables, breath-by-breath, and beat-by-beat CPET data collected at Helsinki Sports and Exercise Medicine Clinic, Helsinki, Finland, between 02/2008−04/2022, was analysed and randomly split into training and test sets (75/25 %). Several ML and DL models, based on literature, and their ensembles were optimized using grid search, Bayesian optimization, cross-validation, and an ablation study on feature, temporal, and their combination attention mechanisms. The tested models included support vector machine, random forest, gradient boosting, multilayer perceptron, convolutional neural network, long short-term memory recurrent neural network, and autoencoder. Model performance was evaluated using sensitivity, specificity, areas under precision-recall and receiver operating characteristic curves, positive and negative likelihood ratios, and F1 score. Integrating clinical data with breath-by-breath and beat-by-beat CPET data produced higher sensitivity (0.89) and lower negative likelihood ratio (0.16) than conventional CPET variables (0.63 and 0.46, respectively), with a comparable positive likelihood ratio (2.78 vs. 3.32). These findings demonstrate the clinical utility of analysing the entire CPET data and its potential in diagnosing OTS.

Tavoitteellinen fyysinen harjoittelu vaatii ylikuormitusta heikentäen hetkellisesti suorituskykyä. Riittävä lepo johtaa lyhytaikaiseen ylikuormitustilaan ja parantuneeseen suorituskykyyn, kun taas puutteellinen lepo johtaa pitkittyneeseen ylikuormitustilaan (OTS). Tällä hetkellä OTS:n diagnosointiin ei ole luotettavia indikaattoreita eikä diagnostista kriteeristöä. Spiroergometriassa tutkitaan laaja-alaisesti suorituskyvyn osatekijöitä. Spiroergometriatulosten tulkinta vaatii kuitenkin tuotetun henkäys henkäykseltä- ja lyönti lyönniltä -muotoisen datan merkittävää yksinkertaistamista, heikentäen sen hyödyntämistä. Tässä työssä tarkastellaan, onko henkäys henkäykseltä- ja/tai lyönti lyönniltä -dataa käyttävällä kone- (ML) tai syväoppimismallilla (DL) mahdollista tunnistaa aktiivinen OTS, ja onko se mahdollista tunnistaa herkemmin ja tarkemmin kuin tavanomaisilla spiroergometriamuuttujilla. Työssä analysoitiin 528 tutkittavaa (n=454 kontrolli, n=74 OTS) Helsingin urheilulääkäriasemalla aikavälillä 2/2008−4/2022 suoritetuista spiroergometrioista muodostetusta rekisteristä, joka sisälsi kliiniset tiedot, tavanomaiset spiroergometriamuuttujat ja henkäys henkäykseltä- sekä lyönti lyönniltä -datan. Tutkittavat jaettiin satunnaisesti harjoitus- ja testausaineistoon (75/25 %). Useita aikaisempiin tutkimuksiin perustuvia ML- ja DL-malleja sekä näiden yhdistelmiä optimoitiin ruudukkohaulla, Bayesialaisella optimoinnilla, ristiinvalidoinnilla sekä vertaamalla muuttuja-, aika- ja näiden yhdistelmähuomiomekanismeja. Malleihin kuuluivat tukivektorikone, satunnaismetsä, gradientti tehostus, monikerroksinen perseptroniverkko, konvoluutioneuroverkko, pitkä lyhytkestomuistineuroverkko sekä autoenkoodaaja. Mallien tehokkuutta arvioitiin herkkyydellä, tarkkuudella, erottelukyky- sekä sisäinen tarkkuus-herkkyyskäyrien alaisilla pinta-aloilla, positiivisilla (LR+) ja negatiivisilla todennäköisyyssuhteilla (LR-) sekä F1-arvolla. Kliinisen, henkäys henkäykseltä- ja lyönti lyönniltä -datan kokonaisvaltainen hyödyntäminen johti korkeampaan herkkyyteen (0,89) ja matalampaan LR-:seen (0,16) verrattuna tavanomaisiin spiroergometriamuuttujiin (0,63 ja 0,46) samalla, kun LR+ pysyi oleellisesti vastaavana (2,78 vs. 3,32). Löydökset osoittavat kokonaisvaltaisesti hyödynnetyn spiroergometriadatan kliinisen hyödyn sekä potentiaalin tunnistaa OTS.

Description

Supervisor

Särkkä, Simo

Thesis advisor

Rissanen, Antti-Pekka
Uusitalo, Arja

Other note

Citation