Machine Learning for Precision Medicine

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Doctoral thesis (article-based) | Defence date: 2025-01-31

Date

2025

Major/Subject

Mcode

Degree programme

Language

en

Pages

107 + app. 97

Series

Aalto University publication series Docoral Theses, 8/2025

Abstract

Precision medicine is an emerging approach to healthcare that tailors prevention and treatment strategies by accounting for individual patient variability. Its implementation is becoming more feasible due to advances in the scalability and cost-effectiveness of various molecular profiling technologies, such as genomics, transcriptomics, proteomics, and metabolomics. These advances have expanded not only the amount of molecular data measurable from individuals but also the availability of large-scale datasets for research, creating opportunities to discover more effective treatments, identify disease biomarkers, and develop models for predicting disease risk. However, the sheer volume and complexity of these data necessitate advanced computational methods to extract meaningful and actionable insights for precision medicine. This dissertation develops and applies computational frameworks to address various aspects of precision medicine, including predicting the effects of drug combination treatments, utilizing metabolomic biomarkers in disease risk assessment, and improving the methodological aspects of disease risk prediction. The first publication presents a machine learning framework designed to predict the effects of drug combinations across varying doses, providing an improvement over existing methods by enabling precise dose-specific predictions. This method achieved highly accurate predictions and identified novel drug combination synergies, which were subsequently experimentally validated. This framework provides an efficient tool for systematic pre-screening of drug combinations, particularly to advance cancer treatments. The second set of publications expands the current understanding of blood biomarkers in disease risk prediction through the analysis of population-scale metabolomic data. These studies identified novel metabolomic biomarkers and highlighted their potential in predicting the risks of various diseases, including diseases where metabolomics had not previously been studied at scale. The final publication proposes a machine learning method aimed at improving time-toevent disease risk prediction by incorporating comprehensive interaction effects among predictor variables. This method demonstrated improved accuracy in risk prediction compared to standard methods across multiple diseases and different data sources, thereby supporting the development of more accurate tools for risk assessment. Taken together, the novel methods and biological insights presented in this dissertation advance the translation of molecular data into prevention and treatment strategies in precision medicine.

Täsmälääketiede on nouseva terveydenhuollon lähestymistapa, jonka tavoitteena on mukauttaa ennaltaehkäisy- ja hoitomenetelmiä yksilöllisten potilaserojen mukaisesti. Sen toteuttaminen on tullut yhä mahdollisemmaksi erilaisten molekyyliprofilointiteknologioiden, kuten genomiikan, transkriptomiikan, proteomiikan ja metabolomiikan, skaalautuvuuden ja kustannustehokkuuden edistymisen ansiosta. Nämä edistysaskeleet ovat paitsi laajentaneet yksilöistä mitattavissa olevien molekyylitietojen määrää, myös lisänneet suurten tietoaineistojen saatavuutta tutkimuskäyttöön. Tämä on puolestaan luonut mahdollisuuksia löytää tehokkaampia hoitoja, tunnistaa sairauksien biomarkkereita ja kehittää malleja sairastumisriskien ennustamiseksi. Näiden suurten ja monimutkaisten tietoaineistojen hyödyntäminen vaatii kuitenkin kehittyneitä laskennallisia menetelmiä, jotta niistä voidaan tuottaa merkityksellisiä ja käytännöllisiä ratkaisuja täsmälääketieteeseen. Tässä väitöskirjassa kehitetään ja sovelletaan laskennallisia menetelmiä täsmälääketieteen eri osa-alueille, kuten lääkeyhdistelmien hoitovaikutusten ennustamiseksi, metabolomisten biomarkkereiden hyödyntämiseksi sairastumisriskien arvioinnissa, sekä uusien menetelmien kehittämiseksi sairastumisriskien tarkempaan arviointiin. Ensimmäinen julkaisu esittelee koneoppimismenetelmän, joka on suunniteltu ennustamaan lääkeyhdistelmien vaikutuksia eri annostasoilla, mikä parantaa nykyisiä menetelmiä tarkkojen annoskohtaisten ennusteiden osalta. Tämä menetelmä osoitti erittäin korkeaa ennustustarkkuutta ja tunnisti uusia lääkeyhdistelmien synergioita, jotka vahvistettiin jälkikäteen kokeellisesti. Menetelmä tarjoaa siten tehokkaan tavan lääkeyhdistelmien järjestelmälliseen esiseulontaan ja tukee erityisesti yhdistelmähoitojen kehitystä syövän hoidossa. Toinen sarja julkaisuja laajentaa metabolomisiin biomarkkereihin pohjautuvaa näyttöä sairastumisriskien ennustamisessa hyödyntämällä väestötason metabolomiikkadataa. Nämä tutkimukset tunnistivat uusia metabolomisia biomarkkereita ja korostivat niiden potentiaalia erilaisten sairauksien riskien ennustamisessa, mukaan lukien sellaisten sairauksien, joissa metabolomiikkaa ei ole aiemmin tutkittu laajasti väestötasolla. Viimeisessä julkaisussa esitellään koneoppimismenetelmä, jonka tavoitteena on parantaa tapahtuma-aikaan perustuvaa sairastumisriskien ennustamista ottamalla kattavasti huomioon ennustemuuttujien keskinäiset vuorovaikutukset. Tämä menetelmä osoitti parantunutta tarkkuutta riskien ennustamisessa verrattuna tavanomaisiin menetelmiin useiden sairauksien ja eri tietolähteiden osalta, tukien siten tarkempien työkalujen kehittämistä sairastumisriskien arvioimiseksi. Yhteenvetona, tässä väitöskirjassa esitetyt uudet menetelmät ja biologiset löydökset edistävät molekyylitason tietojen jalostamista ennaltaehkäisy- ja hoitostrategioiksi täsmälääketieteessä.

Description

Supervising professor

Rousu, Juho, Prof., Aalto University, Department of Computer Science, Finland

Keywords

precision medicine, machine learning, predictive modelling, survival, analysis, risk prediction, metabolomics, drug combinations, täsmälääketiede, koneoppiminen, ennustava mallintaminen, elinaika-analyysi, riskien ennustaminen, metabolomiikka, lääkeyhdistelmät

Other note

Parts

  • [Publication 1]: Heli Julkunen, Anna Cicho´ nska, Prson Gautam, Sandor Szedmak, Jane Douat, Tapio Pahikkala, Tero Aittokallio, Juho Rousu. Leveraging multi-way interactions for systematic prediction of pre-clinical drug combination effects. Nature Communications, December 2020.
    DOI: 10.1038/s41467-020-19950-z View at publisher
  • [Publication 2]: Heli Julkunen, Anna Cicho´ nska, P. Eline Slagboom, Peter Würtz, Nightingale Health UK Biobank Initiative. Metabolic biomarker profiling for identification of susceptibility to severe pneumonia and COVID-19 in the general population. eLife, May 2021.
    DOI: 10.7554/eLife.63033 View at publisher
  • [Publication 3]: Heli Julkunen, Anna Cicho ´ nska, Mika Tiainen, Harri Koskela, Kristian Nybo, Valtteri Mäkelä, Jussi Nokso-Koivisto, Kati Kristiansson, Markus Perola, Veikko Salomaa, Pekka Jousilahti, Annamari Lundqvist, Antti J. Kangas, Pasi Soininen, Jeffrey C. Barrett, Peter Würtz. Atlas of plasma NMR biomarkers for health and disease in 118,461 individuals from the UK Biobank. Nature Communications, February 2023.
    DOI: 10.1038/s41467-023-36231-7 View at publisher
  • [Publication 4]: Nightingale Health Biobank Collaborative Group. Metabolomic and genomic prediction of common diseases in 700,217 participants in three national biobanks. Nature Communications, November 2024. List of authors in alphabetical order: Jeffrey C. Barrett, Tõnu Esko, Krista Fischer, Luke Jostins-Dean, Pekka Jousilahti, Heli Julkunen, Tuija Jääskeläinen, Antti Kangas, Nurlan Kerimov, Sini Kerminen, Anastassia Kolde, Harri Koskela, Jaanika Kronberg, Sara N. Lundgren, Annamari Lundqvist, Valtteri Mäkelä, Kristian Nybo, Markus Perola, Veikko Salomaa, Kirsten Schut, Maiju Soikkeli, Pasi Soininen, Mika Tiainen, Taavi Tillmann, Peter Würtz.
    DOI: 10.1038/s41467-024-54357-0 View at publisher
  • [Publication 5]: Heli Julkunen, Juho Rousu. Machine learning for comprehensive interaction modelling improves disease risk prediction in the UK Biobank. Submitted, July 2024. Available on medRxiv.
    DOI: 10.1101/2024.08.07.24311604 View at publisher

Citation