On statistical analysis and machine learning in prostate cancer research

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Doctoral thesis (article-based) | Defence date: 2022-04-29

Date

2022

Major/Subject

Mcode

Degree programme

Language

en

Pages

41 + app. 37

Series

Aalto University publication series DOCTORAL THESES, 45/2022

Abstract

The machine-learning age opens new opportunities for data analysis in multiple contexts spanning from business analytics and traffic control to weather forecasting and natural language processing. However, there might be untapped potential in biological and biomedical basic, clinical, andobservational research to apply these relatively new methodologies. In biomedicine, the research objectives are typically explored by classic frequentist statistics or descriptively explored whereas machine learning methodologies might still get overlooked. That is, the state-of-the-art in the analysis of biomedical data has not shifted towards machine learning. We explored the possibilities of machine learning in prostate cancer research and compared the results with classic frequentist method. In our analysis, machine learning was represented by random forests and classic frequentist method by Wilcoxon rank sum test, which were applied into same analysis problem and high-dimensional datasets. The inferences from these methods were concordant, that is, a researcher could arrive at same conclusion by using either method. While machine learning is still nascent technology, this suggests that it is ready to use in biomedical cancer research; however, whether biomedical cancer research is ready for machine learning remains to be seen.

Koneoppimisen aikakausi avaa uusia mahdollisuuksia digitaalisten aineistojen analysoinnille useissa viitekehyksissä aina liiketoiminta analytiikasta ja liikenteenohjauksesta säiden ennustamiseen ja luonnollisen kielen prosessointiin. Biologian ja biolääketieteen alalla saattaa yhä olla saavuttamatonta potentiaalia näiden kohtuullisen uusien koneoppimismenetelmien soveltamisessa. Biolääketieteessä tutkimustavoitteiden analyyttinen todistusaineisto saavutetaan tyypillisesti frekventistisen tilastotieteen ja kuvaavan tilastotieteen avulla, mutta koneoppismenetelmiä saatetaan vielä tällä hetkellä ylenkatsoa. Tämä tarkoittaa, että frekventistinen tilastollinen analyysi edustaa yhä viimeisintä teknologiaa biolääketieteellisten aineistojen analytiikassa, eikä se ole laajamittaisesti siirtynyt käyttämään koneoppimismenetelmiä. Me tutkimme koneoppimisen mahdollisuuksia eturauhassyöpätutkimuksessa ja vertasimme tuloksia keskenään frekventistisen tilastollisen analyysin avulla saatuihin tuloksiin. Analyysissämme koneoppimismenetelmää edusti satunnaismetsät ja klassista frekventististä menetelmää Wilcoxonin (merkittyjen) sijalukujen testi, joita sovellettiin samoihin analyyttisin ongelmiin ja suuriulottuvuuksisiin aineistoihin. Tulosten tulkinta ja päättely johtivat samoihin lopputuloksiin kumpaakin menetelmää käyttäen; tämä tarkoittaa, että tutkijan olisi mahdollista tehdä yhteneväiset johtopäätökset kummallakin menetelmällä. Huolimatta siitä, että koneoppiminen on teknologiana yhä aamunkoitossaan, tämä tulos viittaa siihen, että koneoppiminen on valmis sovellettavaksi biolääketieteessä. Jää nähtäväksi, että onko biolääketieteellinen tutkimus valmis koneoppimiselle.

Description

Supervising professor

Ilmonen, Pauliina, Prof., Department of Mathematics and Systems Analysis, Aalto University

Thesis advisor

Murtola, Teemu, Prof., Tampere University

Keywords

machine learning, statistical analysis, prostate cancer, koneoppiminen, tilastollinen analyysi, eturauhasyöpä

Other note

Parts

  • [Publication 1]: Raittinen, Paavo; Niemisto, Kati; Pennanen Erika; Syvalii, Heimo; Auriola, Seppo; Riikonen, Jarno; Lehtimaki Terho; Ilmonen, Pauliina & Murtola, Teemu. (2020). Circulatory and prostatic tissue lipidomic profiles shifts after high-dose atorvastatin use in men with prostate cancer. Scientific reports, 10, 12016.
    Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-202008064572
  • [Publication 2]: Raittinen, Paavo; Syvalii, Heimo; Tammela, Teuvo; Hakkinen, Merja; Ilmonen, Pauliina; Auriola, Seppo; Murtola, Teemu. 2021. Atorvastatin Induces Adrenal Androgen Downshift in Men with Prostate Cancer: a Post Hoc Analysis of a pilot Adaptive Randomised Clinical Trial. EBioMedicine.
    Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-202107017902
    DOI: 10.1016/j.ebiom.2021.103432 View at publisher
  • [Publication 3]: Vihervuori, Ville; Talala, Kirsi; Taari, Kimmo; Lahtela, Jorma; Tammela, Teuvo; Auvinen, Anssi; Raittinen, Paavo; Murtola, Teemu. (2021). Antidiabetic drugs and prostate cancer prognosis in a Finnish population-based cohort. Cancer Epidemiology and Prevention Biomarkers, 30(5), 982-989.
    DOI: 10.1158/1055-9965.EPI-19-0580 View at publisher

Citation