Probabilistic components of molecular interactions and drug responses

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Doctoral thesis (article-based) | Defence date: 2014-08-29
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2014

Major/Subject

Mcode

Degree programme

Language

en

Pages

78 + app. 92

Series

Aalto University publication series DOCTORAL DISSERTATIONS, 105/2014

Abstract

A fundamental question in medicine is how cancer and other complex diseases operate on the molecular level. Identifying the detailed mechanisms and interactions of how diseases progress and respond to drug treatments is essential for developing effective therapies. High-throughput molecular profiling technologies have provided vast amounts of measurement data of these phenomena. However, making sense of these masses of data is far from straightforward and requires advanced computational analysis methods. Probabilistic component models have been proven an effective tool in analysing and integrating high-dimensional and noisy molecular profiling data sources, such as gene expression. Such models can identify coherent components from the data, and interpreting these components provides insights about the underlying biological processes, such as disease progression and drug responses. In this thesis, probabilistic component models are applied and extended to identify and analyse molecular interaction and drug response patterns. Identifying functionally coherent gene modules from high-throughput measurements is a central task in many biomedical applications. In this thesis, an earlier component model for network data is extended for capturing functional modules from combinations of gene expression and protein interaction data. The identified modules provide hypotheses for novel molecular pathways and protein functions. High-throughput drug treatment measurements have made possible the detailed analysis of molecular drug responses and toxicity. In this thesis, probabilistic component models are applied to detect coherent drug response patterns from gene expression data. These patterns provide detailed insights to drug mechanisms of action and are highly applicable in cancer therapy development. Moreover, by associating the identified drug response components to toxicological outcomes, the first comprehensive view of molecular toxicogenomic responses is constructed with high performance in drug toxicity prediction.

Syövän ja muiden monimutkaisten tautien molekyylitason mekanismien selvittäminen on keskeinen ongelma lääketieteessä. Tautien yksityiskohtaisten leviämismekanismien ja lääkevasteiden tunnistaminen on tärkeää tehokkaiden hoitomenetelmien kehityksessä. Näistä ilmiöistä on kerätty suuria molekyylitason aineistoja uusien mittausmenetelmien avulla. Näiden aineistojen tehokas hyödyntäminen vaatii kehittyneitä laskennallisia analyysimenetelmiä. Tilastolliset komponenttimallit ovat osoittautuneet tehokkaaksi työkaluksi suuriulotteisten ja kohinaisten mittausaineistojen, kuten geeniekspressiodatan, analysoinnissa ja yhdistämisessä. Tällaisilla malleilla datasta voidaan tunnistaa komponentteja, joita tulkitsemalla saadaan uuttaa tietoa biologisista prosesseista, kuten tautien etenemisestä ja lääkevasteista. Tässä väitöskirjatyössä tilastollisia komponenttimalleja sovelletaan molekyylien vuorovaikutusten ja lääkevasteiden tunnistamiseen ja analysointiin. Toiminnallisten geenimoduulien tunnistaminen suurista mittausaineistoista on keskeinen tehtävä monissa biolääketieteen sovelluksissa. Tässä väitöskirjatyössä aiempaa vuorovaikutuskomponenttimallia laajennetaan geenimoduulien tunnistamiseen geeniekspressio- ja proteiinien vuorovaikutusaineistoja yhdistämällä. Tunnistetut moduulit auttavat yksittäisten proteiinien ja niiden vuorovaikutusketjujen toiminnan selvittämisessä. Perimänlaajuiset lääkealtistusmittaukset ovat mahdollistaneet lääkevasteiden ja toksisuuden yksityiskohtaisen tutkimuksen. Tässä väitöskirjatyössä komponenttimalleilla haetaan säännönmukaisia lääkevasteita geeniekspressioaineistoista. Tunnistetut vasteet antavat uutta tietoa lääkkeiden vaikutuksista ja niitä voidaan käyttää uusien syöpähoitojen kehittämiseen. Hakemalla tilastollisia yhteyksiä geeniekspressiovasteiden ja toksisuusmittausten välillä saadaan lisäksi kokonaiskuva lääkkeiden toksisuuteen liittyvistä molekyylitason vasteista ja mahdollistetaan lääkkeiden toksisuuden tehokas ennustaminen.

Description

Supervising professor

Kaski, Samuel, Prof., Aalto University, Department of Information and Computer Science, Finland

Keywords

Bayesian statistics, gene expression, machine learning, molecular medicine, probabilistic component models, toxicology, Bayesiläinen tilastotiede, geeniekspressio, koneoppiminen, molekyylilääketiede, tilastolliset komponenttimallit, toksikologia

Other note

Parts

  • [Publication 1]: Juuso A. Parkkinen and Samuel Kaski. Searching for functional gene modules with interaction component models. BMC Systems Biology, 4:4, 2010. doi:10.1186/1752-0509-4-4.
  • [Publication 2]: Juuso A. Parkkinen, Pekka Kohonen, Egon L. Willighagen, Rebecca Ceder, Krister Wennerberg, Samuel Kaski, Roland C. Grafström. Toxicogenomics-based probabilistic modelling enables prediction of dose-dependent toxicity. Submitted to a journal, 2014.
  • [Publication 3]: Juuso A. Parkkinen and Samuel Kaski. Probabilistic drug connectivity mapping. BMC Bioinformatics, 15:113, 2014. doi:10.1186/1471-2105-15-113.
  • [Publication 4]: Tommi Suvitaival, Juuso A. Parkkinen, Seppo Virtanen, Samuel Kaski. Cross-organism toxicogenomics with group factor analysis. Systems Biomedicine, 2:e29291, 2014. doi:10.4161/sysb.29291.
  • [Publication 5]: Juuso Parkkinen, Kristian Nybo, Jaakko Peltonen and Samuel Kaski. Graph Visualization With Latent Variable Models. In Proceedings of the Eighth Workshop on Mining and Learning with Graphs, Pages 94-101. ACM, New York, NY, USA, 2010. doi:10.1145/1830252.1830265.

Citation