Probabilistic components of molecular interactions and drug responses
Loading...
URL
Journal Title
Journal ISSN
Volume Title
School of Science |
Doctoral thesis (article-based)
| Defence date: 2014-08-29
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2014
Major/Subject
Mcode
Degree programme
Language
en
Pages
78 + app. 92
Series
Aalto University publication series DOCTORAL DISSERTATIONS, 105/2014
Abstract
A fundamental question in medicine is how cancer and other complex diseases operate on the molecular level. Identifying the detailed mechanisms and interactions of how diseases progress and respond to drug treatments is essential for developing effective therapies. High-throughput molecular profiling technologies have provided vast amounts of measurement data of these phenomena. However, making sense of these masses of data is far from straightforward and requires advanced computational analysis methods. Probabilistic component models have been proven an effective tool in analysing and integrating high-dimensional and noisy molecular profiling data sources, such as gene expression. Such models can identify coherent components from the data, and interpreting these components provides insights about the underlying biological processes, such as disease progression and drug responses. In this thesis, probabilistic component models are applied and extended to identify and analyse molecular interaction and drug response patterns. Identifying functionally coherent gene modules from high-throughput measurements is a central task in many biomedical applications. In this thesis, an earlier component model for network data is extended for capturing functional modules from combinations of gene expression and protein interaction data. The identified modules provide hypotheses for novel molecular pathways and protein functions. High-throughput drug treatment measurements have made possible the detailed analysis of molecular drug responses and toxicity. In this thesis, probabilistic component models are applied to detect coherent drug response patterns from gene expression data. These patterns provide detailed insights to drug mechanisms of action and are highly applicable in cancer therapy development. Moreover, by associating the identified drug response components to toxicological outcomes, the first comprehensive view of molecular toxicogenomic responses is constructed with high performance in drug toxicity prediction.Syövän ja muiden monimutkaisten tautien molekyylitason mekanismien selvittäminen on keskeinen ongelma lääketieteessä. Tautien yksityiskohtaisten leviämismekanismien ja lääkevasteiden tunnistaminen on tärkeää tehokkaiden hoitomenetelmien kehityksessä. Näistä ilmiöistä on kerätty suuria molekyylitason aineistoja uusien mittausmenetelmien avulla. Näiden aineistojen tehokas hyödyntäminen vaatii kehittyneitä laskennallisia analyysimenetelmiä. Tilastolliset komponenttimallit ovat osoittautuneet tehokkaaksi työkaluksi suuriulotteisten ja kohinaisten mittausaineistojen, kuten geeniekspressiodatan, analysoinnissa ja yhdistämisessä. Tällaisilla malleilla datasta voidaan tunnistaa komponentteja, joita tulkitsemalla saadaan uuttaa tietoa biologisista prosesseista, kuten tautien etenemisestä ja lääkevasteista. Tässä väitöskirjatyössä tilastollisia komponenttimalleja sovelletaan molekyylien vuorovaikutusten ja lääkevasteiden tunnistamiseen ja analysointiin. Toiminnallisten geenimoduulien tunnistaminen suurista mittausaineistoista on keskeinen tehtävä monissa biolääketieteen sovelluksissa. Tässä väitöskirjatyössä aiempaa vuorovaikutuskomponenttimallia laajennetaan geenimoduulien tunnistamiseen geeniekspressio- ja proteiinien vuorovaikutusaineistoja yhdistämällä. Tunnistetut moduulit auttavat yksittäisten proteiinien ja niiden vuorovaikutusketjujen toiminnan selvittämisessä. Perimänlaajuiset lääkealtistusmittaukset ovat mahdollistaneet lääkevasteiden ja toksisuuden yksityiskohtaisen tutkimuksen. Tässä väitöskirjatyössä komponenttimalleilla haetaan säännönmukaisia lääkevasteita geeniekspressioaineistoista. Tunnistetut vasteet antavat uutta tietoa lääkkeiden vaikutuksista ja niitä voidaan käyttää uusien syöpähoitojen kehittämiseen. Hakemalla tilastollisia yhteyksiä geeniekspressiovasteiden ja toksisuusmittausten välillä saadaan lisäksi kokonaiskuva lääkkeiden toksisuuteen liittyvistä molekyylitason vasteista ja mahdollistetaan lääkkeiden toksisuuden tehokas ennustaminen.Description
Supervising professor
Kaski, Samuel, Prof., Aalto University, Department of Information and Computer Science, FinlandKeywords
Bayesian statistics, gene expression, machine learning, molecular medicine, probabilistic component models, toxicology, Bayesiläinen tilastotiede, geeniekspressio, koneoppiminen, molekyylilääketiede, tilastolliset komponenttimallit, toksikologia
Other note
Parts
- [Publication 1]: Juuso A. Parkkinen and Samuel Kaski. Searching for functional gene modules with interaction component models. BMC Systems Biology, 4:4, 2010. doi:10.1186/1752-0509-4-4.
- [Publication 2]: Juuso A. Parkkinen, Pekka Kohonen, Egon L. Willighagen, Rebecca Ceder, Krister Wennerberg, Samuel Kaski, Roland C. Grafström. Toxicogenomics-based probabilistic modelling enables prediction of dose-dependent toxicity. Submitted to a journal, 2014.
- [Publication 3]: Juuso A. Parkkinen and Samuel Kaski. Probabilistic drug connectivity mapping. BMC Bioinformatics, 15:113, 2014. doi:10.1186/1471-2105-15-113.
- [Publication 4]: Tommi Suvitaival, Juuso A. Parkkinen, Seppo Virtanen, Samuel Kaski. Cross-organism toxicogenomics with group factor analysis. Systems Biomedicine, 2:e29291, 2014. doi:10.4161/sysb.29291.
- [Publication 5]: Juuso Parkkinen, Kristian Nybo, Jaakko Peltonen and Samuel Kaski. Graph Visualization With Latent Variable Models. In Proceedings of the Eighth Workshop on Mining and Learning with Graphs, Pages 94-101. ACM, New York, NY, USA, 2010. doi:10.1145/1830252.1830265.