Modeling cancer-associated transcriptional responses in cell-biological networks

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Master's thesis
Date
2010
Major/Subject
Informaatiotekniikka
Mcode
T-61
Degree programme
Language
en
Pages
[8] + 58
Series
Abstract
Modelling cell-biological processes as a network of interconnected modules instead of individual biochemical reactions and indentifying these modules with the help of gene expression data is an essential research topic in bioinformatics. A recent approach to improve identification of the modules is to merge network-based biological information with highthroughput gene expression measurements. In this thesis a method was devised to use metabolic pathways presented in generic BioPAX level 2 format to guide the analysis of transcriptional responses. The pathway data was used to construct a large network of interconnected biological features and to deduce the expected correlation of the features. The information was used to guide the genome-wide analysis of cancer-associated transcriptional responses with NetResponse algorithm. Exploratory factor analysis was used to model coherent transcriptional responses between the features. DNA microarray measurements of 191 uterine carcinoma samples and four control samples were analyzed. The method was able to find many coherently expressed groups of biological features that showed statistically significant differential expression between cancer and control samples and between cancer subtypes.

Solubiologisten prosessien kuvaaminen toisiinsa liittyvinä dynaamisina moduuleina yksittäisten biokemiallisten reaktioiden sijaan ja näiden moduulien tunnistaminen geeniekspression perusteella on olennainen tutkimuskohde bioinformatiikan alalla. Erilaisia verkkomuotoisia biologisia lähdeaineistoja voidaan käyttää apuna moduulien tunnistamisessa. Tässä diplomityössä toteutettiin menetelmä BioPAX level 2 -muodossa kuvattujen metaboliareittien hyödyntämiseen geeniekspression tutkimuksessa. Metaboliareittitietojen avulla koottiin laaja verkko solubiologisista toiminnoista sekä mallinnettiin toimintojen välillä odotettua vuorovaikutusta. Näitä tietoja käytettiin yhdessä NetResponse-algoritmin kanssa yhdenmukaisesti toimivien ryhmien tunnistamiseen geeniekspressioaineistosta. Yhdenmukaisesti ilmentyvät moduulit tunnistettiin faktorianalyysin avulla. Menetelmän avulla tutkittiin 191 kohtusyöpänäytteen ja neljän vertailunäytteen geenisirumittauksista koottua aineistoa. Aineistosta tunnistettiin useita solubiologisten toimintojen kokonaisuuksia, joiden geeniekspressio poikkesi yhdenmukaisesti syöpänäytteiden ja vertailunäytteiden sekä syövän eri alatyyppien välillä.
Description
Supervisor
Kaski, Samuel
Thesis advisor
Lahti, Leo
Keywords
bioinformatics, bioinformatiikka, factor analysis, faktorianalyysi, gene expression, geeniekspressio, metabolic pathways, metaboliareitit
Other note
Citation