Korkeaulotteisen ja kollineaarisen metabolomiikkadatan bayesilainen kaksisuuntainen analyysi
dc.contributor | Aalto-yliopisto | fi |
dc.contributor | Aalto University | en |
dc.contributor.advisor | Huopaniemi, Ilkka | |
dc.contributor.author | Suvitaival, Tommi | |
dc.contributor.school | Elektroniikan, tietoliikenteen ja automaation tiedekunta | fi |
dc.contributor.supervisor | Kaski, Samuel | |
dc.date.accessioned | 2012-03-06T13:53:23Z | |
dc.date.available | 2012-03-06T13:53:23Z | |
dc.date.issued | 2009 | |
dc.description.abstract | Kaksisuuntainen tehtävänasettelu on yleinen bioinformatiikan alalla. Tässä diplomityössä esitellään uusi bayesilaisen mallinnuksen menetelmä kaksisuuntaisen havaintoaineiston analysointiin. Menetelmä toimii myös vähän näytteitä sisältävillä korkeaulotteisilla havaintoaineistoilla. Havaintoaineiston oletetaan jakautuvan populaatioihin kovariaattien mukaan, jotka tyypillisessä biologisessa kokeessa ovat yksilön terveydentila, sukupuoli, lääketieteellinen hoito sekä yksilön ikä. Esiteltävä menetelmä on suunniteltu arvioimaan näiden kovariaattien vaikutus havaintoaineiston kontrolliryhmän perustasoon verrattuna. Menetelmä perustuu olettamukseen siitä, että havaintoaineiston piirteet muodostavat ryhmiä, joiden sisällä piirteet ovat voimakkaasti kollineaarisia. Tämä olettamus mahdollistaa piilomuuttajamalliin perustuvan dimensionaalisuuden pudotuksen, jonka ansiosta menetelmä on toimiva myös pienen näytemäärän havaintoaineistoille. Menetelmä käsittelee havaintoaineistoa täysin bayesilaisittain, Gibbsin otannan avulla. Bayesilainen lähestymistapa tuottaa arvion sekä mallin ja havaintoaineiston yhteisjakaumalle että mallin jokaisen parametrin marginaalijakaumalle. Tämä mahdollistaa tulosten epävarmuuden arvioinnin sekä vertailun toisiin malleihin. Uuden menetelmän toimivuutta esitellään metabolomiikan alalta olevan havaintoaineiston avulla. Aineisto sisältää lipidiprofiileja, jotka on mitattu terveistä lapsista ja lapsista, jotka myöhemmin sairastuvat tyypin 1 diabetekseen. Kahdessa erillisessä analyysissä tutkitaan sairauden ja sukupuolen sekä sairauden ja iän vaikutusta lipidiprofiileihin. | fi |
dc.description.abstract | Two-way experimental designs are common in bioinformatics. In this thesis, a new Bayesian model is proposed for the analysis of two-way data. The method also works for small sample-size data with a high number of features. The data set is assumed to be divided into populations according to covariates, which in the case of a typical biological experiment are the health status, the gender, the medical treatment and the age of the individual. The proposed method is designed to estimate the effect of these covariates compared to the ground level of a control group of the data. The method is based on the assumption that features of the data form groups that are highly collinear. This allows the use of a latent variable-based dimensionality reduction, which makes inference possible also for small sample-size data sets. The method treats the data in a completely Bayesian way, which produces an estimate for the joint distribution of the model and the data, and marginal posterior distributions of all model parameters. This allows one to evaluate the signicance and uncertainty of the results and to compare it to other models. Inference is carried out with Gibbs sampling. The performance of the new method is demonstrated with a metabolomic data set by comparing lipidomic profiles from children who remain healthy to those who will later develop type 1 diabetes. In two separate studies, the effect of the disease and gender, and the effect of the disease and time, are estimated. | en |
dc.format.extent | 7 + 59 | |
dc.format.mimetype | application/pdf | |
dc.identifier.uri | https://aaltodoc.aalto.fi/handle/123456789/3117 | |
dc.identifier.urn | URN:NBN:fi:aalto-201203071348 | |
dc.language.iso | en | en |
dc.location | P1 | fi |
dc.programme.major | Informaatiotekniikka | fi |
dc.programme.mcode | T-61 | |
dc.publisher | Helsinki University of Technology | en |
dc.publisher | Teknillinen korkeakoulu | fi |
dc.rights.accesslevel | openAccess | |
dc.subject.keyword | ANOVA | en |
dc.subject.keyword | Bayesian modelling | en |
dc.subject.keyword | factor analysis | en |
dc.subject.keyword | hierarchical model | en |
dc.subject.keyword | metabolomics | en |
dc.subject.keyword | small sample-size | en |
dc.subject.keyword | varianssianalyysi | fi |
dc.subject.keyword | bayesilainen mallitus | fi |
dc.subject.keyword | faktorianalyysi | fi |
dc.subject.keyword | hierarkinen malli | fi |
dc.subject.keyword | metabolomiikka | fi |
dc.subject.keyword | pieni näytemäärä | fi |
dc.title | Korkeaulotteisen ja kollineaarisen metabolomiikkadatan bayesilainen kaksisuuntainen analyysi | fi |
dc.title | Bayesian Two-Way Analysis of High-Dimensional Collinear Metabolomics Data | en |
dc.type | G2 Pro gradu, diplomityö | fi |
dc.type.dcmitype | text | en |
dc.type.okm | G2 Pro gradu, diplomityö | |
dc.type.ontasot | Diplomityö | fi |
dc.type.ontasot | Master's thesis | en |
dc.type.publication | masterThesis | |
local.aalto.digifolder | Aalto_37466 | |
local.aalto.idinssi | 38545 | |
local.aalto.openaccess | yes |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- urn100082.pdf
- Size:
- 959.16 KB
- Format:
- Adobe Portable Document Format