Bayesian detection of genetic associations for metabolic syndrome

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2009

Major/Subject

Laskennallinen tekniikka

Mcode

S-114

Degree programme

Language

en

Pages

xii + 64

Series

Abstract

The causes for common Mendelian diseases involving only one gene have been thoroughly studied and now the interest is to find connections between multiple genes in risk stratification. In this thesis the focus is on the methods used for detecting genetic associations. The biological background and the prevalent methods in genome wide association studies are reviewed. The found effects on disease risk are small and therefore analysis is demanding. In this thesis logistic regression model is considered, based on the binomially distributed data. Additive, dominant and recessive models of inheritance are used and the effect of different priors experimented. In this work traditional frequentist methods are compared with Bayesian inference. Results from the single-locus analysis ignore association between loci. However, analyzing all possible combinations of gene-gene interactions is computationally intractable. Therefore Markov chain Monte Carlo and evolutionary algorithms are used to sample from the model space and model averaging is used to search for variants that occur in favourable samples. The methods are compared and evaluated with a small simulated data set. Additionally, real world data depicting metabolic syndrome X is analyzed and the results evaluated. From chromosomes 5 and 11 the algorithms are able find multiple loci, which have been previously found to be associated with metabolic syndrome X or related diseases. Confirming the validity of previously unknown associated loci is complicated in any event.

Mendeliläiseen genomiikkaan perustuvien yleisten tautien, joihin vaikuttaa vain yksi geeni, syitä on tutkittu paljon ja nyt kiinnostuksen kohteena ovat yhteydet useiden geenien välillä riskien arvioinnissa. Tässä työssä keskitytään menetelmiin, joilla geneettisiä assosiaatioita havaitaan. Biologinen perusta ja vallitsevat käytännöt genominlaajuisissa assosiaatiotutkimuksissa käydään läpi. Havaitut vaikutukset tautiriskeihin ovat pieniä, joten analysointi on haastavaa. Tässä työssä käytetään logistista regressiomallia, joka pohjautuu binomijakautuneeseen aineistoon. Periytymismalleista käytetään additiivista, dominoivaa sekä resessiivistä mallia, ja lisäksi erilaisten priorien vaikutuksia kokeillaan. Tässä työssä perinteisiä frekventistisiä menetelmiä verrataan bayesilaiseen päättelyyn. Yhden lokuksen analyysin tuloksissa ei huomioida assosiaatioita lokuksien välillä. Kaikkien mahdollisten geeni-geeni vuorovaikutusten analysointi on kuitenkin laskennallisesti haastavaa. Tämän takia malliavaruudesta otetaan näytteitä Markov-ketju Monte Carlo -menetelmillä sekä evoluutioalgoritmilla, ja mallikeskiarvoistuksella etsitään muuttujia jotka esiintyvät hyvissä näytteissä. Menetelmiä verrataan ja arvioidaan pienellä simuloidulla havaintoaineistolla. Lisäksi metabolista syndroomaa kuvaava oikea havaintoaineisto analysoitiin ja saadut tulokset arvioitiin. Kromosomeista 5 ja 11 algoritmit löysivät useita lokuksia, joiden on aiemmissa tutkimuksissa havaittu liittyvän metaboliseen syndroomaan tai siihen liittyviin sairauksiin. Aikaisemmin havaitsemattomien assosioituneiden lokuksien oikeellisuuden varmistaminen on joka tapauksessa haastavaa.

Description

Supervisor

Lampinen, Jouko

Thesis advisor

Marttinen, Pekka

Keywords

Bayesian inference, bayesilainen päättely, genome wide association, genomilaajuiset assosiaatiot, Markov chain, Markov-ketju, evolutionary algorithm, Monte Carlo, evoluutioalgoritmi

Other note

Citation