A probabilistic method for quantifying chromatin interactions

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorLähdesmäki, Harri
dc.contributor.authorHalla-aho, Viivi
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.supervisorLähdesmäki, Harri
dc.date.accessioned2015-11-19T10:57:47Z
dc.date.available2015-11-19T10:57:47Z
dc.date.issued2015-11-03
dc.description.abstractChromatin interactions have an important role in transcription regulation and therefore they can affect the function of the whole cell and the organism. To study chromatin interactions for better understanding of gene regulation, a method called Chromosome Interaction Analysis using Paired End Tags (ChIA-PET) has been developed. ChIA-PET is a high-resolution next-generation sequencing method for finding chromatin interactions which involve a protein of interest. ChIA-PET experiments give a list of putative interactions between two chromatin sites as a result. There are several experimental laboratory steps in ChIA-PET protocol which induce high level of background noise. The aim of this thesis is to construct a statistical model for identifying the true interactions from ChIA-PET interaction count data. First, the current methods for solving this task are reviewed. Then a new method combining a Bayesian mixture model with bias removal by Poisson regression is proposed. The model parameters are estimated by using Markov chain Monte Carlo methods. The new model is implemented on Matlab and tested on real ChIA-PET data sets. The results suggest that the proposed mixture model can quantify chromatin interactions and make good use of incorporated bias correcting. Comparison with two other methods, ChIA-PET Tool and Mango, shows that the mixture model results are partially the same as for the other two methods but there also also some interactions only found by the mixture model. Annotation analysis revealed that the mixture model results are in line with earlier research results.en
dc.description.abstractKromatiini-interaktiot ovat tärkeä tekijä geenien sääntelyssä ja tätä kautta koko solun ja eliön toiminnassa. Kromatiinin muodostamat silmukat tuovat transkription käynnistävät tekijät toistensa lähelle ja näin mahdollistavat proteiinien rakentamisen. Kromatiini-interaktioiden tutkimiseen on kehitetty erilaisia NGS-menetelmiä, joista yksi on Chromatin interaction analysis using paired end tags eli ChIA-PET. Tässä menetelmässä kromatiinisilmukat lukitaan paikoilleen ja pilkotaan niin, että lopputuloksena on lista yhdessä esiintyneistä DNA:n kohdista. ChIA-PET tyyppinen data sisältää kuitenkin oikeiden interaktioiden lisäksi runsaasti satunnaisesti toisiinsa kiinnittyneitä pätkiä, jotka tulisi erottaa oikeista havainnoista. Tämä työ esittelee jo olemassa olevat menetelmät tämän ongelman ratkaisemiseen. Sen jälkeen esitellään uusi menetelmä interaktioiden luokitteluun. Uusi menetelmä yhdistää bayeslaisen mikstuurimallin ja Poisson regression virhelähteiden poistoon. Mallin parametrien estimointiin käytetään bayeslaista analyysiä ja Markov Chain Monte Carlo -menetelmiä. Mallin toteutus tehtiin Matlabilla ja sitä testattiin ChIA-PET-aineistoon. Tulokset osoittavat, että mikstuurimalli pystyy erottelemaan kromatiini-interaktioita käyttäen hyväksi virhelähteiden korjausta. Vertailtaessa tuloksia ChIA-PET Tool ja Mango-ohjelmistojen kanssa huomataan, että mikstuurimalli löytää osaksi samoja ja osaksi eri interaktioita. Annotaatioanalyysin perusteella mikstuurimallin tulokset ovat linjassa aiempien tutkimustuloksien kanssa.fi
dc.format.extent75
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/18655
dc.identifier.urnURN:NBN:fi:aalto-201511205212
dc.language.isoenen
dc.programmeTeknillisen fysiikan ja matematiikan koulutusohjelmafi
dc.programme.majorSysteemi- ja operaatiotutkimusfi
dc.programme.mcodeF3008fi
dc.rights.accesslevelopenAccess
dc.subject.keywordchromatin interactionsen
dc.subject.keywordbayesian mixture modelen
dc.subject.keywordpoisson regressionen
dc.subject.keywordstatistical methodsen
dc.titleA probabilistic method for quantifying chromatin interactionsen
dc.titleProbabilistinen menetelmä kromatiini-interaktioiden määrittämiseenfi
dc.typeG2 Pro gradu, diplomityöen
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
dc.type.publicationmasterThesis
local.aalto.idinssi52552
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
master_Halla-aho_Viivi_2015.pdf
Size:
9.69 MB
Format:
Adobe Portable Document Format