Analysis of Selected In Silico Haplotyping Methods in Presence of Mission Genotype Data and Linkage Disequilibrium between Genetic SNP Markers
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2005
Major/Subject
Informaatiotekniikka
Mcode
T-115
Degree programme
Language
en
Pages
(13) + 87
Series
Abstract
Lisääntyneen SNP genotyyppi-datan saatavuuden ja geneettisissä assosiaatioanalyyseissä käytettävien haplotyyppien käytön myötä hyville haplotyyppausmenetelmille on tarvetta. Koska haplotyyppien kokeellinen määrittäminen (molecular haplotyping) on toistaiseksi vielä liian hidasta ja kallista, useita tietokonepohjaisia 'in silico' haplotyyppaysmenetelmiä on kehitetty haplotyyppien tilastolliseen estimointiin genotyyppi- ja perhedatasta. Tämän työn aiheena on tutkia neljää eri haplotyyppausmenetelmää vaihtelevien olosuhteiden kuten kytkentäepätasapainon ja puuttuvan genotyyppidatan suhteen. Työssä analysoitiin kahta väestöpohjaista Bayes MCMC-menetelmiin perustuvaa menetelmää implementoituina tietokoneohjelmiin PHASE 2.1.1 ja HAPLOTYPER 1.0. Lisäksi analysoitiin kahta perhepohjaista menetelmää implementoituina ohjelmiin GENEHUNTER 2.1 ja SIMWALK 2.91. Tässä työssä tutkittiin ainoastaan SNP-markkereista koostuvien haplotyyppien rakentamista. Käyttäen monipuolista menetelmää genotyyppi- ja perhedatan simulointiin havaittiin useita eroavaisuuksia ja erikoispiirteitä menetelmien suorituskyvyssä suhteessa eri parametreihin. Esimerkiksi väestöpohjaisten menetelmien suorituskyvyn havaittiin olevan hyvin riippuvainen LD:n määrästä väestössä, etenkin puuttuvalla genotyyppidatalla. Erot suorituskyvyissä pystyttiin selittämään esimerkiksi menetelmien erilaisilla a priori-oletuksilla haplotyyppifrekvensseistä. Perhepohjaisten menetelmien suorituskyvyn havaittiin olevan riippuvainen mm. lokusten välisestä rekombinaatiofraktiosta ja vanhempien genotyyppien olemassaolosta. Sellaisissa tapauksissa, joissa vanhempien genotyypit puuttui, havaittiin, että on suositeltavaa käyttää haplotyyppien estimointiin väestöpohjaista menetelmää kuten PHASE. Tulosten perusteella erilaisilla a priori-oletuksilla ja input-datan ominaisuuksilla voi olla suuri vaikutus haplotyyppauksen tarkkuuteen. Tutkijoiden tulisi olla tietoisia esimerkiksi markerien välisen kytkentätasapainon seurannaisvaikutuksista haplotyyppaustarkkuuteen geneettisiä tutkimuksia suunniteltaessa.Description
Supervisor
Simula, OlliThesis advisor
Perola, MarkusKeywords
haplotyping, haplotyyppaus, linkage disequilibrium, kytkentäepätasapaino, mission genotypes, puuttuvat genotyypit, SNP, tietokonepohjainen haplotyyppien päättely, computer-based haplotype inference, PHASE, HAPLOTYPER, GENEHUNTER, SIMWALK