Analysis of Selected In Silico Haplotyping Methods in Presence of Mission Genotype Data and Linkage Disequilibrium between Genetic SNP Markers

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2005

Major/Subject

Informaatiotekniikka

Mcode

T-115

Degree programme

Language

en

Pages

(13) + 87

Series

Abstract

Lisääntyneen SNP genotyyppi-datan saatavuuden ja geneettisissä assosiaatioanalyyseissä käytettävien haplotyyppien käytön myötä hyville haplotyyppausmenetelmille on tarvetta. Koska haplotyyppien kokeellinen määrittäminen (molecular haplotyping) on toistaiseksi vielä liian hidasta ja kallista, useita tietokonepohjaisia 'in silico' haplotyyppaysmenetelmiä on kehitetty haplotyyppien tilastolliseen estimointiin genotyyppi- ja perhedatasta. Tämän työn aiheena on tutkia neljää eri haplotyyppausmenetelmää vaihtelevien olosuhteiden kuten kytkentäepätasapainon ja puuttuvan genotyyppidatan suhteen. Työssä analysoitiin kahta väestöpohjaista Bayes MCMC-menetelmiin perustuvaa menetelmää implementoituina tietokoneohjelmiin PHASE 2.1.1 ja HAPLOTYPER 1.0. Lisäksi analysoitiin kahta perhepohjaista menetelmää implementoituina ohjelmiin GENEHUNTER 2.1 ja SIMWALK 2.91. Tässä työssä tutkittiin ainoastaan SNP-markkereista koostuvien haplotyyppien rakentamista. Käyttäen monipuolista menetelmää genotyyppi- ja perhedatan simulointiin havaittiin useita eroavaisuuksia ja erikoispiirteitä menetelmien suorituskyvyssä suhteessa eri parametreihin. Esimerkiksi väestöpohjaisten menetelmien suorituskyvyn havaittiin olevan hyvin riippuvainen LD:n määrästä väestössä, etenkin puuttuvalla genotyyppidatalla. Erot suorituskyvyissä pystyttiin selittämään esimerkiksi menetelmien erilaisilla a priori-oletuksilla haplotyyppifrekvensseistä. Perhepohjaisten menetelmien suorituskyvyn havaittiin olevan riippuvainen mm. lokusten välisestä rekombinaatiofraktiosta ja vanhempien genotyyppien olemassaolosta. Sellaisissa tapauksissa, joissa vanhempien genotyypit puuttui, havaittiin, että on suositeltavaa käyttää haplotyyppien estimointiin väestöpohjaista menetelmää kuten PHASE. Tulosten perusteella erilaisilla a priori-oletuksilla ja input-datan ominaisuuksilla voi olla suuri vaikutus haplotyyppauksen tarkkuuteen. Tutkijoiden tulisi olla tietoisia esimerkiksi markerien välisen kytkentätasapainon seurannaisvaikutuksista haplotyyppaustarkkuuteen geneettisiä tutkimuksia suunniteltaessa.

Description

Supervisor

Simula, Olli

Thesis advisor

Perola, Markus

Keywords

haplotyping, haplotyyppaus, linkage disequilibrium, kytkentäepätasapaino, mission genotypes, puuttuvat genotyypit, SNP, tietokonepohjainen haplotyyppien päättely, computer-based haplotype inference, PHASE, HAPLOTYPER, GENEHUNTER, SIMWALK

Other note

Citation