Harva Gaussinen prosessi spatiaalisessa epidemiologiassa

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorVehtari, Aki; TkT
dc.contributor.authorVanhatalo, Jarno
dc.contributor.departmentDepartment of Electrical and Communications Engineeringen
dc.contributor.departmentSähkö- ja tietoliikennetekniikan osastofi
dc.contributor.labLaboratory of Computational Engineeringen
dc.contributor.labLaskennallisen tekniikan laboratoriofi
dc.contributor.supervisorLampinen, Jouko; Prof.
dc.date.accessioned2011-12-08T09:15:00Z
dc.date.available2011-12-08T09:15:00Z
dc.date.issued2006
dc.description.abstractTässä diplomityössä esitetään hierarkinen Bayesilainen malli tautikartoituksen avuksi. Tautikartoitus on spatiaalisen epidemiologian osa-alue, jonka tavoitteena on tutkia terveysriskin maantieteellistä vaihtelua. Tavoitteena on kuvata taudin jakautumista kartalla ja korostaa alueita, joissa tauti- tai kuolemanriski ovat kohonneita. Tässä työssä käytetään kolmen hierarkiakerroksen mallia tutkimaan kuolleisuusriskin alueellisia vaihteluja kuolleisuusdatasta. Kuolleisuus tietyllä alueella mallinnetaan Poissonin prosessilla, jonka odotusarvo saadaan vakioidun kuolleisuusriskin ja suhteellisen riskin tulona. Kuolleisuusriski vakioidaan taustapopulaation ikä-, sukupuoli- ja koulutustasojakauman avulla. Suhteellisen riskin logaritmille annetaan prioriksi Gaussinen prosessi, joka tasoittaa riskipintaa ja lisää alueiden väliset korrelaatiot malliin. Gaussisen prosessin ongelmaksi muodostuu kovarianssimatriisin inversioon tarvittava aika, jota pienennetään tekemällä Gaussiselle prosessille harva aproksimaatio. Spatiaalisessa epidemiologiassa on tärkeää pystyä määrittämään tautiriskin alueellisen vaihtelun tilastollinen merkittävyys. Jotta mallin epävarmuusestimaateille saataisiin mahdollisimman hyvät arviot suoritetaan mallin parametrien ylitse integrointi Markov ketju Monte Carlo menetelmiä käyttäen. Gaussisen prosessin latenttien muuttujien näytteistämistä nopeutetaan muunnoksella, joka käyttää hyväkseen posteriorijakauman kovarianssin aproksimaatiota. Markov-ketju-näytteistäminen suoritetaan hybrid Monte Carlo -menetelmällä, jonka oleellinen osa on marginaaliuskottavuuden logaritmin gradienttien laskenta. Harvan aproksimaation tapauksessa gradientit lasketaan muodostamatta eksplisiittisesti täyttä kovarianssimatriisia. Työ esittelee latenttien muuttujien muunnoksen ja gradienttien laskennan toteutukset. Täyttä ja harvaa Gaussista prosessia käyttäviä malleja testataan kahteen kuolemansyydataan neljällä eri kovarianssifunktiolla, ja malleja verrataan keskenään käyttäen DIC-informaatiokriteeriä. Kuolemansyydatan analyysin tulokset esitetään kuolemanriskikarttoina.fi
dc.description.abstractThis thesis presents a hierarchical Bayesian model for disease mapping methodology. Disease mapping studies comprise spatial epidemiological methods to summarize the spatial variations in the incidence rate of diseases. The aim is to describe the overall disease distribution on a map and highlight areas of elevated or lowered mortality or morbidity risk. In this work, a three level hierarchical model is build to study the spatial variations in the relative mortality risk in an areally referenced health-care data. The mortality in an area is modeled as a Poisson process with mean intensity surface, which is a product of a standardized expected number of deaths and a relative risk. The expected number of deaths is evaluated using an age, gender and scholarly degree standardization. The logartihm of the relative risk is given a Gaussian process prior, which smoothes the risk surface and includes the spatial correlation between areas in the model. A problem in Gaussian processes is the computational burden of the required covariance matrix inversion. To overcome the computational problem a fully independent conditional sparse approximation is used. In spatial epidemiology it is very important to have good estimates whether the spatial variation is significant. To set a golden standard for the uncertainty estimates, both the hyperparameters and the latent values of Gaussian process are marginalized out using Markov chain Monte Carlo methods. The sampling of the latent values is sped up with transformations taking into account the approximate conditional posterior covariance. The sampling is conducted using hybrid Monte Carlo methods which require the gradients of the logarithm of marginal likelihood. The gradients of the sparse approximation are evaluated without forming the full covariance matrix. The work presents an implementation of the gradients and the transformation of latent values for the sparse approximation. The full and sparse Gaussian models, with four different covariance functions, are applied for two mortality data sets. The models are compared to each others with deviance information criterion and the results of the analysis are presented with maps revealing the relative risk.en
dc.format.extent91
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/937
dc.identifier.urnurn:nbn:fi:tkk-007345
dc.language.isoenen
dc.locationP1fi
dc.programmeElektroniikan ja sähkötekniikan koulutusohjelmafi
dc.programme.majorComputational engineeringen
dc.programme.majorLaskennallinen tekniikkafi
dc.programme.mcodeS-114
dc.publisherHelsinki University of Technologyen
dc.publisherTeknillinen korkeakoulufi
dc.rights.accesslevelopenAccess
dc.subject.keywordspatial epidemiologyen
dc.subject.keyworddisease mappingen
dc.subject.keywordsparse Gaussian processen
dc.subject.keywordBayesian inferenceen
dc.subject.keywordalueellinen epidemiologiafi
dc.subject.keywordtautikartoitusfi
dc.subject.keywordharva Gaussinen prosessifi
dc.subject.keywordBayesilainen päättelyfi
dc.subject.otherComputer scienceen
dc.titleHarva Gaussinen prosessi spatiaalisessa epidemiologiassafi
dc.titleSparse log Gaussian process in spatial epidemiologyen
dc.typeG2 Pro gradu, diplomityöfi
dc.type.dcmitypetexten
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotDiplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.publicationmasterThesis
local.aalto.digifolderAalto_38880
local.aalto.idinssi32764
local.aalto.openaccessyes
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
urn007345.pdf
Size:
1.36 MB
Format:
Adobe Portable Document Format