Gaussian processes in biostatistics: a case study of personal emergency link usage in Hong Kong

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorYip, Paul S.F.
dc.contributor.authorKnuuttila, Olli Juha
dc.contributor.departmentSähkö- ja tietoliikennetekniikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorSimula, Olli
dc.date.accessioned2020-12-05T11:05:47Z
dc.date.available2020-12-05T11:05:47Z
dc.date.issued2007
dc.description.abstractTässä diplomityössä on kaksi osaa. Ensimmäisessä osassa esitellään implementaatio harvasta gaussisesta prosessista käytettynä regressiossa. Neliöityä eksponentiaalista kovarianssifunktiota käytetään priorina toimivan gaussisen prosessin laskentaan. Likelihood- funktion määrittelyssä oletetaan prosessissa olevan riippumaton normaalijakautunut kohina. Jotta laskentaintensiteettiä saadaan alennettua, FITC harva aproksimaatio gaussisesta prosessista. Hyperparametrit estimoidaan maksimoimalla marginaalista likelihood-funktiota. Hongkongin ilmatieteen laitokselta (Hong Kong Observatory) sekä ympäristönsuojelu laitokselta (Environmental Protection Department) saatua säädataa käytetään Hongkongissa toimivan The Senior Citizen Home Safety Associationin (SCHSA) henkilökohtaisen hätäyhteyspalvelun päivittäisten hätäsoittojen määrän estimointiin. Toisessa osassa esitellään implementaatio harvaasta gaussisesta prosessista käytettynä luokittelussa. Malli koostuu priorista, jona toimii gaussinen prosessi, jonka laskemiseen on käytetty neliöityä eksponentiaalista kovarianssifunktiota, sekä probitti likelihood-funktiosta. Saatu posterior-funktio ei ole analyyttisesti ratkaistavissa ja siten sitä aproksimoidaan EP algoritmin avulla. Käyttämällä ahnetta algoritmia valitaan vain osa koko datasta laskentaa varten, näin laskennallisia vaatimuksia saadaan pudotetuksi. Hyperparametrit estimoidaan variaatiomenetelmällä; käytetään EP algoritmin antamaa aproksimaatiota variaatiojakaumana ja maksimoidaan marginaaliselle likelihood-funktiolle annettua alarajaa. EP algoritmia ja alarajan maksimointia vuorotellaan EM tyyppisen algoritmin tavoin. Kyseisestä menetelmästä käytetään (englannin kielisessä) kirjallisuudessa nimeä EM-EP. Luokittelun tavoitteena on estimoida riskiä kuolla itsemurhaan. Käytössä oleva data koostuu tiedoista, jotka koskevat kuolleita henkilökohtaisen hätäyhteyspalvelun käyttäjiä. Mikäli käyttäjä kuoli itsemurhan seurauksena, on siitä merkintä rekisterissä.fi
dc.format.extent93
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/95110
dc.identifier.urnURN:NBN:fi:aalto-2020120553944
dc.language.isoenen
dc.programme.majorInformaatiotekniikkafi
dc.programme.mcodeT-115fi
dc.rights.accesslevelclosedAccess
dc.subject.keywordsparse Gaussian process regressionen
dc.subject.keywordharva gaussinen prosessi regressiossafi
dc.subject.keywordsparce Gaussian process classificationen
dc.subject.keywordharva gaussinen prosessi luokittelussafi
dc.subject.keywordFITCen
dc.subject.keywordbayesilainen päättelyfi
dc.subject.keywordEM-EPen
dc.subject.keywordbiostatistiikkafi
dc.subject.keywordbayesian inferenceen
dc.subject.keywordhätäpuheluiden määrän estimointifi
dc.subject.keywordbiostatisticsen
dc.subject.keyworditsemurhariskin estimointifi
dc.subject.keywordestimation of emergency call frequencyen
dc.subject.keywordestimation of suicide risken
dc.titleGaussian processes in biostatistics: a case study of personal emergency link usage in Hong Kongen
dc.titleGaussiset prosessit biostatistiikassa: tapaustutkimus henkilökohtaisen hätäyhteyden käytöstä Hongkongissafi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_13819
local.aalto.idinssi35069
local.aalto.openaccessno

Files