Gaussian processes in biostatistics: a case study of personal emergency link usage in Hong Kong

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2007
Major/Subject
Informaatiotekniikka
Mcode
T-115
Degree programme
Language
en
Pages
93
Series
Abstract
Tässä diplomityössä on kaksi osaa. Ensimmäisessä osassa esitellään implementaatio harvasta gaussisesta prosessista käytettynä regressiossa. Neliöityä eksponentiaalista kovarianssifunktiota käytetään priorina toimivan gaussisen prosessin laskentaan. Likelihood- funktion määrittelyssä oletetaan prosessissa olevan riippumaton normaalijakautunut kohina. Jotta laskentaintensiteettiä saadaan alennettua, FITC harva aproksimaatio gaussisesta prosessista. Hyperparametrit estimoidaan maksimoimalla marginaalista likelihood-funktiota. Hongkongin ilmatieteen laitokselta (Hong Kong Observatory) sekä ympäristönsuojelu laitokselta (Environmental Protection Department) saatua säädataa käytetään Hongkongissa toimivan The Senior Citizen Home Safety Associationin (SCHSA) henkilökohtaisen hätäyhteyspalvelun päivittäisten hätäsoittojen määrän estimointiin. Toisessa osassa esitellään implementaatio harvaasta gaussisesta prosessista käytettynä luokittelussa. Malli koostuu priorista, jona toimii gaussinen prosessi, jonka laskemiseen on käytetty neliöityä eksponentiaalista kovarianssifunktiota, sekä probitti likelihood-funktiosta. Saatu posterior-funktio ei ole analyyttisesti ratkaistavissa ja siten sitä aproksimoidaan EP algoritmin avulla. Käyttämällä ahnetta algoritmia valitaan vain osa koko datasta laskentaa varten, näin laskennallisia vaatimuksia saadaan pudotetuksi. Hyperparametrit estimoidaan variaatiomenetelmällä; käytetään EP algoritmin antamaa aproksimaatiota variaatiojakaumana ja maksimoidaan marginaaliselle likelihood-funktiolle annettua alarajaa. EP algoritmia ja alarajan maksimointia vuorotellaan EM tyyppisen algoritmin tavoin. Kyseisestä menetelmästä käytetään (englannin kielisessä) kirjallisuudessa nimeä EM-EP. Luokittelun tavoitteena on estimoida riskiä kuolla itsemurhaan. Käytössä oleva data koostuu tiedoista, jotka koskevat kuolleita henkilökohtaisen hätäyhteyspalvelun käyttäjiä. Mikäli käyttäjä kuoli itsemurhan seurauksena, on siitä merkintä rekisterissä.
Description
Supervisor
Simula, Olli
Thesis advisor
Yip, Paul S.F.
Keywords
sparse Gaussian process regression, harva gaussinen prosessi regressiossa, sparce Gaussian process classification, harva gaussinen prosessi luokittelussa, FITC, bayesilainen päättely, EM-EP, biostatistiikka, bayesian inference, hätäpuheluiden määrän estimointi, biostatistics, itsemurhariskin estimointi, estimation of emergency call frequency, estimation of suicide risk
Other note
Citation