Gaussian-process factor analysis for modeling spatio-temporal data

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2009
Major/Subject
Informaatiotekniikka
Mcode
T-61
Degree programme
Language
en
Pages
73
Series
Abstract
The main theme of this thesis is analyzing and modeling large spatio-temporal datasets, such as global temperature measurements. The task is typically to extract relevant structure and features for predicting or studying the system. This can be a challenging problem because simple models are often not able to capture the complex structure suffiently well, and more sophisticated models can be computationally too expensive in practice. This thesis presents a novel spatio-temporal model which extends factor analysis by setting Gaussian process priors over the spatial and temporal components. In contrast to factor analysis, the presented model is capable of modeling complex spatial and temporal structure. Compared to standard Gaussian process regression over the spatio-temporal domain, the presented model gains substantial computational savings by operating only in the spatial or temporal domain at a time. Thus, it is feasible to model larger spatio-temporal datasets than with standard Gaussian process regression. The new model combines the modeling assumptions of several traditional techniques used for analyzing spatially and temporally distributed data: kriging is used for modeling spatial dependencies; empirical orthogonal functions reduce the dimensionality of the problem; and temporal smoothing finds relevant features from time series. The model is applied to reconstruct missing values in a historical sea surface temperature dataset. The results are promising and suggest that the proposed model may outperform the state-of-the-art reconstruction systems.

Tämän työn aiheena on suurien avaruusajallisten datakokoelmien, kuten maailmanlaajuisten lämpötilamittausten, analyysi ja mallinnus. Tehtävänä on yleensä löytää keskeisiä rakenteita ja piirteitä, joita voitaisiin hyödyntää systeemin käyttäytymisen ennustamiseen tai tutkimiseen. Tämä voi kuitenkin olla haastavaa, sillä yksinkertaiset mallit eivät kykene löytämään monimutkaisia rakenteita riittävän hyvin ja monimutkaisemmat mallit voivat olla laskennallisesti liian raskaita. Työssä esitellään uusi avaruusajallinen malli, joka laajentaa faktorianalyysia asettamalla paikka- ja aikakomponenttien priorit gaussisilla prosesseilla. Toisin kuin faktorianalyysi, esitelty malli kykenee mallintamaan monimutkaisia paikka- ja aikarakenteita. Normaaliin gaussisten prosessien regressioon verrattuna malli saavuttaa merkittäviä säästöjä laskenta-ajoissa toimimalla kerrallaan vain joko paikan tai ajan suhteen. Täten menetelmä kykenee mallintamaan suurempia avaruusajallisia datakokoelmia kuin normaaleilla gaussisilla prosesseilla on yleensä mahdollista. Uusi malli yhdistää oletuksia useista perinteisistä menetelmistä, joita käytetään paikan ja ajan suhteen jakautuneelle datalle: kriging-menetelmä mallintaa riippuvuuksia paikkojen välillä, empiiristen ortogonaalisten funktioiden menetelmä pienentää dimensionaalisuutta, ja ajallinen siloitus löytää aikasarjoista oleellisia piirteitä. Mallia käytetään rekonstruoimaan puuttuvia arvoja historiallisessa meren lämpötilan datakokoelmassa. Tulokset ovat lupaavia ja antavat toiveita, että esitelty malli voi rekonstruoida paremmin kuin nykytason rekonstruointimenetelmät.
Description
Supervisor
Oja, Erkki
Thesis advisor
Ilin, Alexander
Keywords
factor analysis, faktorianalyysi, Gaussian processes, gaussiset prosessit, variational Bayesian inference, variotionaalinen bayesilainen päättely
Other note
Citation