Stochastic Differential Equation Methods for Spatio-Temporal Gaussian Process Regression

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Doctoral thesis (article-based) | Defence date: 2016-04-08
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2016
Major/Subject
Mcode
Degree programme
Language
en
Pages
68 + app. 72
Series
Aalto University publication series DOCTORAL DISSERTATIONS, 50/2016
Abstract
Gaussian processes (GPs) are widely used tools for non-parametric probabilistic modelling in machine learning, spatial statistics, and signal processing. Their strength lies in flexible model specification, where prior beliefs of the model functions are encoded by the GP model. This way they can also be interpreted as specifying a probability distribution over the space of functions. In signal processing GPs are typically represented as state-space models, whereas the kernel (covariance function) representation is favoured in machine learning. Under the kernel formalism, the naïve solution to a GP regression problem scales cubically in the number of data points, which makes the approach computationally infeasible for large data sets. This work explores the link between the two representations, which enables the use of efficient sequential Kalman filtering based methods for solving the inference problem. These methods have linear time complexity with respect to the number of data points. The interest is in presenting an explicit connection between a large class of covariance functions and state- space models. This is done for one-dimensional (temporal) covariance functions and linear time-invariant stochastic differential equations. This class of models covers a wide range of both stationary and non-stationary GP models for encoding, for example, continuity, smoothness, or periodicity. The framework also extends to spatio-temporal models, where the GP is represented as an evolution type stochastic partial differential equation and inference conducted by infinite-dimensional Kalman filtering methods. Both separable and non- separable models are considered, and implementation techniques for numerical solutions are discussed. The link between stochastic differential equations and standard covariance functions widens the applicability of Gaussian processes in combination with mechanistic physical differential equation models. Temporal and spatio-temporal Gaussian process models are useful in a multitude of data-intensive applications. Examples in this work include brain image analysis, weather modelling, financial forecasting, and tracking applications.

Gaussiset prosessit (GP) ovat ei-parametrisia tilastollisia työkaluja, joita käytetään yleisesti koneoppimisessa, spatiaalisessa tilastotieteessä sekä signaalinkäsittelyssä. Niiden avulla mallifunktioita koskevat oletukset voidaan määritellä joustavasti. Gaussisen prosessin voi ajatella määrittelevän todennäköisyysjakauman funktioavaruuden yli. Signaalinkäsittelyssä gaussiset prosessit määritellään yleensä tila-avaruusmallin avulla, kun taas koneoppimisessa suositaan ytimeen (kovarianssifunktio) perustuvaa esitystapaa. Jälkimmäisessä esitystavassa GP-regressio-ongelman ratkaisun laskennallinen vaativuus skaalautuu kuutiollisesti aineiston koon suhteen, mikä tekee lähestymistavasta laskennallisesti raskaan suurilla tietoaineistoilla. Tässä työssä tarkastellaan tila-avaruusmallien ja kovarianssifunktioiden yhteyttä, jonka avulla voidaan käyttää tilastollisessa päättelyssä tehokkaita vaiheittaisia Kalman-suotimeen perustuvia menetelmiä. Nämä menetelmät mahdollistavat lineaarisen laskennallisen skaalautuvuuden aineiston koon suhteen. Aluksi yhteys esitetään yksiulotteisille (temporaalisille) kovarianssifunktioille, jotka voidaan esittää lineaarisina aikainvariantteina stokastisina differentiaaliyhtälöinä. Käytetyt kovarianssifunktiot sisältävät sekä stationaarisia että ei-stationaarisia GP-malleja, joiden avulla mallioletuksiin voidaan sisällyttää esimerkiksi jatkuvuutta, sileyttä tai jaksollisuutta. Tämän jälkeen menetelmäkehystä laajennetaan spatiotemporaalisiin malleihin, joissa GP esitetään evoluutiotyyppisenä stokastisena osittaisdifferentiaaliyhtälönä ja päättely tehdään ääretönulotteista Kalman-suodinta käyttämällä. Työssä käsitellään separoituvia ja ei-separoituvia malleja sekä tarkastellaan laskennallisia toteutustapoja. Stokastisten differentiaaliyhtälöiden ja yleisesti käytettyjen kovarianssifunktioiden yhteyttä voidaan käyttää myös GP-mallien yhdistämisessä mekanistisiin fysikaalisiin differentiaaliyhtälöihin. Temporaalisia ja spatiotemporaalisia gaussisia prosesseja voidaan käyttää monenlaisissa tietomääriltään suurissa sovelluksissa. Tässä työssä käytetään esimerkkeinä sovelluksia aivokuvannuksen, sään mallintamisen, markkinoiden ennustamisen sekä paikannuksen aloilta.
Description
Supervising professor
Lampinen, Jouko, Prof., Aalto University, Department of Computer Science, Finland
Thesis advisor
Särkkä, Simo, Prof., Aalto University, Department of Electrical Engineering and Automation, Finland
Keywords
stochastic differential equation, Gaussian process, state-space model, spatio-temporal data, stokastinen differentiaaliyhtälö, gaussinen prosessi, tila-avaruusmalli, spatiotemporaaliaineisto
Other note
Parts
  • [Publication 1]: Simo Särkkä, Arno Solin, and Jouni Hartikainen. Spatiotemporal Learning via Infinite-Dimensional Bayesian Filtering and Smoothing. IEEE Signal Processing Magazine, 30(4):51–61, 2013.
    DOI: 10.1109/MSP.2013.2246292 View at publisher
  • [Publication 2]: Arno Solin and Simo Särkkä. Infinite-Dimensional Bayesian Filtering for Detection of Quasiperiodic Phenomena in Spatiotemporal Data. Physical Review E, 88(5):052909, 2013.
    DOI: 10.1103/PhysRevE.88.052909 View at publisher
  • [Publication 3]: Arno Solin and Simo Särkkä. Explicit Link Between Periodic Covariance Functions and State Space Models. In Proceedings of the 17th International Conference on Artificial Intelligence and Statistics (AISTATS), JMLR W&CP, volume 33, pages 904–912. Reykjavik, Iceland, 2014
  • [Publication 4]: Arno Solin and Simo Särkkä. Gaussian Quadratures for State Space Approximation of Scale Mixtures of Squared Exponential Covariance Functions. In Proceedings of the IEEE International Workshop on Machine Learning for Signal Processing (MLSP), pages 1–6. Reims, France, 2014.
    DOI: 10.1109/MLSP.2014.6958899 View at publisher
  • [Publication 5]: Arno Solin and Simo Särkkä. State Space Methods for Efficient Inference in Student-t Process Regression. In Proceedings of the 18th International Conference on Artificial Intelligence and Statistics (AISTATS), JMLR W&CP, volume 38, pages 885–893. San Diego, CA, USA, 2015
  • [Publication 6]: Simo Särkkä, Arno Solin, Aapo Nummenmaa, Aki Vehtari, Toni Auranen, Simo Vanni, and Fa-Hsuan Lin. Dynamic Retrospective Filtering of Physiological Noise in BOLD fMRI: DRIFTER. NeuroImage, 60(2):1517–1527, 2012.
    DOI: 10.1016/j.neuroimage.2012.01.067 View at publisher
Citation