Sequential Inference for Latent Temporal Gaussian Process Models

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Doctoral thesis (article-based) | Defence date: 2013-01-25
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2013

Major/Subject

Mcode

Degree programme

Language

en

Pages

88 + app. 88

Series

Aalto University publication series DOCTORAL DISSERTATIONS, 14/2013

Abstract

During the recent decades Gaussian processes (GPs) have become increasingly popular tools for non-parametric Bayesian data analysis in a wide range of applications, including non-linear regression, classification, spatial statistics, dynamic system modeling and non-linear dimension reduction. The flexibility of Gaussian processes lies in their covariance functions, which encode the prior beliefs about the latent function to be modeled in different applications. While GPs are useful models with successful real-world applications, they face several practical problems in modeling and inference. Firstly, the posterior inference on the latent variables is computationally intensive as it scales cubically in the number of data points and is analytically intractable in all but the Gaussian measurement noise case. Secondly, construction of new models where Gaussian processes are used as latent components often requires analytic work (such as the derivation of the covariance function), which can be hard or even impossible in practice. In this work, we apply Gaussian processes to model stochastic dynamic systems. The main aim of this thesis is to rekindle an old idea of converting a GP prior with a given covariance function into an equivalent state-space model commonly used for modeling dynamic systems. The state-space form of GP priors has several advantages over the traditional covariance function view. Firstly, one can perform posterior inference with sequential algorithms which usually scale linearly in the number of data points. Secondly, construction of new latent Gaussian process is easy as one does not need to derive any covariance functions. We show how the conversion can be done for several important covariance functions, and present practical algorithms that are suited for the resulting state-space models. In addition to one-dimensional Gaussian processes, we shall consider the conversion of more general spatio-temporal Gaussian processes as well as latent force models, where Gaussian processes are used to model unknown forces acting on mechanistic dynamic systems. The second aim of this thesis is to develop new inference methods for general state-space models. In particular, we develop new methods for filtering and smoothing various non-linear state-space models as well as for estimating parameters of non-linear stochastic differential equations.

Viimeisten vuosikymmenien aikana gaussisiin prosesseihin (GP) perustuvat mallit ovat tulleet suosituiksi ei-parametrisina Bayesilaisina mallinnusvälineinä lukuisissa sovelluksissa kuten epälineaarissa regressiossa, luokittelussa, spatiaalisessa tilastotieteessa, dynaamisten systeemien mallinnuksessa ja epälineaarisessa dimension pudotuksessa. Gaussisen prosessin joustavuus perustuu sen kovarianssifunktioon, joka koodaa etukäteen tehdyt oletukset mallinnettavasta latentista funktiosta. Suosiosta huolimatta gaussisiin prosesseihin perustuvilla malleilla on monia mallinnukseen ja laskentaan liittyviä käytännön ongelmia. Ensiksi, posteriorijakauman laskeminen on laskennallisesti intensiivistä, koska tarvittavien laskutoimitusten määrä skaalautuu datapisteiden määrän suhteen kuutiollisesti. Toiseksi, uusien gaussisia prosesseja latentteina komponentteinaan käyttävien mallien muodostaminen vaatii usein ei-triviaalia analyyttistä työtä, kuten esimerkisi kovarianssifunktioiden johtamista. Tässä työssä gaussisia prosesseja käytetään stokastisien dynaamisien systeemien mallinnuksessa. Työn päätavoite on herättää henkiin vanha idea GP priorin esittämisestä tila avaruusmallina, jotka ovat yleisesti käytetty lähestymistapa dynaamisten systeemien mallinnuksessa. Tällä tila-avaruusesityksellä on lukuisia suotuisia ominaisuuksia verrattuna perinteiseen kovarianssifunktioesitykseen. Ensiksi, posterioripäättely voidaan toteuttaa sekventiaalisilla algoritmeillä, joiden laskentavaatimukset skaalautuvat tyypillisesti lineaarisesti datapisteiden määrän suhteen. Toiseksi, uusien mallien muodostaminen on usein helppoa sillä esimerkiksi kovarianssifunktioita ei tarvitse johtaa. Tässä työssä esitellään miten GP malli muunnetaan tila-avaruusmalliksi tärkeimpien kovarianssifunktioden tapauksissa ja miten muodostetun tila-avaruusmallin voi estimoida tehokkaasti erilaisilla sekventiaalisilla menetelmillä. Yksiulotteisten gaussisien prosessien lisäksi työssä esitetään miten yleisemmät spatio-temporaaliset gaussiset prosessit sekä nk. latentit voimamallit, joissa gaussisia prosesseja käytetään mallintamaan dynaamisiin systeemeihin vaikuttavia tuntemattomia voimia, muunnetaan tila-avaruusmalleiksi. Työn toinen päämäärä on kehittää uusia laskennallisia menetelmiä yleisien tila-avaruusmallien estimointiin. Eritoten työssä esitellään uusia suodatus- ja siloitusalgoritmejä erilaisien tila avaruusmallien tilojen estimointiin, sekä uusia parametrien estimointimenetelmiä epälineaarisille stokastisille differentiaaliyhtälömalleille.

Description

Supervising professor

Lampinen, Jouko, Prof., Aalto University, Finland

Thesis advisor

Särkkä, Simo, Dr., Aalto University, Finland
Vehtari, Aki, Dr., Aalto University, Finland

Keywords

Gaussian processes, state-space models, dynamic systems, Gaussiset prosessit, tila-avaruusmallit, dynaamiset systeemit

Other note

Parts

  • [Publication 1]: Jouni Hartikainen and Simo Särkkä. Kalman Filtering and Smoothing Solutions to Temporal Gaussian Process Regression Models. In IEEE International Workshop on Machine Learning for Signal Processing (MLSP), pages 379–384, Kittilä, Finland, August 2010.
  • [Publication 2]: Jouni Hartikainen and Simo Särkkä. Sequential Inference for Latent Force Models. In The 27th Conference on Uncertainty in Artificial Intelligence (UAI), pages 311–318, Barcelona, Spain, July 2011.
  • [Publication 3]: Jouni Hartikainen, Mari Seppänen and Simo Särkkä. State-Space Inference for Non-Linear Latent Force Model with Application to Satellite Orbit Prediction. In The 29th International Conference on Machine Learning (ICML), pages 903–910, Edinburgh, Scotland, June 2012.
  • [Publication 4]: Simo Särkkä and Jouni Hartikainen. Infinite-Dimensional Kalman Filtering Approach to Spatio-Temporal Gaussian Process Regression. In Journal of Machine Learning Research Workshop and Conference Proceedings Volume 22: AISTATS 2012, pages 993–1001, La Palma, Spain, April 2012.
  • [Publication 5]: Jouni Hartikainen, Jaakko Riihimäki and Simo Särkkä. Sparse Spatio-Temporal Gaussian Processes with General Likelihoods. In Artificial Neural Networks and Machine Learning - ICANN 2011, LNCS 6791, pages 193–200, Espoo, Finland, June 2011
  • [Publication 6]: Simo Särkkä and Jouni Hartikainen. On Gaussian Optimal Smoothing of Non-Linear State Space Models. IEEE Transactions of Automatic Control, 55(8):1938–1941, August 2010.
  • [Publication 7]: Simo Särkkä and Jouni Hartikainen. Sigma Point Methods in Optimal Smoothing of Non-Linear Stochastic State Space Models. In IEEE International Workshop on Machine Learning for Signal Processing (MLSP), pages 184–189, Kittilä, Finland, August 2010.
  • [Publication 8]: Simo Särkkä, Jouni Hartikainen, Isambi Sailon balawata and Heikki Haario. Posterior Inference on Parameters of Stochastic Differential Equations via Gaussian Process Approximations and Adaptive MCMC. Submitted, 2012.
  • [Publication 9]: Robert Piché, Simo Särkkä and Jouni Hartikainen. Recursive Outlier-Robust Filtering and Smoothing for Non-Linear Systems Using the Multivariate Student-t Distribution. IEEE International Workshop on Machine Learning for Signal Processing (MLSP), pages 1–6, September 2012. 

Citation