Human mobility prediction; A probabilistic transfer learning approach

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2013

Department

Major/Subject

Informaatiotekniikka

Mcode

T-61

Degree programme

Language

en

Pages

viii + 71 s.

Series

Abstract

Human mobility exhibits various daily and weekly routines, such as a home-work-lunch-work pattern which many working individuals follow regularly. In this thesis, a probabilistic method for predicting these mobility patterns is developed. Mobility prediction has a wide range of applications from context-aware smartphone applications to the modeling of epidemic disease spreading. We use two sources of location data: the Mobile Data Challenge (MDC) data set which contains visit sequences recorded automatically through GPS and Wi-Fi sensors and the Foursquare (4sq) data set which consists of manual check-ins people have made in places such as train stations and restaurants. Our first goal is to study how the difference in the nature of the two location disclosure systems is reflected in mobility patterns. Differences related to, e.g., the number of check-ins are identified but the time distributions of the visits/check-ins turn out to be similar, suggesting that the two data sets can be used to complement each other. The second goal is to develop a probabilistic next place prediction method. A model combining the strengths of the current state-of-the-art methods is derived and we show that it outperforms the current methods. Furthermore, the developed method is compatible with 4sq data allowing transfer learning. The final goal is to introduce a transfer learning method in order to use 4sq data to complement the MDC data set. The method we propose is based on mixtures of multinomials and we show that it improves next place prediction accuracy during the first month of the data collection. Thus the proposed transfer learning method helps to tackle the cold start problem that many applications requiring the estimation of probability distributions face.

Ihmisten liikkumisessa on havaittavissa useita päivä- ja viikkorytmejä kuten koti-työ-lounas-työ-rytmi, joka on tyypillinen monille työssäkäyville henkilöille. Tässä työssä kehitetään probabilistinen menetelmä ihmisten liikkumisen ennustamiseksi. Liikkumisen ennustamisella on useita sovelluksia alkaen kontekstitietoisista matkapuhelinsovelluksista aina epidemioiden leviämisen mallintamiseen. Työssä käytetään kahta paikkatietoaineistoa: Mobile Data Challenge (MDC) -aineistoa, joka sisältää GPS- ja Wi-Fi-sensoreiden avulla automaattisesti kerättyjä vierailusekvenssejä, sekä Foursquare (4sq) -aineistoa, joka koostuu manuaalisesti kirjatuista vierailuista eri paikkoihin kuten juna-asemiin ja ravintoloihin. Työn ensimmäisenä tavoitteena on tarkastella, miten näiden kahden paikkatiedonkeruumenetelmän erilaisuus näkyy aineistoista löytyvissä liikkumisrytmeissä. Osoittautuu, että eroavaisuuksia löytyy muun muassa tallennettujen vierailujen lukumäärissä, mutta toisaalta vierailujen aikajakaumat ovat samankaltaisia. Tämän perusteella voidaan päätellä, että aineistoja voidaan käyttää täydentämään toisiaan. Työn toisena tavoitteena on kehittää probabilistinen menetelmä henkilön seuraavan sijainnin ennustamiseen. Johdettu menetelmä perustuu tämän hetken parhaisiin menetelmiin, ja työssä osoitetaan, että menetelmä suoriutuu paremmin kuin nykyiset menetelmät. Lisäksi menetelmä on yhteensopiva 4sq-aineiston kanssa, mikä mahdollistaa siirto-oppimisen. Työn kolmantena tavoitteena on kehittää siirto-oppimismenetelmä, joka käyttää 4sq-aineistoa täydentämään MDC-aineistoa. Työssä osoitetaan multinomiaalimikstuurimalleihin perustuvan menetelmän parantavan seuraavan sijainnin ennustustarkkuutta, kun aineistoa on kerättynä alle kuukauden ajalta. Näin ollen menetelmä auttaa ongelmassa, joka kohdataan lukuisissa sovelluksissa, joissa vaaditaan todennäköisyysjakaumien estimointia, mutta joissa aineistoa ei ole aluksi riittävästi.

Description

Supervisor

Oja, Erkki

Thesis advisor

Gatica-Perez, Daniel

Keywords

ihmisten liikkuminen, ennustaminen, siirto-oppiminen, probabilistiset menetelmät, multinomiaalimikstuurimalli, human mobility, prediction, tranfer learning, probabilistic methods, mixture of multinomials

Other note

Citation