Learning Centre

Using social media photo metadata for finding interesting places

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Nikander, Jussi
dc.contributor.author Heinikoski, Joona
dc.date.accessioned 2015-05-27T11:36:12Z
dc.date.available 2015-05-27T11:36:12Z
dc.date.issued 2015-05-18
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/16348
dc.description.abstract This thesis explores how geotagged social media photographs can be utilised for finding inter-esting places. More specifically, the goal is to find interesting places for tourists to visit. As modern mobile devices are equipped with high quality cameras and fast data connections, different photo sharing services have large collections of photos posted by users. This work employs and compares different clustering methods for mining data out of this large dataset. The two adopted clustering methods are K-Means and DJ-Cluster. Along with only spatially interesting places, the data was searched for places that are only seasonally interesting. The theoretical section of this thesis presents the necessary methods for finding these inter-esting places. All methods were implemented in Python environment as part of the research work and are presented in such detail to enable implementation by the reader. The most im-portant methods in this work are the two clustering methods, distance-based K-Means and density-based DJ-Cluster. Distance-based methods require that distances in all data-axes are comparable with each other. To enable this, a z-score normalization method is utilised. Z-score normalizes different numerical variables to an equal scale. Clustering also requires calculating the distances and averages for different variables. Traditional linear methods cannot be used with cyclical time. Thus, cyclical time is processed similarly to direction using unit vectors. The results of the research are intended to be also understandable for non-specialist users. To enable exploring of the results as easy as possible, a visualization system was built to for use in any internet browser. The data visualization aims to present every cluster’s most important spatiotemporal variables at a glance. To achieve this, the map symbol for clusters is a modified radar plot, which presents the amount of points in different months. The methods are applied to the 121 323 point sample dataset acquired from Flickr service. The dataset is located around Osaka, Japan. The clustering results are evaluated with both statistical and qualitative methods. The results indicate that DJ-Cluster is a far superior method for the goal of finding interesting places both spatially and temporally. en
dc.description.abstract Tämä työ tutkii kuinka sosiaalisen median valokuvien paikkatietoa hyödyntämällä voidaan etsiä mielenkiintoisia paikkoja. Tarkemmin tavoitteena on löytää erityisesti turisteille mielenkiintoisia vierailukohteita. Koska nykyaikaisissa mobiililaitteissa on laadukas kamera ja nopeat datayhteydet, erilaisissa kuvapalveluissa on valtavat määrät käyttäjien ottamia valokuvia. Täs-sä työssä hyödynnetään ja vertaillaan klusterointimenetelmiä tiedon louhinnaksi tästä valta-vasta lähtöaineistosta. Työssä käytetyt klusterointimentelmät ovat K-Means ja DJ-Cluster. Pelkästään sijainniltaan mielenkiintoisten paikkojen lisäksi datasta etsitään paikkoja, jotka ovat mielenkiintoisia johonkin tiettyyn aikaan vuodesta. Työn teoreettisessa osassa esitellään tarpeelliset menetelmät kiinnostavien paikkojen löytämiseksi. Kaikki menetelmät implementoitiin Python-ympäristössä osana työtä ja esitellään tarvittavalla tarkkuudella, jotta lukija pystyisi implementoimaan menetelmät. Työn kannalta tärkeimmät käytetyt menetelmät ovat klusterointimenetelmät, etäisyysperusteinen K-Means ja tiheysperusteinen DJ-Cluster. Etäisyysperusteiset klusterointimenetelmät vaativat kaikkien eri data-akseleiden etäisyyksien olevan verrattavissa toisiinsa. Tätä varten käytetään z-score nor-malisointimenetelmää, jolla erilaiset numeeriset muuttujat voidaan muuttaa toisiinsa verrattavalle asteikolle. Klusterointia varten kaikkien arvojen etäisyyksiä ja keskiarvoja tulee pystyä laskemaan. Perinteiset lineaariset menetelmät eivät sovellu syklisille arvoille, joten aikaa käsitellään suunnan kaltaisesti yksikkövektoreita soveltaen. Työn lopputulokset ovat tarkoitettu myös alaan perehtymättömän käyttäjän tutkittavaksi. Jotta tulosten selaaminen olisi mahdollisimman esteetöntä, työn visualisointijärjestelmä rakennettiin toimimaan internetselaimessa. Visualisoinnissa pyritään esittämään tärkeimmät kluste-reiden spatiotemporaaliset arvot yhdellä vilkaisulla. Tätä varten kartalla esitetään tutkakaavi-on kaltaisella symbolilla kuinka paljon pisteitä klusterissa on kuukausittain. Työn menetelmiä sovelletaan Flickr-palvelusta hankittuun 121 323 pisteen esimerkkiaineis-toon. Aineisto sijoittuu Japaniin Osakan alueelle. Klusteroinnin tuloksia arvioidaan sekä laskennallisin mittarein, että laadullisin menetelmin. Tuloksista käy ilmi DJ-Cluster menetelmän olevan kiistattomasti tavoitteeseen paremmin soveltuva menetelmä. fi
dc.format.extent 39 + 10
dc.format.mimetype application/pdf en
dc.language.iso en en
dc.title Using social media photo metadata for finding interesting places en
dc.title Sosiaalisen median valokuvien metatiedon käyttö kiinnostavien paikkojen etsinnässä fi
dc.type G2 Pro gradu, diplomityö en
dc.contributor.school Insinööritieteiden korkeakoulu fi
dc.subject.keyword clustering en
dc.subject.keyword cyclical time en
dc.subject.keyword data mining en
dc.subject.keyword GIS en
dc.subject.keyword social media en
dc.subject.keyword visualization en
dc.identifier.urn URN:NBN:fi:aalto-201505283019
dc.programme.major Geoinformatiikka fi
dc.programme.mcode M3002 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Diplomityö fi
dc.contributor.supervisor Virrantaus, Kirsi
dc.programme Geomatiikan koulutusohjelma fi
local.aalto.openaccess yes
dc.rights.accesslevel openAccess
local.aalto.idinssi 51498
dc.type.publication masterThesis
dc.type.okm G2 Pro gradu, diplomityö


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse