Passive sensing data sources on citizen opinions, emotions and experiences to benefit urban planning in Malmi, Helsinki

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Insinööritieteiden korkeakoulu | Master's thesis

Date

2022-01-24

Department

Major/Subject

Spatial Planning and Transportation

Mcode

Degree programme

Master's Programme in Spatial Planning and Transportation Engineering (SPT)

Language

en

Pages

56+2

Series

Abstract

We are living in the age of information and there is an abundance of data available, but only a fraction of it can be turned into knowledge. This thesis focuses on researching emotions, experiences and opinions of citizens, without having to produce active sensing data. Only data that is produced on a continuous matter without researcher involvement, such as social media posts, will be used. This concept is tested with data concerning the neighborhood of Malmi in Helsinki, Finland. The thesis aims to answer questions regarding the usability and usefulness, as well as limitations, of these novel data sources. In the brief literature review, both active and passive sensing datasets used to research citizen views are discussed, including social media data and open data as well as datasets from participatory processes, focusing on their challenges. Then a large set of data sources are assessed to evaluate their applicability for the scope of the thesis. The sources selected for further analysis are social media platform Twitter, housing advertisement texts from multiple sources and data from Helsinki city feedback channel, where citizens can give feedback to the city on any subject or service. From the relatively small samples obtained from the selected data sources, different analyzes were conducted. For Twitter data, a manual sentiment analysis was done alongside with a content as well as super user analysis. For the housing ads, texts were analyzed using emerging categories to determine attraction factors. In addition, for feedback channel, emerging categories were used to determine subjects of the feedback. Results can be utilized to measure public interest and sentiment on urban planning solutions, to determine attraction factors for different areas and as suggestions for future development. In the results it was concluded that most active discussions about Malmi held in Twitter, were about the Malmi airfield and the overall sentiment of the discussions was negative. The most important attraction factors of Malmi were determined to be proximity to services and good connections, with also frequent mentions of closeness to natural environments and outdoor activities. Also, the analysis found direct feedback suitable for planning. The data sources differ in ease of use and type of data produced. Identified challenges of the collected data include the lack of information on the representativeness of the sample, lack of availability of suitable data and issues on data quality, as well as possible biases in the research. The data also was somewhat resource-intensive to identify, collect and analyze, even though ease usage of data was one of the goals of the work. Aggregation of data from different sources also proved to be challenging, which limits the uses of this data as a supplement to active sensing datasets. There is a need for better and more automatic processes to collect sensing data and better curation of said data to ease its use. A possible way to manage such data is through a concept of urban digital twins that combine different datasets to preserve the created knowledge as well as support further work.

Elämme tiedon aikakautta. Dataa on saatavilla runsaasti, mutta vain murto-osa siitä voidaan muuttaa ymmärrykseksi. Tässä diplomityössä keskitytään tutkimaan paikallisten tunteita, näkemyksiä ja mielipiteitä ilman aktiivisen aistimisen datalähteiden tuottamista, eli hyödyntäen dataa, jota tuotetaan jatkuvasti ilman tutkijoiden aktiivista osallistumista. Tällainen datalähde on esimerkiksi sosiaalinen media. Konseptia testattiin Malmin naapurustoa koskevalla datalla Helsingissä. Diplomityön tarkoituksena on tutkia näiden uusien datalähteiden käytettävyyttä ja hyödyllisyyttä sekä rajoituksia. Tiiviissä kirjallisuuskatsauksessa käsitellään sekä aktiivisen että passiivisen aistimisen aineistoja, joita on hyödynnetty kansalaisten kaupunkisuunnitteluun liittyvien näkemysten kartoittamiseksi, mukaan lukien sosiaalisen median data ja avoin data sekä osallistavissa prosesseissa tuotettu data. Työssä keskitytään näiden eri datojen haasteisiin. Työssä arvioidaan suuren datalähdejoukon soveltuvuus diplomityön kuvattuun aiherajaukseen. Tarkempia analyysejä varten valitut lähteet ovat sosiaalisen me-dian alusta Twitter, asuntojen mainostekstit useista lähteistä ja Helsingin kaupungin palautekanava, jossa kaupunkilaiset voivat antaa palautetta kaupungille mistä tahansa aiheesta tai palvelusta. Datalähteistä saadusta suhteellisen pienestä otoksesta tehtiin erilaisia analyysejä. Twitter –datalle tehtiin manuaalinen sentimenttianalyysi, sisältöanalyysi sekä superkäyttäjäanalyysi. Asuntoilmoitusten teksti analysoitiin tutkimalla esiin nousevia kategorioita vetovoimatekijöiden selvittämiseksi. Lisäksi palautekanavien osalta esiin tulevia kategorioita käytettiin palautteen aiheiden määrittämiseksi. Tuloksia voidaan käyttää yleisen ilmapiirin ja asenteiden mittaamiseen kaupunkisuunnitteluratkaisuista, vetovoimatekijöiden selvittämiseksi eri alueille ja suorien ehdotuksien keräämiseksi tulevaa kaupunkikehitystä varten. Tuloksissa todettiin, että Twitterissä aktiivisimmat keskustelut Malmilla koskivat Malmin lentokenttää ja keskustelujen sentimentti oli yleisesti negatiivinen. Tärkeimmiksi Malmin vetovoimatekijöiksi määriteltiin palveluiden läheisyys ja hyvät yhteydet, ja usein mainittiin myös luonnon läheisyys ja ulkoilumahdollisuudet. Datasta löydettiin myös suunnitteluun soveltuvia ehdotuksia kaupunkilaisilta. Tunnistetut datalähteet tarjoavat keskenään erilaista dataa ja myös datan keräämisen helppous vaihtelee. Kerättyjen tietojen tunnistettuja haasteita ovat epätietoisuus otoksen edustavuudesta, puute sopivasta datasta, datan laatuun liittyvät puutteet sekä vinoumien riski datassa ja sen analyysissä. Työssä kerätty data myös osoittautui suhteellisen työlääksi tunnistaa, kerätä ja käsitellä, vaikka datan helppo käyttö oli yksi työn tavoite. Datan yhdisteleminen eri lähteistä osoittautui myös haastavaksi, mikä rajoittaa datan hyödyntämistä aktiivisen aistimisen datalähteiden tukea. Datan hyödyntämisen kehittämiseksi tulevaisuudessa tarvitaan parempia ja automaattisempia prosesseja aistimisdatan käsittelyyn sekä kerätyn tiedon parempaa hallinnointia. Mahdollinen tapa hallinnoida tällaista pehmeää paikkatietoa on konsepti kaupunkien digitaalisista kaksosista, joissa erilaiset paikkatietoaineistot yhdistyvät luodun tiedon säilyttämiseksi ja jatkokäsittelyn tukemiseksi.

Description

Supervisor

Kyttä, Marketta

Thesis advisor

Bergström, Maija

Keywords

soft GIS, passive sensing data, active sensing data, urban planning, social media, open data

Other note

Citation