Opening city data for public access: design, implementation and privacy
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2020-08-18
Department
Major/Subject
Security and Cloud Computing (Security)
Mcode
SCI3084
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
54
Series
Abstract
With the concept of smart cities gaining popularity, a rising interest in open data has also emerged. This trend has also influenced the city of Helsinki. The city wants to release energy consumption information from its buildings as open data. The task of creating a service for the purpose was given to Nuuka Solutions Oy, a company that already aggregates and hosts the building information of the city. This thesis describes the design and implementation process of creating a solution for the city to publish the data. The design phase consists of two important parts: storing the selected set of information and finding the best way to publish it. Regarding storage, the chosen option was a separate SQL database and a separate server. Several other options were examined, but they proved to be either too expensive or too works intensive. The main reasons for choosing the SQL were the in-house expertise and the possibility to re-use existing code and database structures from the existing services of the company. An API was used to publish the data. The standards selected for the implementation were JSON and REST. The main reasons were flexibility, speed, and ease of use. Additionally, the privacy aspects of open data are studied. We examine if there is anything sensitive in the information and compare the case to some of the known privacy issues related to open data, especially in the context of smart cities. The data that was eventually published was the property-level, main-meter consumption data. The problems regarding privacy are countered by several factors. The most important one is the nature of the data: it is purely non-personal, and on a general enough level to not enable extracting the information of or monitoring individual employees or citizens.Älykkäiden kaupunkien kasvattaessa suosiotaan myös kiinnostus avoimeen dataan on lisääntynyt. Tämä suuntaus on vaikuttanut myös Helsingin kaupunkiin, joka haluaa julkaista palvelukiinteistöjensä energiankulutustiedot avoimena datana. Tähän tarkoitetun palvelun kehittäminen annettiin tehtäväksi Nuuka Solutions Oy:lle, joka jo ennestään kerää ja hallinnoi kaupungin rakennusdataa. Tämä diplomityötyö kuvaa avoimen datan julkaisuun käytettävän ratkaisun suunnittelu- ja implementointiprosessin. Suunnitteluvaihe koostuu kahdesta osasta: valitun datan talletuksesta ja julkaisusta. Talletuksen osalta toteutukseen valittiin erillisellä serverillä toimiva oma SQL tietokanta. Lukuisia muita vaihtoehtoja tutkittiin, mutta ne osoittautuivat joko liian kalliiksi tai liian työläiksi toteuttaa. Tärkein syy SQL:n valitsemiseen oli jo olemassa oleva osaaminen yrityksen sisällä sekä mahdollisuus uusiokäyttää olemassa olevaa koodia ja tietokantarakenteita yrityksen muista palveluista. Julkaisussa käytettiin ohjelmointirajapintaa. Valitut standardit olivat REST ja JSON. Tärkeimmät syyt valintoihin olivat joustavuus, nopeus ja helppokäyttöisyys. Lisäksi datan julkaisua tutkittiin yksityisyyden ja tietoturvan näkökulmasta. Työ tutkii, onko julkaistavassa datassa mitään arkaluontoiseksi luokiteltavaa sekä vertaa tilannetta tunnettuihin avoimen datan yksityisyysongelmiin, erityisesti älykkäiden kaupunkien kontekstissa. Julkaistavaksi lopulta valittu data oli rakennusten kiinteistötason päämittarin kulutusdataa. Yksityisyyteen liittyvät ongelmat kumoutuvat useista syistä. Näistä tärkein on datan luonne: se ei sisällä henkilötietoja, ja on niin yleisellä tasolla, ettei se mahdollista yksittäisten ihmisten tietojen erittelyä tai monitorointia.Description
Supervisor
Aura, TuomasThesis advisor
Sipola, NikoKeywords
API, SQL, partial data replication, OGD, privacy, smart city