Automating Document Visualization: A Case for Modern Web Technologies

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu | Master's thesis
Ask about the availability of the thesis by sending email to the Aalto University Learning Centre oppimiskeskus@aalto.fi
Date
2015-12-14
Department
Major/Subject
Tietoverkot
Mcode
S3022
Degree programme
TLT - Tietoliikennetekniikka (TS2005)
Language
en
Pages
61+6
Series
Abstract
This thesis describes building a distributed system used in document visualization. On other hand the thesis addresses the problems specifically in the context of document visualization, on the other, architecture for the system could be applicable to any distributed system doing heavy processing. There are three main architectural components used and analysed. Firstly, Apache ZooKeeper is used to ensure nodes in the distributed system can synchronize tasks to avoid race conditions and other classical problems in concurrent programs. Secondly, RESTful web interface is used to tackle communication between distributed nodes, servicing UI and for interfacing with external systems. Lastly, object serialization is used to simplify the inter-node communication significantly.

Tämä työ käsittelee hajautetun järjestelmän rakentamista dokumenttien visualisointiin. Toisaalta aihetta käsitellään tässä spesifissä kontekstissa, mutta käytetty arkkitehtuuri soveltunee mihin tahansa raskasta prosessointia vaativaan hajautettuun järjestelmään. Käytetyistä ja analysoiduista menetelmistä keskeisimpiä ovat: Apache ZooKeeper, jota käytetään varmistamaan hajautetun järjestelmän komponenttien synkronointi ja välttämään klassiset rinnakkaisohjelmoinnin ongelmat; REST rajapinta, jolla toteutetaan komponenttien välinen kommunikaatio, käyttöliitymän toiminta sekä ulkoisten järjestelmien integraatio; Olioiden serialisointi (engl. object serialization), joka yksinkertaistaa merkittävästi komponenttien välistä rajapintaa.
Description
Supervisor
Manner, Jukka
Thesis advisor
Ali, Majid
Keywords
document visualization, distributed system, REST API, zookeeper, GMC inspire, python pickle
Other note
Citation