Data processing pipeline automation on cloud platform

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorVuorio, Mika
dc.contributor.authorHyvämäki, Svantte
dc.contributor.schoolSähkötekniikan korkeakoulufi
dc.contributor.supervisorSärkkä, Simo
dc.date.accessioned2019-03-17T16:08:30Z
dc.date.available2019-03-17T16:08:30Z
dc.date.issued2019-03-11
dc.description.abstractA network connection provides us with a global access to a seemingly endless information storage. However, the ways of utilizing the Internet are changing. An increasing amount of functionality is being added to browsers, applications that are run on personal devices to transfer and interpret the online data. Applications that were previously run independently on personal machines are transformed into web applications, and the processing load is distributed away from individual computers. This development has increased competition in the web hosting industry. While the leading multinational technology companies have established large datacenters around the world to inexpensive locations, it has become profitable for smaller companies to outsource their hosting services. As datacenter technology has evolved, the enormous stocks of machines from which the large companies rent out their computing services has been started to be called the cloud. The transition to cloud services provides increased reliability, power, scalability, and cost-effectiveness for software businesses. This thesis describes the process of transferring a public transportation journey planner service from company's own datacenter to a cloud platform. The consequential changes in different abstraction levels of the software architecture are documented, and the methods that were used in planning and executing the transfer are evaluated. A container virtualization method was combined with Amazon's container platform service and it increased the software reliability with automatic health monitoring and scaling. These new features of the system were verified by load tests, and their results show that the cloud platform is able to restore the normal response times of the service in five minutes after the number of users has grown drastically, by provisioning more resources for the routing algorithm.en
dc.description.abstractVerkkoyhteys tarjoaa meille globaalin pääsyn näennäisesti loputtomaan tietomäärään. Tavat hyödyntää Internetiä ovat kuitenkin muuttumasssa. Selaimiin, verkossa olevaa dataa hakeviin ja tulkitseviin ohjelmiin lisätään jatkuvasti uusia toiminnallisuuksia. Aikaisemmin henkilökohtaisilla laitteilla ajettuja sovelluksia muutetaan verkkopohjaisiksi ja samalla henkilökohtaisten laitteiden laskentakuormaa siirtyy palvelimille. Tämä kehitys on lisännyt kilpailua verkkoisännöintipalveluissa. Kun johtavat teknologiayritykset ovat rakentaneet suuria palvelinkeskuksia edullisiin sijainteihin, on isännöintipalvelujen ulkoistaminen muuttunut kannattavaksi pienemmille yrityksille. Kun palvelinkeskusteknologia on kehittynyt, on suuresta palvelinmäärästä vuokrattavia laskentapalveluja alettu kutsua pilveksi. Pilvilaskentaan siirtyminen tuo ohjelmistoalan liiketoimintaan luotettavuutta, tehoa, skaalattavuutta ja kustannustehokkuutta. Tässä diplomityössä kuvataan julkisen liikenteen reittiopas-palvelun siirtäminen yrityksen omasta palvelinsalista pilvialustalle. Työssä dokumentoidaan siirtoprosessista seuranneet muutokset ohjelmiston arkkitehtuurin eri abstraktiotasoilla, ja arvioidaan menetelmät siirron suunnittelussa ja toteutuksessa. Siirrossa yhdistettiin konttivirtualisointi ja Amazonin konttialustapalvelu, mikä paransi ohjelmiston luotettavuutta automaattisella valvonnalla ja skaalauksella. Järjestelmän uudet ominaisuudet verifioitiin kuormatesteillä, joiden tulosten mukaan alustalla on kyky kasvattaa automaattisesti reititysmoottorin laskentaresursseja ja palauttaa palvelun vasteaika normaaliksi noin viidessä minuutissa käyttäjämäärän äkillisestä kasvusta.fi
dc.format.extent36
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/37183
dc.identifier.urnURN:NBN:fi:aalto-201903172323
dc.language.isoenen
dc.locationP1fi
dc.programmeLST - Master's Programme in Life Science Technologies (TS2013)fi
dc.programme.majorBiosensing and Bioelectronicsen
dc.programme.mcodeELEC3045fi
dc.subject.keywordcloud computingen
dc.subject.keywordcontainer virtualizationen
dc.subject.keywordinfrastructure as a serviceen
dc.subject.keyworddata processingen
dc.subject.keywordautomatic scalingen
dc.subject.keywordsite reliability engineeringen
dc.titleData processing pipeline automation on cloud platformen
dc.titleDatankäsittelyn automatisointi pilvialustallafi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
master_Hyvämäki_Svantte_2019.pdf
Size:
3.17 MB
Format:
Adobe Portable Document Format