Clustering in workflow engines

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorPulliainen, Erkki
dc.contributor.authorTiihonen, Mikko
dc.contributor.departmentInformaatio- ja luonnontieteiden tiedekuntafi
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.schoolSchool of Scienceen
dc.contributor.supervisorSoisalon-Soininen, Eljas
dc.date.accessioned2020-12-23T12:26:08Z
dc.date.available2020-12-23T12:26:08Z
dc.date.issued2010
dc.description.abstractThis thesis discusses behaviour of clustered workflow engines. At first background is provided for workflow engines and how they are built using state machines. The basic contract the workflow engines provide is described as well as the minimum operational requirements. The text then provides background on high availability and how it is typically implemented in workflow engines using the high availability features of relational database management systems. The chapter on clustering describes typical deployment setups of workflow engine clusters from the simplest possible two node cluster to classical but very expensive RDBMS setup with separate storage arrays. The failure scenarios chapter brings front the possible failure scenarios including their probability and externally visible effects. The performance bottlenecks provide a different aspect on the challenges that are related to workflow engine cluster scalability. The remaining of the text discusses common strategies to enhance scalability and different trade-offs that can be made between performance and reliability The thesis provides a comparison between a RDBMS based synchronous cluster and a cluster with in-memory replicated state and write-back persistence. Both reliability and price/performance ratio are analysed.en
dc.description.abstractTässä diplomityössä käsitellään klusteroitujen prosessikonejärjestelmien käyttäytymistä. Aluksi taustoitetaan prosessikoneita ja niiden rakentamista tilakoneiden avulla. Prosessikoneiden tarjoama sopimus kuvataan sekä vähimmäisvaatimukset joilla se voidaan täyttää. Seuraavaksi taustoitetaan korkea saatavuus ja sen tyypillisiä toteutustapoja prosessikoneissa, jotka hyödyntävät relaatiotietokantojen korkeaa käytettävyyttä. Klusterointiluvussa kuvataan tyypillisiä prosessikoneklustereiden asennuksia yksinkertaisimmasta mahdollisesta kahden koneen järjestelmästä klassiseen mutta kalliiseen relaatiotietokantajärjestelmään erillisillä levypakoilla. Häiriöskenaario-luvussa tuodaan esiin virhetilanteet ja niiden todennäköisyydet sekä systeemin ulkopuolelta havaittavat vaikutukset. Nopeuden pullonkaulat tuovat toisen näkökulman klusteroitujen prosessikoneiden skaalautuvuuden haasteisiin. Tekstin loppu käsittelee yleisiä strategioita skaalautuvuuden parantamiseen ja eri kompromisseja nopeuden ja luotettavuuden välillä. Diplomityö tarjoaa vertailun relaatiotietokantapohjaisen synkronisen klusterin ja muistinvaraisesti replikoidun takaisinkirjoittavan persistoinnin välillä. Sekä luotettavuus että hinta/teho -suhde analysoidaan.fi
dc.format.extentvii s. + 40 s.
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/98118
dc.identifier.urnURN:NBN:fi:aalto-2020122356945
dc.language.isoenen
dc.programme.majorOhjelmistotekniikkafi
dc.programme.mcodeT-106fi
dc.rights.accesslevelclosedAccess
dc.subject.keywordclusteringen
dc.subject.keywordklusterointifi
dc.subject.keywordworkflow engineen
dc.subject.keywordprosessikonefi
dc.titleClustering in workflow enginesen
dc.titleKlusterointi prosessikonejärjestelmissäfi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_02734
local.aalto.idinssi39911
local.aalto.openaccessno

Files