Analyzing event logs to discover process models and to detect anomalies in real-time
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2017-10-04
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
54 + 7
Series
Abstract
Diagnostics and real-time data is crucial to running modern software operations. Different stakeholders need different granularities of information displayed in a quick and informative fashion. In addition, software operations change rapidly which makes it necessary for the diagnostic systems to be able to adapt quickly. In this thesis, I present a method to analyze past event logs to discover the underlying process models; I describe methods to combine these models with real-time information to create visualizations that are useful to even non-technical users; I leverage the models to show the users predictions about future events; I explore the possibilities of using machine learning to improve the accuracy of these predictions; and, I examine how the models can be used in conjunction with real-time events to automatically notify relevant people about any faults or anomalies in a system. I developed a system fulfilling the requirements of this project that was released to production. I tested the machine learning approach against a simple statistical model and, based on the testing, the machine learning models did not significantly increase the prediction accuracy in the data sets used. Despite the lack of benefits of the machine learning component, the system was successful and valuable to the end-users.Diagnostiikka ja reaaliaikainen informaation on elintärkeää nykyaikaisten ohjelmistoprojektien hallinnassa. Projektin eri osapuolilla on erilaisia tarpeita tiedon koostamiseen ja sen esittämiseen. Toisille yksinkertainen tieto on tärkeää, toisia suuret suuntaviivat hyödyttävät enemmän. Lisäksi ohjelmisto-operaatiot muuttuvat nopeasti, ja diagnostiikan on sopeuduttava muutoksiin nopeasti. Tässä diplomityössä esittelen tavan analysoida menneitä tapahtumalokitietoja niiden taustalla olevien prosessien mallintamiseksi. Kuvailen tapoja käyttää näitä malleja reaaliaikaisen informaation visualisointiin tavalla, josta on hyötyä jopa maallikkokäyttäjille. Käytän malleja hyväksi näyttääkseni käyttäjille ennusteita tulevista tapahtumista. Kokeilen myös, mikäli ennustusten tarkkuutta voisi parantaa hyödyntämällä koneoppimista. Lopuksi tarkastelen kuinka malleja voi hyödyntää reaaliaikaisten tapahtumien analysoinnissa mahdollistaen automaattisten virheilmoitusten lähettämisen niistä kiinnostuneille ihmisille. Projektin aikana kehitin järjestelmän joka täytti projektin alussa määritellyt vaatimukset. Tutkin koneoppimisen tehokkuutta verraten sitä yksinkertaisiin tilastollisiin malleihin. Testauksessa koneoppiminen ei merkittävästi lisännyt ennustusten tarkkuutta. Tästäkin huolimatta järjestelmä vastasi sille asetettuja tarpeita ja se julkaistiin loppukäyttäjille, jotka kokivat projektin onnistuneeksi ja arvokkaaksi.Description
Supervisor
Vuorimaa, PetriThesis advisor
Zhu, TaoForsbach Valle, Rafael
Keywords
process discovery, machine learning, event logs, visualization