Analyzing event logs to discover process models and to detect anomalies in real-time

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2017-10-04

Department

Major/Subject

Computer Science

Mcode

SCI3042

Degree programme

Master’s Programme in Computer, Communication and Information Sciences

Language

en

Pages

54 + 7

Series

Abstract

Diagnostics and real-time data is crucial to running modern software operations. Different stakeholders need different granularities of information displayed in a quick and informative fashion. In addition, software operations change rapidly which makes it necessary for the diagnostic systems to be able to adapt quickly. In this thesis, I present a method to analyze past event logs to discover the underlying process models; I describe methods to combine these models with real-time information to create visualizations that are useful to even non-technical users; I leverage the models to show the users predictions about future events; I explore the possibilities of using machine learning to improve the accuracy of these predictions; and, I examine how the models can be used in conjunction with real-time events to automatically notify relevant people about any faults or anomalies in a system. I developed a system fulfilling the requirements of this project that was released to production. I tested the machine learning approach against a simple statistical model and, based on the testing, the machine learning models did not significantly increase the prediction accuracy in the data sets used. Despite the lack of benefits of the machine learning component, the system was successful and valuable to the end-users.

Diagnostiikka ja reaaliaikainen informaation on elintärkeää nykyaikaisten ohjelmistoprojektien hallinnassa. Projektin eri osapuolilla on erilaisia tarpeita tiedon koostamiseen ja sen esittämiseen. Toisille yksinkertainen tieto on tärkeää, toisia suuret suuntaviivat hyödyttävät enemmän. Lisäksi ohjelmisto-operaatiot muuttuvat nopeasti, ja diagnostiikan on sopeuduttava muutoksiin nopeasti. Tässä diplomityössä esittelen tavan analysoida menneitä tapahtumalokitietoja niiden taustalla olevien prosessien mallintamiseksi. Kuvailen tapoja käyttää näitä malleja reaaliaikaisen informaation visualisointiin tavalla, josta on hyötyä jopa maallikkokäyttäjille. Käytän malleja hyväksi näyttääkseni käyttäjille ennusteita tulevista tapahtumista. Kokeilen myös, mikäli ennustusten tarkkuutta voisi parantaa hyödyntämällä koneoppimista. Lopuksi tarkastelen kuinka malleja voi hyödyntää reaaliaikaisten tapahtumien analysoinnissa mahdollistaen automaattisten virheilmoitusten lähettämisen niistä kiinnostuneille ihmisille. Projektin aikana kehitin järjestelmän joka täytti projektin alussa määritellyt vaatimukset. Tutkin koneoppimisen tehokkuutta verraten sitä yksinkertaisiin tilastollisiin malleihin. Testauksessa koneoppiminen ei merkittävästi lisännyt ennustusten tarkkuutta. Tästäkin huolimatta järjestelmä vastasi sille asetettuja tarpeita ja se julkaistiin loppukäyttäjille, jotka kokivat projektin onnistuneeksi ja arvokkaaksi.

Description

Supervisor

Vuorimaa, Petri

Thesis advisor

Zhu, Tao
Forsbach Valle, Rafael

Keywords

process discovery, machine learning, event logs, visualization

Other note

Citation