Predictive analytics for improved problem management

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Manninen, Esa
dc.contributor.author Virtanen, Markus
dc.date.accessioned 2014-05-13T07:37:24Z
dc.date.available 2014-05-13T07:37:24Z
dc.date.issued 2014-05-05
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/13022
dc.description.abstract This Thesis studies the possible data analysis methods to improve the problem management service at Elisa corporation. The primary objective is to find and evaluate appropriate data analysis methods to understand the underlying problem causes and to develop predictive models from hypotheses and data, so that the problems could be prevented or minimized before the customer feels she or he has to contact the customer service. Apache Hadoop framework and R programming language have been integrated to make a linearly scalable analytics process possible. Customer data is first imported to research computer so that there is no need to execute analytical queries on the production databases. The analytics phase is divided into two parts both helping with data-based decision making. At first, exploratory data analysis is used to find valuable information from the historical data with the help of textual data summaries and visualizations. After that, when there is cleaned data and a good understanding has been obtained of its behaviour, predictive analytics is included to make forecasts about the future behaviour. Out of all the evaluated machine learning algorithms for the given task, the Random Forest algorithm had the best performance. The final tuned model predicted the right outcome for approximately 77 % of problem tickets minimizing the need to send a repair technician if a customer's Internet connection works well. en
dc.description.abstract Tämä diplomityö tutkii mahdollisia data-analyysimenetelmiä parantaakseen Elisan vianhallintapalvelua. Ensisijainen tarkoitus on löytää ja evaluoida sopivia menetelmiä, jotka antavat ymmärrystä vikoihin, ja luoda ennustemalleja hypoteesien ja datan perusteella, joilla ongelmat saataisiin estettyä tai minimoitua ennen kuin asiakkaan tarvitsee ottaa yhteyttä asiakaspalveluun. Apachen Hadoop ohjelmisto ja R-ohjelmointikieli integroitiin tehden lineaarisesti skaalautuva analyysiprosessi mahdolliseksi. Asiakkaan data haettiin ensin tutkimustietokoneelle, jotta analyyttiset haut eivät kuormita tuotantotietokantoja. Analyysivaihe on jaettu kahteen osaan, jotka molemmat auttavat dataan perustuvaa päätöksentekoa. Ensin tutkivia analyysimenetelmiä käytetään löytämään arvokasta informaatiota historiallisesta datasta hyödyntäen tekstipohjaisia yhteenvetoja ja visuaalisia menetelmiä. Seuraavaksi, kun data on siivottua ja siitä on hyvä käsitys, prediktiivistä analyytiikkaa käytetään luomaan ennusteita tulevasta. Kaikista tarkastelluista koneoppimismalleista Random Forest algoritmilla oli paras suorituskyky annettuun ennustetehtävään. Lopullinen optimoitu malli ennusti oikein 77 % kaikista ongelmatiketeistä vähentäen tarvetta lähettää korjaaja kentälle asiakkaan Internet-yhteyden toimiessa hyvin. fi
dc.format.extent 48+2
dc.format.mimetype application/pdf en
dc.language.iso en en
dc.title Predictive analytics for improved problem management en
dc.title Ongelmanhallinnan parantaminen ennustavalla analytiikalla fi
dc.type G2 Pro gradu, diplomityö en
dc.contributor.school Perustieteiden korkeakoulu fi
dc.subject.keyword data analysis en
dc.subject.keyword predictive analysis en
dc.subject.keyword predictive maintenance en
dc.subject.keyword geostatistics en
dc.subject.keyword big data en
dc.subject.keyword machine learning en
dc.subject.keyword random forest en
dc.subject.keyword Hadoop en
dc.subject.keyword Hive en
dc.subject.keyword R en
dc.subject.keyword data-analyysi fi
dc.subject.keyword ennakoiva analytiikka fi
dc.subject.keyword ennakoiva huolto fi
dc.subject.keyword geostatistiikka fi
dc.subject.keyword big data fi
dc.subject.keyword koneoppiminen fi
dc.subject.keyword random forest fi
dc.subject.keyword Hadoop fi
dc.subject.keyword Hive fi
dc.identifier.urn URN:NBN:fi:aalto-201405131812
dc.programme.major Ohjelmistotekniikka fi
dc.programme.mcode T-220 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Diplomityö fi
dc.contributor.supervisor Heljanko, Keijo
dc.programme Tietotekniikan koulutusohjelma fi


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse

My Account