Predicting service contract churn with decision tree models

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2017-01-17
Department
Major/Subject
Systems and Operations Research
Mcode
SCI3055
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
vii + 53
Series
Abstract
Customer attrition is a central problem in sectors, whose revenue depend on customer relationships and it is more costly to acquire new customers than it is to retain current ones. Thus, targeted approaches are useful to reduce customer churn, given that the churning customers are correctly identified early enough. The objective of this thesis is to model the attrition of service contracts, which can be described as customers and to predict their risk of being cancelled. Furthermore, causal reasons for predicting a contract for being risky and the predictive power of models are the key focus area. Understanding the reasons behind unsatisfactory customers is also important and can be used in the development of future business practices. However, this is only considered to a limited degree due to the proprietary and sensitive nature of the used data. The modeling is done by applying Classification and regression trees, Random forests, Extremely randomized trees and XGBoost algorithms. It is found that XGBoost algorithm produces the best model in terms of accuracy, while we also gain an aggregate picture of the model's structure and related reasons for loosing service contracts. Rest of the models conform to these results and thus the models are capable of separating between risky and non-risky contracts.

Asiakaspoistuma on keskeinen ongelma aloilla, joiden liikevaihto määräytyy asiakassuhteista ja on kannattavampaa säilyttää jo olemassa olevat asiakassuhteet kuin hankkia uusia. Tämän takia kohdennetut kampanjat asiakaspoistuman vähentämiseksi ovat tärkeitä, jotta ne asiakkaat, jotka ovat aikeissa poistua voidaan tunnistaa tarpeeksi ajoissa. Työn tarkoituksena on mallintaa palvelusopimusten poistumaa ja ennustaa niiden peruuntumisen riskiä. Palvelusopimukset voidaan rinnastaa asiakassuhteisiin. Työssä korostetaan mallien ennustekykyä ja niiden antamia syy-seuraussuhteita sopimusten peruuntumisille. Mallien antamaa tietoa voidaan tulevaisuudessa hyödyntää yritystoiminnan kehittämisessä. Mallien tulkittavuudessa ei kuitenkaan pureuduta syvälle yksityiskohtiin, koska käytetty data on luottamuksellista yksityisdataa yrityksen asiakastietojärjestelmistä. Mallinnus tehdään käyttämällä Classification and regression tree, Random forests, Extremely randomized trees ja XGBoost algoritmeja. Jokainen malli kykenee erottelemaan peruuntumiselle riskialttiit sopimukset, minkä lisäksi niiden rakenteesta ja poistumaan vaikuttavista tekijöistä saadaan muodostettua kokonaiskuva. Käytetyistä päätöspuualgoritmeista XGBoost tuotti parhaan mallin, kun hyvyyttä tarkastellaan ennustetarkkuudella.
Description
Supervisor
Salo, Ahti
Thesis advisor
Hänninen, Olli
Keywords
customer churn, decision trees, CRM, random forests, XGBoost
Other note
Citation