Lead Prioritization in B2B Sales: Creating Simple Rules with Machine Learning

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2022-06-14
Department
Major/Subject
Information Networks
Mcode
SCI3047
Degree programme
Master’s Programme in Information Networks
Language
en
Pages
81 + 5
Series
Abstract
All companies need to acquire new customers to grow. If a company were able to recognize the prospective customers most likely to buy its services and products, it could use its resources more efficiently to increase sales. Today, companies have access to an increasingly large amount of prospective customer data, which enables using analytics tools to interpret customer preferences and behavior. However, many companies are not yet taking full advantage of this data for lead prioritization, as implementing analytics solutions requires organizational resources and technical capabilities. This thesis developed a machine learning (ML) model for producing simple guidelines in order to prioritize business-to-business sales leads. To accomplish this, four alternative ML models were created, tested and evaluated to determine the most suitable model for rule creation. The L1 regularized logistic regression model was chosen based on its performance, interpretability and use in previous literature for creating simple rules. Three alternative sets of decision rules were then created by using a select-regress-and-round method. All decision rules performed considerably better in predicting sales from the historical lead data than the client’s original priority score. Furthermore, the performance of the best set of decision rules was very close to that of the ML models, even exceeding the performance of the decision tree model. Therefore, this thesis suggests that the logistic regression results could be simplified for practical use in lead scoring. Future work should focus on applying the select-regress-and-round method to lead scoring in order to test the suitability of the method in other settings and to find data-driven best practices for defining lead scores.

Jokainen yritys tarvitsee uusia asiakkaita kasvaakseen. Jos yritys pystyy tunnistamaan potentiaalisten asiakkaiden joukosta sellaiset, jotka ostavat todennäköisemmin kuin muut, se voi käyttää resurssejaan tehokkaammin ja kasvattaa myyntiään. Yrityksille on saatavilla jatkuvasti yhä enemmän dataa, mikä mahdollistaa analytiikkatyökalujen käyttämisen asiakkaiden tarpeiden ja käyttäytymisen tulkitsemiseen. Monet yritykset eivät kuitenkaan vielä hyödynnä datan täyttä potentiaalia liidien priorisoinnissa, koska analytiikkaratkaisujen implementointi vaatii organisaatiolta resursseja ja teknistä osaamista. Tässä diplomityössä luotiin koneoppimismalli, jonka pohjalta määritettiin yksinkertaisia sääntöjä yritysasiakasliidien priorisointiin. Neljä vaihtoehtoista koneoppimismallia luotiin, testattiin ja niiden suorituskykyä arvioitiin, jotta löydettäisiin sopivin malli sääntöjen tuottamista varten. L1-regularisoitu logistinen regressio valittiin pohjaksi sääntöjen luomiselle sen hyvän suorituskyvyn, helpon tulkittavuuden ja aiemman kirjallisuuden perusteella. Tämän jälkeen luotiin kolme vaihtoehtoista päätössääntöryhmää käyttäen valitse-regressoi-ja-pyöristä-metodia. Kaikki sääntöryhmät suoriutuivat selkeästi alkuperäistä priorisointipisteytystä paremmin kauppojen ennustamisessa historiallisesta liididatasta. Parhaan päätössääntöryhmän ennustuskyky ylsi erittäin lähelle koneoppimismallien ennustuskykyä, ja jopa ylitti päätöspuumallin ennustuskyvyn. Tässä diplomityössä ehdotetaankin, että logistisen regression tuloksia voidaan yksinkertaistaa päätössäännöiksi, joita voidaan hyödyntää liidien pisteytyksessä. Muiden tutkimusten tulee tulevaisuudessa soveltaa valitse-regressoi-ja-pyöristä-metodia liidien pisteytykseen ja varmistaa menetelmän soveltuvuus myös muissa ympäristöissä sekä etsiä mahdollisesti yleistettäviä parhaita käytäntöjä liidien datalähtöiseen pisteytykseen.
Description
Supervisor
Luoma, Jukka
Thesis advisor
Lekberg, Pauliina
Keywords
yritysasiakkaat, liidien priorisointi, liidien pisteytys, koneoppiminen, logistinen regressio, yksinkertaiset säännöt
Other note
Citation