Utilization of machine learning methods for predicting new retail investment clients

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Sähkötekniikan korkeakoulu | Master's thesis
Date
2020-08-17
Department
Major/Subject
Control, Robotics and Autonomous Systems
Mcode
ELEC3025
Degree programme
AEE - Master’s Programme in Automation and Electrical Engineering (TS2013)
Language
en
Pages
72+5
Series
Abstract
Consumers have multiple reasons that lead to the starting point of investing. Reasons behind the start can vary from intentional and well-structured to rather unintentional and disorganized concepts. On a wide scale, cultural and societal influence have their own impact and then on a mundane level, investments can be received as a gift or an inheritance. Altogether, there exists numerous events that can lead one consumer to start investing. This research utilized machine learning to identifying which Finnish consumers are most likely to start investing. Machine learning models used were classification and regression algorithms such as Random Forest, Extremely Randomized Trees and Gradient Boosting. It was found that the Gradient boosting models performed best for the problem, however all models were able to classify the banks retail customers who would start investing in the following month with a TPR above 0.7 and AUC-score above 0.7. The main findings were that those Finns who are most likely to start investing intentionally belong to a target group with the following parameters: aged between 25 and 50, live within or close to a big city, income above 2000 euros per month and deposits above 10000 euros.

Konsumenter har flera olika motiv som kan vara utgångspunkten för att börja investera. Anledningen till att börja investera kan variera från avsiktliga och välstrukturerade till organiserade och spontana. Generellt har kultur och samhället inflytande inverkan på investeringsbeteende. På konkret basis kan investeringar tas emot som gåva eller i arv. Sammanfattningsvis finns det många faktorer som kan leda till att konsumenter börjar investera. I denna forskning utnyttjades maskininlärning för att identifiera vilka finska konsumentgrupper som med högst sannolikhet börjar investera. Maskininlärningsmodeller som användes var klassificerings- och regressionsalgoritmer som Random Forest, Extremely Randomised Trees och Gradient Boosting. Det visade sig att Gradient Boosting modellerna fungerade bäst för forskningsproblemet, men alla modeller kunde dock gruppera bankernas personkunder som började investera inom följande månad med en TPR över 0,7 och AUC-score över 0,7. De mest centrala resultaten var att de finländare som med högst sannolikhet börjar investera medvetet tillhör en målgrupp med specifika egenskaper. Resultaten visar att målgruppen är i åldern 25–50 år, bor i eller nära en storstad, har en inkomst på över 2000 euro per månad och har depositioner på över 10000 euro.
Description
Supervisor
Babbar, Rohit
Thesis advisor
Hakkarainen, Joona
Keywords
machine learning, decision trees, finns investment behavior, predict individual interest to start investing
Other note
Citation