On sales lead optimization of personal insurance products with multi-armed bandit algorithms
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2024-05-21
Department
Major/Subject
Systems and Operations Research
Mcode
SCI3055
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
56
Series
Abstract
Main purpose of personal insurance is to provide individuals and families financial protection against unexpected events and mitigate the associated risks. Whether it is unexpected medical expenses, permanent disability, or the loss of a family member, personal insurance serves as a vital safety net, offering peace of mind and stability in times of crisis. Moreover, it enables individuals and families to maintain their standard of living and pursue their long-term goals, such as homeownership, entrepreneurship, and saving for retirement, even in the event of unexpected setbacks. For insurance companies, it can be difficult to identify the target customer audience to advertise their personal insurance products. In this thesis, different multi-armed bandit strategies, such as ϵ-greedy, Upper Confidence Bound, and Thompson sampling, are investigated and applied to sales lead optimization problem. The aim of solving this optimization problem is to effectively identify the customer segments most likely to purchase personal insurance products. The empirical study comprises two distinct experiments: one conducted in a static environment and another one in a dynamic environment. Throughout the study, multi-armed bandit algorithms are evaluated and ranked based on their performance and robustness. Based on the results of this thesis, Upper Confidence Bound was the best multi-armed bandit algorithm in terms of performance and robustness across both experiments. On the other hand, Thompson sampling performed the worst and was the least robust among the applied multi-armed bandit algorithms. In addition, the results of this thesis concluded that the performance level of each multi-armed bandit algorithm depends on the context of the problem. Factors affecting the context are the settings of the simulated environment, purchasing probabilities of the customer segments, number of customer segments, and the parameters of the algorithm.Henkilövakuutusten päätarkoituksena on tarjota yksilöille ja perheille taloudellinen turva odottamattomilta tapahtumilta ja minimoida niihin liittyviä riskejä. Olivatpa kyseessä odottamattomat sairauskulut, pysyvä vamma tai perheenjäsenen menetys, henkilövakuutus toimii tärkeänä turvaverkkona tarjoten mielenrauhaa ja vakautta kriisiaikoina. Lisäksi se antaa yksilöille ja perheille mahdollisuuden ylläpitää elintasoaan ja saavuttaa pitkän aikavälin tavoitteitaan, kuten asunnon omistamisen, yrittäjyyden ja eläkkeelle säästämisen myös tilanteissa, jolloin tapahtuu jotakin odottamatonta ja harmillista. Vakuutusyhtiöille voi olla vaikeaa tunnistaa kohdeasiakasryhmä, joille markkinoida heidän henkilövakuutustuotteitaan. Tässä opinnäytetyössä tutkitaan erilaisia monikätisen rosvon strategioita, kuten ϵ-greedy, Upper Confidence Bound, ja Thompson sampling, joita sovelletaan myyntien optimointiongelmaan. Tämän optimointiongelman ratkaisemisen tavoitteena on tunnistaa tehokkaasti asiakassegmentit, jotka todennäköisimmin ostavat henkilövakuutustuotteita. Opinnäytetyön empiirinen tutkimus koostuu kahdesta erillisestä kokeesta, joista ensimmäinen koe tapahtuu staattisessa ympäristössä ja toinen koe dynaamisessa ympäristössä. Empiirisissä tutkimuksissa arvioidaan monikätisen rosvon algoritmeja niiden suorituskyvyn ja robustisuuden suhteen. Tämän opinnäytetyön tulosten perusteella Upper Confidence Bound oli suorituskyvyltään ja robustisuudeltaan paras monikätisen rosvon algoritmi molemmissa kokeissa. Thompson sampling suoriutui heikoiten ja oli vähiten robusti sovellettujen monikätisen rosvon algoritmien joukosta. Lisäksi tämän opinnäytetyön tuloksista tultiin siihen johtopäätökseen, että jokaisen monikätisen rosvon algoritmin suoritustaso riippuu ongelman kontekstista. Kontekstiin vaikuttavia tekijöitä ovat simuloidun ympäristön asetukset, asiakassegmenttien ostotodennäköisyydet, asiakassegmenttien lukumäärä, ja algoritmin parametrit.Description
Supervisor
Ilmonen, PauliinaThesis advisor
Jaluta, AlmoKeywords
personal insurance, customer segments, multi-armed bandit, optimization, exploration-exploitation dilemma