On sales lead optimization of personal insurance products with multi-armed bandit algorithms

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2024-05-21

Department

Major/Subject

Systems and Operations Research

Mcode

SCI3055

Degree programme

Master’s Programme in Mathematics and Operations Research

Language

en

Pages

56

Series

Abstract

Main purpose of personal insurance is to provide individuals and families financial protection against unexpected events and mitigate the associated risks. Whether it is unexpected medical expenses, permanent disability, or the loss of a family member, personal insurance serves as a vital safety net, offering peace of mind and stability in times of crisis. Moreover, it enables individuals and families to maintain their standard of living and pursue their long-term goals, such as homeownership, entrepreneurship, and saving for retirement, even in the event of unexpected setbacks. For insurance companies, it can be difficult to identify the target customer audience to advertise their personal insurance products. In this thesis, different multi-armed bandit strategies, such as ϵ-greedy, Upper Confidence Bound, and Thompson sampling, are investigated and applied to sales lead optimization problem. The aim of solving this optimization problem is to effectively identify the customer segments most likely to purchase personal insurance products. The empirical study comprises two distinct experiments: one conducted in a static environment and another one in a dynamic environment. Throughout the study, multi-armed bandit algorithms are evaluated and ranked based on their performance and robustness. Based on the results of this thesis, Upper Confidence Bound was the best multi-armed bandit algorithm in terms of performance and robustness across both experiments. On the other hand, Thompson sampling performed the worst and was the least robust among the applied multi-armed bandit algorithms. In addition, the results of this thesis concluded that the performance level of each multi-armed bandit algorithm depends on the context of the problem. Factors affecting the context are the settings of the simulated environment, purchasing probabilities of the customer segments, number of customer segments, and the parameters of the algorithm.

Henkilövakuutusten päätarkoituksena on tarjota yksilöille ja perheille taloudellinen turva odottamattomilta tapahtumilta ja minimoida niihin liittyviä riskejä. Olivatpa kyseessä odottamattomat sairauskulut, pysyvä vamma tai perheenjäsenen menetys, henkilövakuutus toimii tärkeänä turvaverkkona tarjoten mielenrauhaa ja vakautta kriisiaikoina. Lisäksi se antaa yksilöille ja perheille mahdollisuuden ylläpitää elintasoaan ja saavuttaa pitkän aikavälin tavoitteitaan, kuten asunnon omistamisen, yrittäjyyden ja eläkkeelle säästämisen myös tilanteissa, jolloin tapahtuu jotakin odottamatonta ja harmillista. Vakuutusyhtiöille voi olla vaikeaa tunnistaa kohdeasiakasryhmä, joille markkinoida heidän henkilövakuutustuotteitaan. Tässä opinnäytetyössä tutkitaan erilaisia monikätisen rosvon strategioita, kuten ϵ-greedy, Upper Confidence Bound, ja Thompson sampling, joita sovelletaan myyntien optimointiongelmaan. Tämän optimointiongelman ratkaisemisen tavoitteena on tunnistaa tehokkaasti asiakassegmentit, jotka todennäköisimmin ostavat henkilövakuutustuotteita. Opinnäytetyön empiirinen tutkimus koostuu kahdesta erillisestä kokeesta, joista ensimmäinen koe tapahtuu staattisessa ympäristössä ja toinen koe dynaamisessa ympäristössä. Empiirisissä tutkimuksissa arvioidaan monikätisen rosvon algoritmeja niiden suorituskyvyn ja robustisuuden suhteen. Tämän opinnäytetyön tulosten perusteella Upper Confidence Bound oli suorituskyvyltään ja robustisuudeltaan paras monikätisen rosvon algoritmi molemmissa kokeissa. Thompson sampling suoriutui heikoiten ja oli vähiten robusti sovellettujen monikätisen rosvon algoritmien joukosta. Lisäksi tämän opinnäytetyön tuloksista tultiin siihen johtopäätökseen, että jokaisen monikätisen rosvon algoritmin suoritustaso riippuu ongelman kontekstista. Kontekstiin vaikuttavia tekijöitä ovat simuloidun ympäristön asetukset, asiakassegmenttien ostotodennäköisyydet, asiakassegmenttien lukumäärä, ja algoritmin parametrit.

Description

Supervisor

Ilmonen, Pauliina

Thesis advisor

Jaluta, Almo

Keywords

personal insurance, customer segments, multi-armed bandit, optimization, exploration-exploitation dilemma

Other note

Citation