Suosittelujärjestelmä yritystietopalveluun
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2022-07-29
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
fi
Pages
52+2
Series
Abstract
Tämän opinnäytetyön tavoitteena on kehittää prototyyppi suosittelujärjestelmästä Alma Talent Analysaattori -yritystietopalveluun. Suosittelujärjestelmä on tyypillisesti web-palvelun osa, jossa algoritmi auttaa käyttäjiä löytämään heitä kiinnostavia kohteita sen perusteella, miten he arvioivat muita kohteita. Analysaattorin tapauksessa halutaan auttaa käyttäjiä löytämään kiinnostavia yrityksiä lisättäväksi heidän luomiinsa yritysjoukkoihin. Tässä työssä tarkastellaan kolmenlaisia suosittelumenetelmiä: yhteistoiminnalliseen suodattamiseen perustuvia, sisältöpohjaisia sekä näiden hybridejä. Teoreettisen taustan ja Analysaattorin asettaman ympäristön perusteella todetaan, että hybridimenetelmä on paras valinta prototyypin rakentamiseen. Prototyypin rakentamiseen valitaan LightFM-suosittelukirjasto sen monipuolisuuden, suorituskyvyn ja helpon käyttöönoton takia. Prototyyppejä kehitetään iteratiivisesti ja niiden suorituskykyä mitataan kahden tarkkuusmittarin avulla: AUC:n (Area Under Curve) ja tarkkuusarvo@10:n. AUC:n voi tulkita todennäköisyytenä, että sattumanvaraisesti valittua positiivista testiesimerkkiä suositellaan ennen negatiivista esimerkkiä. Tarkkuusarvo@10 puolestaan kertoo, kuinka iso osuus ensimmäisestä kymmenestä suosituksesta on oikeita positiivisia. Iteraatioiden tavoitteena on selvittää hybridimenetelmän toimivuus verrattuna yhteistoiminnalliseen menetelmään, sopivat kohteiden metatiedot sekä sopivat arvot osalle suosittelujärjestelmän koulutusta ohjaavista hyperparametreista. Iteraatioissa paras hybridiprototyyppi saavutti 9,3 % tarkkuusarvon ja paras yhteistoiminnallisen suodattamisen prototyyppi 8,4 %. Tämä tuki oletusta hybridimenetelmän valinnan oikeellisuudesta. Korkein tarkkuusarvo itsessään jäi matalaksi ja avoimeksi kysymykseksi jäi esimerkiksi, kuinka paljon ryhmän koko vaikutti tarkkuusarvoon. AUC oli parhaissa prototyypeissä jopa 0,99, mistä pääteltiin, että yleisesti kiinnostavien yritysten tunnistaminen oli Analysaattorin suositteluongelmassa helppoa. Tärkein lopputulos oli alustavia suosituksia antava suosittelujärjestelmän prototyyppi, jonka avulla voidaan jatkokehittää käyttöliittymällinen versio käyttäjätestaamista varten.The objective of this thesis is to develop a recommender system prototype for the company information service called Alma Talent Analysaattori. Recommender systems are typically a part of a web service where an algorithm helps users in finding relevant items based on their ratings of other items. In Analysaattori, the aim is to help users to find relevant companies to add into user-created company groups. In this thesis, three types of recommending methods are considered: collaborative filtering, content-based and hybrids of these. After delving into the theoretical background and the environment set by Analysaattori it is determined that a hybrid method is best for creating the prototype. A python programming library called LightFM is selected for developing the prototype because it is flexible, performant and easy to get started with. Prototypes are developed in iterations and two accuracy metrics are used to evaluate them: AUC (Area Under Curve) and precision@10 (percentage of true positive in ten first recommendations). AUC is the probability that a random positive test example is recommended before a negative example. The aim of the iterations is to find out how well the hybrid method compares to collaborative filtering in practice, which item metadata to use and which values are best for some of the hyperparameters. Hyperparameters control the training process of the recommender system. During the iterations, the best hybrid prototype achieved a precision of 9,3 % and the best collaborative filtering prototype a precision of 8,4 %. This supported the hypothesis that a hybrid method is best for the recommendation problem at hand. The highest achieved precision by itself was low and it remained unclear how much for example the size of the group affects the precision of recommendations. AUC was as high as 0,99 for the best prototypes. It was deduced from this that finding the generally interesting companies was easy in the case of Analysaattori. The most important result was the prototype that that can be used as a basis for a new user-testable prototype with a user inteface.Description
Supervisor
Hyvönen, EeroThesis advisor
Kaartinen, AnssiKeywords
suosittelujärjestelmät, hybridisuosittelumenetelmä, yritystietopalvelu, LightFM