A Content-Based Recommender System for an Online Video Platform
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Authors
Date
2019-12-16
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
57
Series
Abstract
An increasing amount of video content is available for anyone on the Internet. This tremendous amount of content has led us to information overload, where finding relevant content has become a challenging task. Recommender systems try to mitigate this problem by providing personalized recommendations of items that are likely to be interesting to a particular user. Recommender systems utilize different methods to analyze videos and users' behavioral data to generate the recommendations. However, metadata related to the videos might be inaccurate or insufficient to represent the actual content of the video. This research studies how content-based filtering can be used to generate personalized video recommendations, and how speech transcription analysis can enhance the recommendation of videos where sufficient metadata is not available. The recommender system was implemented for an existing online video platform where the content consists mostly of information-centric lecture and conference type videos. The performance of the recommender system was evaluated by conducting offline experiments which simulated users' actions based on an existing dataset from another video platform. The results indicated that the system is able to generate personalized recommendations for users based on their earlier actions on the system. The speech transcription analysis slightly increased precision when used together with user-generated fields. However, the precision and recall of transcript-only approaches were significantly lower than approaches using user-generated fields. The results were consistent with, and within the same magnitude as, results from previous research using the same dataset. However, future work and experiments are needed in order to verify how the system performs with real users, and how meaningful the recommendations are to the users.Videosisällön määrä Internetissä kasvaa jatkuvasti. Tämä kaikille saatavilla olevan tiedon aiheuttama informaation ylikuormitus on tehnyt olennaisen sisällön löytämisestä haastavaa. Suosittelujärjestelmät pyrkivät lieventämään tätä ongelmaa muodostamalla yksilöityjä suosituksia nimikkeistä, jotka ovat todennäköisesti kiinnostavia tietylle käyttäjälle. Suositusten pohjana käytetään yleensä videon metatietoja sekä tietoja käyttäjien aiemmista toimista alustalla. Videoiden metatiedot eivät kuitenkaan ole aina riittävän tarkkoja kuvaamaan videon todellista sisältöä täsmällisesti. Tässä työssä tutkittiin, kuinka sisältöpohjaista suodatusta voidaan käyttää yksilöllisten suositusten muodostamiseen, ja kuinka automaattista puheen transkriptiota voidaan käyttää apuna, kun riittäviä metatietoja ei ole saatavilla. Työn kokeellinen osuus toteutettiin implementoimalla puheen transkriptejä hyödyntävä sisältöpohjainen suosittelujärjestelmä olemassa olevalle online-videoalustalle. Kyseisen videoalustan tyypilliset videot ovat enimmäkseen informaatiopitoisia luento- ja konfferenssivideoita. Implementoidun suosittelujärjestelmän suorituskykyä arvioitiin simuloimalla käyttäjien toimintoja toiselta videoalustalta kerätyn tietoaineiston perusteella. Saadut tulokset osoittavat, että järjestelmä pystyy muodostamaan yksilöityjä suosituksia käyttäjälle hänen aiempien toimintojen perusteella. Puheen transkription käyttäminen yhdessä käyttäjän antamien metatietojen kanssa paransi hieman suositusten tarkkuutta, mutta pelkkään transkriptioon perustuvat tulokset olivat huomattavasti heikompia kuin käyttäjän antamiin metatietoihin perustuvat tulokset. Tulokset olivat johdonmukaisia samalla tietoaineistolla aiemmin saatuihin tuloksiin verrattuna. Tästä huolimatta lisätukimusta ja kokeita tarvitaan arvioimaan järjestelmän toimivuus oikeilla käyttäjillä, sekä arvioimaan kuinka merkitseviä suositukset ovat käyttäjille.Description
Supervisor
Hyvönen, EeroThesis advisor
Leskinen, PetriVainionpää, Janne
Keywords
recommender system, content-based filtering, video recommendation, speech transcript