Predicting motives for video-on-demand content

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Department

Mcode

SCI3044

Language

en

Pages

66 + 7

Series

Abstract

Media content providers need to understand their users' needs and behaviors to be able to choose what kind of content they should produce and purchase. They may also be interested in providing a vast selection of content that has something to offer everyone. Analytics help the providers understand when the content was consumed, by which users and by which devices, but it cannot tell why it was consumed. To acquiring the motives behind the consumption would traditionally require the use of surveys. This is however not feasible to do for all the content, so there needs to be a way to estimate the motives. This thesis studied how viewing motives can be predicted for video content on a video-on-demand service. The features used to predict motives were genres and contextual features (device, time of day, day of week) derived from analytics events. The problems that were studied were which features and machine learning methods worked best for predicting motives. In previous research, motives have been predicted for users at specific times during the day. There are also several media studies that have analyzed the consumption motives for different types of media and genres. However, to the best of our knowledge, the prediction of consumption motives has not been attempted earlier for media content. The best result for predicting motives was acquired using all features with a neural network with 8 hidden neurons in one hidden layer. This network had a mean RMSE 0.097 in the cross-validation. This is a significant improvement over the mean RMSE of the baseline which was 0.233. The kernel ridge regression models performed approximately equally well as the neural networks, and the dimensionality reduction methods improved the results slightly when used. The two genres used as features were able to predict motives better than the contextual features. The best result was however obtained by combining all the features.

Medieinnehållsleverantörer måste kunna förstå sina användares behov och beteenden för att kunna välja vilken typ av innehåll de ska producera och köpa in. De kan också vara intresserade av att förse användarna med ett brett innehållsurval som har något att erbjuda alla användare. Analysverktyg kan berätta leverantörerna när innehållet konsumeras, av vilka användare och med vilka apparater, men det kan inte berätta orsaken bakom konsumtionen. Erhållandet av motiven bakom konsumtionen skulle dock traditionellt kräva enkätundersökningar. Detta är emellertid inte möjligt att göra för allt innehåll, och därmed behövs det sätt för att upskatta motiven. Det här arbetet undersökte hur väl tittarmotiv kan förutsägas för videoinnehåll på en video på begäran-tjänst. Indatan som användes för att förutsäga motiv bestod av genrer och kontextuell data (apparat, veckodag, tidpunk på dygnet) som härletts med analysverktyg. Problemen som studerades var vilka indata och maskininlärningsmetoder som fungerade bäst för att förutsäga motiv. Tidigare undersökningar har studerat motivförutsägelse för användare vid specifika tidpunkter på dygnet. Det finns också flera medieundersökningar som har studerat konsumtionsmotiven bakom olika typer av media och genrer. Till vår kännedom har dock konsumtionsmotivsförutsägelse inte prövats tidigare för medieinnehåll. Det bästa resultatet i motivförutsägelse ficks genom att använda all indata med ett neuronnät med 8 dolda neuroner i ett dolt lager. Detta nätverk hade en medeltals RMSE på 0,097 i korsvalideringen. Detta är en märkbar förbättring jämfört med referensmodellen som hade en medeltals RMSE på 0,233. Kernel ridge regression-modellerna presterade ungefär lika bra som neuronnäten, och dimensionsreducering förbättrade resultaten en aning då det användes. De två genren som användes som funktioner kunde förutse motiv bättre än kontextuell data. Det bästa resultatet uppnåddes dock genom att kombinera all indata.

Description

Supervisor

Gionis, Aristides

Thesis advisor

Kinnunen, Teemu

Other note

Citation