Predicting demographics and motives of website users

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Kinnunen, Teemu
dc.contributor.author Kärkkäinen, Kimmo
dc.date.accessioned 2016-10-12T11:41:57Z
dc.date.available 2016-10-12T11:41:57Z
dc.date.issued 2016-09-26
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/22843
dc.description.abstract Understanding customers is important. In the case of content providers, this means knowing which groups of people are viewing different types of content, and even more importantly, which groups of people are not yet your active users. However, information about website's visitors is not typically available, as people might visit websites without making an account. Therefore, there is a need for finding out information about the users in other ways. This thesis studied how accurately demographics (age and gender) and motives can be predicted for website visitors. The predictions were made using the analytics data from a single website. This data included what content the users had viewed, at which times of the day they were active, and what browser and operating system they were using. In addition, this thesis studied how much data is needed to make the predictions, and which features in the analytics data are useful for these predictions. It turned out to be possible to predict the demographics with good accuracy. Gender was the easiest to predict with 77.8 % accuracy. Age prediction with four age groups had the weighted F1 score of 0.513. Predicting motives was more difficult, and only few of the motives were predicted more accurately than when choosing the most common motives for everyone. The prediction accuracy depended strongly on how much content the users had viewed. Also, the other features in the analytics data were very weak predictors for the demographics, and therefore they did not increase the prediction accuracy significantly after the user had viewed some content. en
dc.description.abstract Asiakkaiden ymmärtäminen on tärkeää. Sisällöntuottajien kohdalla tämä tarkoittaa ymmärrystä siitä, mitkä ihmisryhmät katsovat erilaisia sisältöjä, ja vieläkin tärkeämmin tietoa siitä, mitä ryhmiä ei ole vielä tavoitettu. Verkkosivun kävijöistä ei kuitenkaan ole usein saatavilla tarkempaa tietoa, koska ihmiset vierailevat sivustoilla ilman rekisteröitymistä. Tämän vuoksi tieto käyttäjistä täytyy selvittää muilla tavoin. Tämä diplomityö tutki kuinka tarkasti verkkosivun vierailijoiden demografiat (ikä ja sukupuoli) sekä motiivit voidaan ennustaa. Ennusteet tehtiin yksittäisen verkkosivuston analytiikkadataan pohjautuen. Kyseinen analytiikkadata sisälsi tiedon käyttäjien katsomasta sisällöstä, mihin aikoihin käyttäjät olivat aktiivisia ja mitä selainta sekä käyttöjärjestelmää he käyttivät. Lisäksi tämä diplomityö tutki kuinka paljon käyttödataa ennusteiden tekeminen vaatii sekä mitkä piirteet ovat hyödyllisiä ennustamisessa. Demografioiden ennustaminen osoittautui mahdolliseksi hyvällä tarkkuudella. Sukupuolen ennustaminen oli helpointa, ja sen tarkkuus oli 77,8 %. Iän ennustaminen neljää ikäryhmää käyttäen sai painotetun F1-arvon 0,513. Motiivien ennustaminen oli hankalampaa, ja vain osa motiiveista pystyttiin ennustamaan tarkemmin kuin mitä suosituimman vastauksen valitseminen kaikille olisi antanut. Ennustuksen tarkkuus riippui vahvasti käyttäjän katsoman sisällön määrästä. Lisäksi analytiikkadatassa vain käyttäjien katsoma sisältö oli merkittävä tekijä, eikä muiden piirteiden lisääminen parantanut tarkkuutta merkittävästi, kun käyttäjä oli katsonut jotakin sisältöä. fi
dc.format.extent 66 + 8
dc.format.mimetype application/pdf en
dc.language.iso en en
dc.title Predicting demographics and motives of website users en
dc.title Verkkosivuston käyttäjien demografioiden ja motiivien ennustaminen fi
dc.type G2 Pro gradu, diplomityö fi
dc.contributor.school Perustieteiden korkeakoulu fi
dc.subject.keyword demographics en
dc.subject.keyword motive en
dc.subject.keyword website en
dc.subject.keyword machine learning en
dc.subject.keyword analytics en
dc.identifier.urn URN:NBN:fi:aalto-201610124943
dc.programme.major Computer Science fi
dc.programme.mcode SCI3042 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Diplomityö fi
dc.contributor.supervisor Gionis, Aristides
dc.programme Master’s Programme in Computer, Communication and Information Sciences fi


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse