Bayesian student modeling in a learning game

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
School of Science | Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2010
Major/Subject
Tietojenkäsittelyteoria
Mcode
T-79
Degree programme
Language
en
Pages
vii + 55
Series
Abstract
The possibility of early identification of dyslexia has motivated the development of the computer game "Graphogame", which is designed for the early prevention of reading difficulties. It is important that the learning content in the game is adapted for individual players so that the game will be neither too difficult nor too easy. For this purpose, it is helpful to have a precisely defined statistical model of the player. In this thesis, we present a Bayesian model of the player. The model can be used for the selection of effective game content and for tracking the players' progress. The model is essentially a combination of factor analysis and the logistic model. In the game, the players are presented with choice situations, where the letters of the alphabet are displayed on the screen. The task is to select the letter that corresponds to the sound that is played at the same time. Information about the choice situations and the choices the players make is stored in game logs, which we use to fit the model. We are basically performing a factor analysis on the skills of the players, which are observable only through the choices the players make. There are three pre-existing statistical player models for Graphogame, but in all of them only one player is taken into account at a time, independently of all the other players. In contrast, in the model proposed in this thesis all the players are considered simultaneously, allowing the model to learn statistical properties of the player population. The pre-existing model best suited for the analysis of the game data is used to construct baseline models in this thesis. The employed model and fitting method are tested using simple simulations as well as real game log data. The model works well in the simulations, if there is enough data of each player. The model also predicts player choices in the real data better than the baseline models.

Lukihäiriöiden varhaisen tunnistamisen mahdollisuus on motivoinut Ekapeli-nimisen, lukivaikeuksien ennaltaehkäisemiseen tarkoitetun pelin kehitystä. On tärkeää, että pelin sisältö ei ole pelaajalle liian vaikeaa eikä myöskään liian helppoa. Sopivantasoisen sisällön valitsemista varten on hyödyllistä olla tarkkaan määritelty tilastollinen malli pelaajasta. Tässä työssä esitetään bayesiläinen oppilasmalli, jota voidaan käyttää tehokkaan pelisisällön valitsemiseen ja pelaajan edistymisen seurantaan. Malli on käytännössä faktorianalyysin ja logistisen mallin yhdistelmä. Pelissä pelaajalle esitetään valintatilanteita, joissa näytetään aakkosia ruudulla. Pelaajan tehtävänä on valita kirjain, joka vastaa samanaikaisesti toistettua ääntä. Tiedot valintatilanteista ja pelaajien tekemistä valinnoista on tallennettu pelikirjauksiin, joita käytetään tässä työssä mallin sovittamiseen. Mallin sovitus vastaa periaatteessa pelaajien taitojen faktorianalyysiä, mutta taidot ovat havaittavissa vain pelaajien tekemien valintojen kautta. Ekapelille on kolme jo olemassa olevaa tilastollista pelaajamallia, mutta kaikissa niissä tarkastellaan vain yhtä pelaajaa kerrallaan ja pelaajat oletetaan tilastollisesti toisistaan riippumattomiksi. Tässä työssä kuvatussa mallissa sitä vastoin pelaajia tarkastellaan samanaikaisesti, minkä ansiosta malli pystyy oppimaan pelaajapopulaation tilastollisia ominaisuuksia. Parhaiten pelidatan analyysiin soveltuvaa olemassa olevaa mallia käytetään tässä työssä pohjatasomallien rakentamisen perustana. Mallia ja sen sovitusmenetelmää testataan käyttämällä yksinkertaisia simulaatioita sekä todellista dataa pelistä. Malli toimii hyvin simulaatioissa, jos kustakin pelaajasta on riittävästi dataa. Malli myös ennustaa todellisessa datassa olevia pelaajien valintoja paremmin kuin pohjatasomallit.
Description
Supervisor
Orponen, Pekka
Thesis advisor
Kujala, Janne
Keywords
factor analysis, faktorianalyysi, logistic model, logistinen malli, Laplace approximation, Laplacen approksimaatio, Luce's choice axiom, Lucen valinnan aksiooma, Bayesian statistics, bayesläinen tilastotiede, machine learning, koneoppiminen, learning game, oppimispeli
Other note
Citation