Differentiable User Models

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2021-08-23
Department
Major/Subject
Machine Learning, Data Science and Artificial Intelligence
Mcode
SCI3044
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
54
Series
Abstract
The increasing interaction between humans and computers has pressured computational systems to customize their behavior individually for each user. User modeling is a branch of research that has been frequently proposed to address this challenge. Notably, user models are computational representations of individual users constructed based on observed user behaviors. Current user modeling methods, however, often have limited applicability in practice. For instance, existing methods may be explicitly designed for specific user modeling scenarios or might not be compatible with gradient-based methods. The main contribution of this work is a methodology for learning differentiable user models. In particular, the proposed method trains Neural Process surrogates to imitate existing generative processes for user behavior. Enforcing differentiability on the structure of the surrogates guarantees compatibility with existing gradient-based methods. This allows, for instance, gradient-based online inference for individual user model parameters and utilization of modern computational infrastructures. The proposed approach aims to be utilizable in a wide range of user modeling scenarios with few assumptions. The proposed methodology is experimented with in two user modeling scenarios. Both experiments evaluate the capability of the learned surrogates to represent the likelihood of user behavior as a function of user parameters. As a result of these experiments, it was found that the differentiable surrogates may learn to explain user behavior with similar predictive performance to the ground-truth generative processes of user behavior if given correct user parameters. In addition, it was found that the surrogates can learn to capture the uncertainty regarding the stochasticity of generative processes for user behavior. The obtained results suggest that the learned surrogates may be successfully utilized for user parameter inference and for learning individualized user models.

Ihmisten ja tietokonejärjestelmien välisen vuorovaikutuksen lisääntyminen on aiheuttanut kysynnän järjestelmille, jotka kykenevät yksilöimään toimintaansa erikseen yksittäisille käyttäjille. Käyttäjämallinnusta on usein ehdotettu ratkaisuksi tähän haasteeseen. Käyttäjämallit ovat laskennallisia malleja yksittäisistä käyttäjistä, joita voidaan rakentaa hyödyntämällä havaittua käyttäjän toimintaa. Nykyiset menetelmät saattavat kuitenkin olla suunniteltu toimimaan vain tietyissä mallinnusskenaarioissa tai ne saattavat tehdä muita rajoittavia oletuksia. Tämän työn pääkontribuutio on metodologia differentioituvien käyttäjämallien oppimiseksi. Ehdotetun menetelmän keskiössä on neuroprosessien kouluttaminen olemassa olevien käyttäjien toimintaa selittävien prosessien surrogaateiksi. Surrogaattien differentioituva rakenne mahdollistaa gradienttipohjaisten menetelmien hyödyntämisen. Differentioituvuus mahdollistaa esimerkiksi yksilöllisten käyttäjäparametrien gradienttipohjaiseen päättelyn tai nykyaikaisten laskentainfrastruktuurien hyödyntämiseen. Kyseinen metodologia pyrkii tekemään mahdollisimman vähän rajoittavia oletuksia ja on sovellettavissa laajalti erilaisiin käyttäjämallinnusongelmiin. Työn kokeellisessa osuudessa ehdotettua menetelmää testataan kahdessa käyttäjämallinnusongelmassa. Molemmat kokeet arvioivat opittujen surrogaattien kykyä kuvata käyttäjien käyttäytymisien todennäköisyyksiä käyttäjäparametrien funktiona. Kokeissa selvisi, että differentioituvat surrogaatit oppivat selittämään käyttäjien toimintaa käytännössä yhtä hyvin kuin käyttäjän toiminnan alun perin generoinut prosessi, olettaen että tarkat käyttäjäparametrit ovat saatavilla. Kokeissa lisäksi selvisi, että surrogaatit kykenevät ottamaan käyttäjien toimintaa generoivien prosessien stokastisuuden huomioon. Tuloksista voidaan tulkita, että opittuja surrogaatteja voidaan hyödyntää yksilöllisten käyttäjäparametrien päättelyyn, ja siten myös yksilöllisten käyttäjämallien oppimiseen.
Description
Supervisor
Kaski, Samuel
Thesis advisor
Çelikok, Mustafa
Keywords
user modeling, differentiability, meta-learning, neural processes
Other note
Citation