Data-driven modelling of human behaviour with complex networks

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Doctoral thesis (article-based) | Defence date: 2024-04-05
Date
2024
Major/Subject
Mcode
Degree programme
Language
en
Pages
83 + app. 73
Series
Aalto University publication series DOCTORAL THESES, 67/2024
Abstract
Evolving environments and a growing number of sources for data offer new and interesting possibilities for studying the behaviour of individuals, groups and populations. This data from mobile phones, websites and social media provides opportunities for creating data-driven models where the occurring events, such as pandemics, can be considered as natural experiments in the given system altering the human behaviour therein. In addition to observational data, conducting controlled game experiments with agents and humans can be used for studying micro-level actions and decisions in order to understand the behavioural aspects relevant to emerging sociotechnical systems. Data-driven modelling typically focuses on prediction and explanation of the studied phenomena. Where models with high complexity have been shown to excel in prediction accuracy, interpretable and explainable models are appropriate for studying the complex human behaviour. This doctoral thesis presents data-driven modelling paradigms in studying human behaviour in cooperative games, mobility and cyber space using complex networks. The four research articles focus on interpreting human behaviour and decision-making in the sets of data through the modelling frameworks. The first two publications study the human decision making in a cooperative game with non-overlapping information and the effects from the presence of autonomous agents by conducting two game experiments. First we present a computational model based on probability matching and show that the human perception of risk during the experiment was near optimal while the rationality of choices was not. In the second publication the model is used for agents in a human-agent hybrid experiment. The group composition of humans and agents was shown to affect the game performance and the adaptation to the strategies of the agents with different game objective. The third publication studies human mobility during the COVID-19 pandemic in Finland using aggregated data from mobile phones. We consider the activity data as a set of bipartite networks and investigate projected exposure networks between postal code areas. The projected networks are modelled using gravity and radiation models with population data over the years 2019--2021 and the changes in the networks and model coefficients are analyzed in relation to the pandemic and the related effects of non-pharmaceutical interventions. The model parameters are shown to remain stable before the pandemic and once the pandemic begins they show a correlation to indices of intervention stringency. The final article of this dissertation presents a novel framework for constructing knowledge graphs from unstructured reports of cyber-attacks to create a systemic model for visual analysis for domain experts and for estimating risk in the network of entities connected by their high-level relationships and attributes. We implement the framework pipeline and evaluate the risk measure using a collected set of news reports.

Toimintaympäristöjen muuttuminen ja tietolähteiden kasvava määrä mahdollistavat uudenlaisten tutkimusten toteuttamisen yksilöiden, ryhmien ja populaatioiden käyttäytymisestä. Mobiililaitteista, verkkosivustoista ja sosiaalisesta mediasta kerätty data tarjoaa mahdollisuuksia datalähtöisien mallien muodostamiseen. Aineiston taustalla vaikuttavia ilmiöitä kuten pandemioita voidaan pitää luonnollisina kokeina jotka muuttavat ihmisten käyttäytymistä. Havaintoihin ja mittauksiin perustuvan datan lisäksi tutkimuksessa voidaan toteuttaa kontrolloituja pelikokeita agenteilla ja ihmisillä sosioteknisten järjestelmien kannalta merkityksellisten käyttäytymisen osa-alueiden ymmärtämiseksi. Datalähtöinen ihmiskäyttäytymisen mallintaminen keskittyy yleensä tutkittavien ilmiöiden ennustamiseen ja selittämiseen. Vaikka kompleksisilla malleilla on osoitettu olevan hyvä ennustamistarkkuus, niin yksinkertaisemmat ja tulkittavat mallit ovat soveltuvia ihmiskäyttäytymisen ilmiöiden ymmärtämiseksi ja selittämiseksi. Tässä väitöskirjassa esittelen datavetoisia ja kompleksisiin verkostoihin perustuvia malleja ihmiskäyttäytymisen tutkimiseksi yhteistyötä vaativissa peleissä, liikkuvuudessa ja kyberympäristössä. Väitöskirjan neljä tutkimusartikkelia painottuu ihmiskäyttäytymisen ja päätöksenteon selittämiseen aineistoista muodostettujen mallien avulla. Kahdessa ensimmäisessä julkaisussa tutkimme ihmisten päätöksentekoa yhteistyötä vaativassa pelissä sekä mallinnettujen autonomisten agenttien vaikutusta ihmisten toimintaan kahden pelikokeen avulla. Ensimmäisen pelikokeen tuloksista muodostetun laskennallisen mallin avulla nähdään että pelaajien osoittama riskin havainnointi oli lähellä mallin optimia, kun taas rationaalisuus ei. Dataan sovitettua laskennallista mallia sovellettiin agenttien päätöksenteossa tutkimuksen toisessa kokeessa. Ihmisten ja agenttien muodostamien ryhmien koostumuksen havaittiin vaikuttavan pelin kulkuun sekä pelaajien mukautumiseen agenttien strategioihin. Kolmannessa julkaisussa tutkimme ihmisten liikkuvuutta Suomessa COVID-19-pandemian aikana mobiililaitteista kerätyn aggregoidun aineiston avulla. Aineistoa käsitellään kaksiosaisina verkostoina, joista muodostettu projektio kuvastaa postinumeroalueiden populaatioiden liikkuvuudesta seuraavaa kohtaamista. Näitä kohtaamisverkostoja mallinnetaan gravity- ja radiation-tyyppisillä malleilla vuosien 2019–2021 ajalta. Tutkimuksen tuloksista nähdään mallien parametrien pysyminen vakaana aikana ennen pandemiaa sekä parametrien korrelaatio rajoituksiin pohjautuvien indeksien kanssa. Väitöskirjan viimeissä artikkelissa esitellään prosessikehys, jossa kyber-rikoksiin liittyvistä tekstuaalisista raporteista muodostetaan strategisen tason tietämysgraafi, joka mahdollistaa visuaalisen analyysin sekä entiteettien kuten organisaatioiden riskitason arvioinnin laskennallisin menetelmin. Tutkimuksessa toteutamme prosessikehyksen ja demostroimme riskitasojen määrittämisen kerätyn aineiston pohjalta.
Description
Supervising professor
Lampinen, Jouko, Prof., Aalto University, Department of Computer Science, Finland
Thesis advisor
Kaski, Kimmo, Senior Advisor, Aalto University, Department of Computer Science, Finland
Keywords
data-driven modelling, human behaviour, complex networks, datalähtöinen mallintaminen, ihmiskäyttäytyminen, kompleksiset verkostot
Other note
Parts
  • [Publication 1]: Kunal Bhattacharya, Tuomas Takko, Daniel Monsivais and Kimmo Kaski. Group formation on a small-world: experiment and modelling. Royal Society Interface, 16, 156.
    DOI: 10.1098/rsif.2018.0814 June 2019 View at publisher
  • [Publication 2]: Tuomas Takko, Kunal Bhattacharya, Daniel Monsivais and Kimmo Kaski. Human-agent coordination in a group formation game. Scientific Reports, 11, 10744, May 2021.
    DOI: 10.1038/s41598-021-90123-8 View at publisher
  • [Publication 3]: Tuomas Takko, Kunal Bhattacharya and Kimmo Kaski. Modelling exposure between populations using networks of mobility during Covid-19. Frontiers in Physics, 11, DOI:10.3389/fphy.2023.1138323 June 2023.
    DOI: 10.3389/fphy.2023.1138323 View at publisher
  • [Publication 4]: Tuomas Takko, Kunal Bhattacharya, Martti Lehto, Pertti Jalasvirta, Aapo Cederberg and Kimmo Kaski. Knowledge Mining of Unstructured Information: Application to Cyber-domain. Scientific Reports, 13, 1714, January 2023.
    DOI: 10.1038/s41598-023-28796-6 View at publisher
Citation