Improving the Use of Ranked Nodes in Elicitation of Conditional Probabilities for Bayesian Networks

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
School of Science | Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2013
Major/Subject
Sovellettu matematiikka
Mcode
Mat-2
Degree programme
Language
en
Pages
123
Series
Abstract
This thesis studies the ranked nodes method (RNM) developed to construct conditional probability tables (CPTs) to Bayesian networks (BNs) based on expert elicitation. RNM is used with BNs consisting of discrete random variables called ranked nodes. The idea of RNM is to generate a CPT based on parameters that are assessed by an expert and whose number is smaller than the number of elements in the CPT. In this thesis, RNM is explained more explicitly than in the existing literature and its properties are studied from both modeling and computational aspects. The study on the modeling aspect of RNM interprets the properties of the method. The use of RNM is shown to approximate the use of a hierarchical Bayesian model of continuous random variables. While this finding helps to understand RNM, it is also utilized to explain results of an experimental study concerning the modeling accuracy of the method. Furthermore, exact interpretations are derived for the weight parameters used in RNM. In addition, the use of these interpretations in the transparent and consistent elicitation of the weights is introduced. The study also discusses the application of RNM when the random variables have interval or ratio scales - a theme which has not been addressed earlier. The examination of the computational aspect of RNM consists of two experimental studies. In the first study, the calculation times of CPTs are measured. The results imply that CPTs of ordinary sizes are calculated within one second when using a standard desktop computer. In the second study, the modeling accuracy of RNM is explored by approximating CPTs found in real-life benchmark BNs. Though providing accurate approximations in some cases, the modeling accuracy is found to be generally poorer than that of another method examined in the literature. The result is considered to reflect the relative rarity of the probabilistic relationships compatible with the assumptions of RNM in the applications of BNs. On the other hand, the poorer modeling accuracy of RNM is suspected to be caused by the smaller amount of parameters. Overall, the results of the experimental studies imply that RNM provides means to readily construct CPTs that represent the probabilistic relationships of random variables in a coarse manner. These rough CPTs can then be used as initial probability estimates in an iterative elicitation process based on, e.g., the sensitivity analysis of a BN.

Tässä työssä tarkastellaan järjestysperusteisten solmujen menetelmää (JSM), jolla muodostetaan ehdollisten todennäköisyyksien taulukoita (ETT) Bayes-verkkoihin (BV) perustuen asiantuntija-arvioihin. JSM soveltuu järjestysperusteisiksi solmuiksi kutsutuista diskreeteistä satunnaismuuttujista koostuvien Bayes-verkkojen (BV) todennäköisyyksien arviointiin. JSM:ssä ETT:t perustuvat asiantuntijan arvioimiin parametreihin, joiden lukumäärä on ETT:n alkioiden lukumäärää huomattavasti pienempi. Tässä työssä JSM:n toimintaperiaate esitellään aiempaa kirjallisuutta täsmällisemmin ja sen ominaisuuksia tarkastellaan yhtäältä mallinnuksellisesta ja toisaalta laskennallisesta näkökulmasta. Mallinnusnäkökulmaan liittyvässä tarkastelussa selvennetään JSM:n toimintaperiaatetta. Menetelmän käytön osoitetaan approksimoivan jatkuvista satunnaismuuttujista koostuvan hierarkkisen Bayes-mallin käyttöä. Tämä havainto auttaa ymmärtämään menetelmän toimintaperiaatetta ja sitä käytetään myös selittämään menetelmän mallinnustarkkuutta käsittelevän kokeen tuloksia. Lisäksi työssä johdetaan JSM:ssä käytettäville painoparametreille tulkinnat ja esitellään niiden hyödyntäminen painojen läpinäkyvässä ja johdonmukaisessa arvioimisessa. Havainnollistavan esimerkin avulla tarkastellaan JSM:n soveltamista välimatka- tai suhdeasteikollisiin satunnaismuuttujiin. Tätä teemaa ei ole käsitelty kirjallisuudessa aiemmin. JSM:n tarkastelu laskennallisesta näkökulmasta koostuu kahdesta kokeesta. Ensimmäisessä mitataan erikokoisten ETT:iden laskenta-aikoja. Kokeen tulokset osoittavat, että JSM:llä kyetään laskemaan tyypillisen kokoisia ETT:itä sekunnissa tavanomaisella pöytätietokoneella. Toisessa kokeessa JSM:n mallinnustarkkuutta tutkitaan approksimoimalla BV-sovelluksista löytyviä ETT:itä. Vaikka JSM tuottaa tarkkoja approksimaatioita joissain tapauksissa, sen mallinnustarkkuuden todetaan olevan yleisesti heikompi kuin toisella kirjallisuudessa esitetyllä menetelmällä. Tulokset viittaavat siihen, että JSM:n oletusten kanssa yhteensopivat satunnaismuuttujien riippuvuustyypit ovat harvinaisia BV:iden sovelluksissa. Toisaalta JSM:n heikompi mallinnustarkkuus johtuu siitä, että siinä käytetään vähemmän parametreja. Työn laskennallisen osan tulokset osoittavat, että JSM:llä kyetään muodostamaan nopeasti ETT:itä, jotka kuvaavat satunnaismuuttujien välisiä riippuvuussuhteita karkeasti. Näitä ETT:itä voidaan tarkentaa perustuen esimerkiksi BV:n herkkyysanalyysiin
Description
Supervisor
Hämäläinen, Raimo P.
Thesis advisor
Virtanen, Kai
Keywords
Bayesian networks, Bayes-verkot, influence diagrams, vaikutuskaaviot, probability elicitation, todennäköisyyksien arviointi, ranked notes, järjestysperusteiset solmut
Other note
Citation