An efficient strategy to infer biochemical networks by means of statistical calibration of mechanistic models

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2017-11-07
Department
Major/Subject
Applied mathematics
Mcode
SCI3053
Degree programme
Master’s Programme in Mathematics and Operations Research
Language
en
Pages
8+61
Series
Abstract
Various fields of science employ systems of ordinary differential equations (ODEs) to model the behaviour of dynamical systems, such as gene regulatory networks. However, the system model often contains uncertainty in both its structure and the model parameters. When experimental data are available, the model parameters can be calibrated using well-established statistical techniques and also different model structures can be compared in the light of their statistical evidence. If the set of alternative model structures is small enough, it is possible to evaluate the validity of each individual model separately. However, for biochemical networks, the number of viable model configurations is often enormous, which renders it computationally impossible to draw inferences about the network structure using such an exhaustive strategy. This thesis introduces a novel computationally efficient approach to obtain probabilistic structure inferences for general ODE models. The proposed approach relies on exploring the discrete set of alternative models using Markov chain Monte Carlo methods. Inference problems involving simulated data are used to demonstrate that the method is suitable for efficiently extracting information about the characteristics of the likely models. Furthermore, the method is applied to infer the structure of the transiently evolving core regulatory network that steers the T helper 17 (Th17) cell differentiation. The obtained results are in agreement with earlier studies that suggest that the Th17 differentiation program involves three sequential phases.

Differentiaaliyhtälösysteemejä käytetään monilla tieteenaloilla mallintamaan dynaamisia systeemejä, kuten geenisäätelyverkkoja. Systeemiä kuvaavassa mallissa on kuitenkin usein epävarmuutta sekä sen rakenteen että mallin parametrien osalta. Kun kokeellista dataa on saatavilla, mallien parametrit voidaan sovittaa käyttäen vakiintuneita tilastollisia menetelmiä, ja myös erilaisia malleja voidaan vertailla niiden tilastollisen todennäköisyyden avulla. Jos vaihtoehtoisia malleja on vain vähän, voidaan jokainen yksittäinen malli validoida erikseen. Biokemiallisten verkkojen tapauksessa mahdollisia mallikonfiguraatioita on usein lukemattomia, minkä takia yllä kuvattu tapa verkkojen rakenteen päättelyyn on laskennallisesti mahdotonta. Tässä työssä esitellään uusi laskennallisesti tehokas lähestymistapa tehdä probabilistisia päätelmiä differentiaaliyhtälömallien rakenteesta. Ehdotettu lähestymistapa perustuu diskreetin mallijoukon tutkimiseen Markov Chain Monte Carlo -menetelmillä. Työssä muotoillaan simuloituun dataan liittyviä ongelmia, joilla näytetään, että menetelmällä voi tehokkaasti saada tietoa todennäköisimmistä mallirakenteista. Menetelmää sovelletaan myös erään auttaja-T-solujen alityypin (Th17) erilaistumista ajavan aikariippuvan ydinverkon rakenteen päättelyyn. Saadut tulokset ovat linjassa aiempien tutkimusten kanssa, joiden mukaan Th17-solujen erilaistuminen tapahtuu kolmessa peräkkäisessä vaiheessa.
Description
Supervisor
Lähdesmäki, Harri
Thesis advisor
Intosalmi, Jukka
Keywords
ordinary differential equation models, Bayesian inference, Markov chain Monte Carlo, gene regulatory networks, T helper cells
Other note
Citation