Using Boolean network extraction of trained neural networks to reverse-engineer gene-regulatory networks from time-series data

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2019-06-17

Department

Major/Subject

Bioinformatics

Mcode

SCI3058

Degree programme

Master’s Programme in Life Science Technologies

Language

en

Pages

54

Series

Abstract

Boolean networks have a long history as a simple model of biological activity such as gene expression in gene regulatory networks. Learning Boolean networks is equivalent to learning binary classifiers for each variable in the network, given that we can find a logic-based representation for the classifiers. Artificial neural networks (ANNs) are very powerful classifiers and can be structurally similar to logical formulae. However, trained ANNs are very opaque in the sense that explaining the precise conditions which determine the output class is a very hard problem. Brute-force generating all possible inputs and the corresponding outputs from a classifier in the form of a truth-table can be used as a method for finding equivalent logical rules. The exponential memory and time requirements render this infeasible except for very small Boolean networks. The main proposition of this work is using a heuristic based on partial derivatives to limit the truth-table size by identifying the most relevant subset of variables and disregarding others. A simple rule extraction algorithm was implemented and evaluated on trained neural networks in experiments using synthetic benchmarks which show its robustness to noise as well as its ability to generalize effectively.

Boolean verkkoja käytetään muun muassa geeniverkkojen mallintamiseen. Niiden oppiminen esimerkeistä on ongelmana yhdenvertainen yksittäisten geenien aktiivisuuden luokittelun kanssa. Neuroverkot ovat yksi parhaimmista koneoppimismenetelmistä luokittelua varten. Eteenpäin kytkettyjen neuroverkkojen rakenne myös muistuttaa hieman logiikkapiirejä. Käytännössä erilaisten olosuhteiden vaikutukset ulostuloon ovat kuitenkin epäselviä ja niiden määrittäminen on erittäin vaikea ongelma. Binäärisen lähtöavaruuden kartoittaminen kokonaisuudessaan totuustauluiksi on mahdollista, mutta vaatii eksponentiaalisesti tilaa ja aikaa verkon kokoon suhteutettuna. Totuustaulujen rajoittaminen olennaisten muuttujien osajoukkoihin käyttämällä herkkyysanalyysiin perustuvaa heuristiikkaa mahdollistaa tehokkaan ja tarkan logiikkaekstraktioalgoritmin neuroverkoista. Menetelmän toimivuutta arvioitiin synteettisellä datalla ja tuloksien perusteella vaikutta siltä että opittu neuroverkko suodattaa melua datassa hyvin ja siitä ekstraktoitu logiikka yleistää opitun mallin tehokkaasti.

Description

Supervisor

Lähdesmäki, Harri

Thesis advisor

Inoue, Katsumi

Keywords

deep learning, gene regulatory network, Boolean network, rule extraction, neural network, systems biology

Other note

Citation