Using Boolean network extraction of trained neural networks to reverse-engineer gene-regulatory networks from time-series data
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2019-06-17
Department
Major/Subject
Bioinformatics
Mcode
SCI3058
Degree programme
Master’s Programme in Life Science Technologies
Language
en
Pages
54
Series
Abstract
Boolean networks have a long history as a simple model of biological activity such as gene expression in gene regulatory networks. Learning Boolean networks is equivalent to learning binary classifiers for each variable in the network, given that we can find a logic-based representation for the classifiers. Artificial neural networks (ANNs) are very powerful classifiers and can be structurally similar to logical formulae. However, trained ANNs are very opaque in the sense that explaining the precise conditions which determine the output class is a very hard problem. Brute-force generating all possible inputs and the corresponding outputs from a classifier in the form of a truth-table can be used as a method for finding equivalent logical rules. The exponential memory and time requirements render this infeasible except for very small Boolean networks. The main proposition of this work is using a heuristic based on partial derivatives to limit the truth-table size by identifying the most relevant subset of variables and disregarding others. A simple rule extraction algorithm was implemented and evaluated on trained neural networks in experiments using synthetic benchmarks which show its robustness to noise as well as its ability to generalize effectively.Boolean verkkoja käytetään muun muassa geeniverkkojen mallintamiseen. Niiden oppiminen esimerkeistä on ongelmana yhdenvertainen yksittäisten geenien aktiivisuuden luokittelun kanssa. Neuroverkot ovat yksi parhaimmista koneoppimismenetelmistä luokittelua varten. Eteenpäin kytkettyjen neuroverkkojen rakenne myös muistuttaa hieman logiikkapiirejä. Käytännössä erilaisten olosuhteiden vaikutukset ulostuloon ovat kuitenkin epäselviä ja niiden määrittäminen on erittäin vaikea ongelma. Binäärisen lähtöavaruuden kartoittaminen kokonaisuudessaan totuustauluiksi on mahdollista, mutta vaatii eksponentiaalisesti tilaa ja aikaa verkon kokoon suhteutettuna. Totuustaulujen rajoittaminen olennaisten muuttujien osajoukkoihin käyttämällä herkkyysanalyysiin perustuvaa heuristiikkaa mahdollistaa tehokkaan ja tarkan logiikkaekstraktioalgoritmin neuroverkoista. Menetelmän toimivuutta arvioitiin synteettisellä datalla ja tuloksien perusteella vaikutta siltä että opittu neuroverkko suodattaa melua datassa hyvin ja siitä ekstraktoitu logiikka yleistää opitun mallin tehokkaasti.Description
Supervisor
Lähdesmäki, HarriThesis advisor
Inoue, KatsumiKeywords
deep learning, gene regulatory network, Boolean network, rule extraction, neural network, systems biology