Computational Methods for Analysis of Dynamic Transcriptome and Its Regulation Through Chromatin Remodeling and Intracellular Signaling

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Doctoral thesis (article-based) | Defence date: 2014-10-31
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2014
Major/Subject
Mcode
Degree programme
Language
en
Pages
106 + app. 68
Series
Aalto University publication series DOCTORAL DISSERTATIONS, 149/2014
Abstract
Transcription is the first step in gene expression in which genetic information is transferred from DNA to RNA. Gene expression is highly controlled through transcriptional regulation at many steps. Transcriptional regulation in eukaryotes occurs, e.g., through binding of transcription factors and chromatin remodeling via various epigenetic pathways. Additionally, dysregulated transcription has been reported in various diseases. Thus, transcription and transcriptional regulation are of great interest for research. In this work, we study the transcriptome and its regulation using bioinformatic and computational biology approaches. We propose computational methods, LIGAP and DyNB, for analysis of temporal gene expression profiles measured using microarrays and RNA-seq, respectively. LIGAP is a methodology based on Gaussian processes for simultaneous differential expression analysis between an arbitratory number of time series microarray data sets. DyNB, is an extension of the Gaussian-Cox process in which the Poisson distribution is replaced by the negative binomial distribution. Additionally, DyNB enables the study of systematic differences, such as differential differentiation efficiencies, between conditions. Sorad, is a modeling framework based on differential equations and Gaussian processes for analysis of intracellular signaling transduction through phosphoprotein activities. We also propose and demonstrate how the in silico models inferred using Sorad can be used in estimating modulation strategies to obtain desired signaling response. Finally, we study the determinants of nucleosome positioning and subsequent effects on gene expression. All the proposed methods are benchmarked against existing methods and, in addition, they are applied to real-life problems. The comparison studies validate the applicability of the presented methods and demonstrate their improved performance relative to existing methods. Our transcriptome studies led to increased knowledge on the early differentiation of human T cells, and provided a valuable resource of candidate genes for future functional studies of the differentiation process. Our nucleosome study revealed that within loci important for T cell differentiation only 6% of the nucleosomes are differentially remodelled between T helper 1 and 2 cells and cytotoxic T lymphocytes. The remodelled nucleosomes correlated with the known differentiation program, chromatin accessibility, transcription factor binding, and gene expression. Finally, our data supports the hypothesis that transcription factors and nucleosomes compete for DNA occupancy.

Geenin transkriptiossa kopioidaan DNA:ssa olevaa geneettistä koodia, joka johtaa geenien ilmentymiseen. Geenien ilmentymiseen johtava transkriptioaskel on tarkasti säädelty biologinen tapahtuma. Transkriptiota eukaryoottisoluissa säädellään muun muassa transkriptiotekijöiden sitoumisen promoottori- ja tehostaja-alueille ja epigeneettisten tekijöiden kautta. Geenien transkription säätelyn parempi ymmärtäminen on tärkeää, koska esimerkiksi transkription virheellinen säätely voi johtaa erilaisiin sairauksiin. Tämän väitöskirjan artikkeleissa on kehitetty laskennallisia menetelmiä geenien ilmentymisen ja ilmentymisen säätelyn tarkempaan tutkimiseen. LIGAP ja DyNB ovat gaussisiin prosesseihin perustuvia menetelmiä mikrosiruilla tai RNA-sekvenssoinnilla mitattujen aikasarja-aineistojen analysointiin. LIGAP-menetelmä soveltuu geenien ilmentymiserojen havainnointiin mielivaltaisessa määrässä biologisia näytteitä. DyNB-menetelmän tilastollinen malli voidaan nähdä Gaussin-Coxin prosessin laajennukseksi jossa Poissonin jakauma korvataan negatiivisella binomijakaumalla. DyNB-menetelmällä on mahdollista estimoida systemaattisia eroja näytteiden välillä. Solunsisäisten signaalinvälitysten tarkasteluun ja mallinnukseen kehitimme Sorad-menetelmän, joka perustuu differentiaaliyhtälöiden ja gaussisten prosessien yhdistämiseen. Sorad-menetelmä mahdollistaa myös analyysin, jossa estimoidaan miten ennalta määrättyjen komponenttien tulisi käyttäytyä jotta saadaan haluttu vaste aikaan. Väitöskirjan viimeisessä artikkelissa paikannamme nukleosomit tarkasti tutkiaksemme kromatiinin tilan vaikutusta geenien ilmentymiseen. Tekemämme vertailut aiempiin menetelmiin osoittivat kehitettyjen menetelmien edut. Tämän lisäksi kehitettyjä menetelmiä sovellettiin käytännön biologisiin ongelmiin. Geenien ilmentymisiä tarkastelleissa tutkimuksissa keskityimme napaverestä eristettyjen T-auttajasoluihin. Tuloksemme geenien ilmentymisestä T-auttajasolujen varhaisissa erilaistumisissa tarjoavat hyvän lähtökohdan tarkemmille jatkotutkimuksille. Nukleosomitutkimuksessamme osoitimme, että sytotoksisten T-solujen ja tyypin 1 ja T-auttajasolujen välillä ainoastaan kuudessa prosentissa nukleosomeista nähdään eroja. Havaitut muutokset nukleosomeissa korreloivat erilaistumisohjelman, avoimen kromatiinin, transkriptiotekijöiden sitoutumisen, ja geenien ilmentymisen kanssa. Lisäksi havaintomme tukevat hypoteesia nukleosomien ja transkriptiotekijöiden välisestä kilpailusta DNA:han sitoumisessa.
Description
Supervising professor
Lähdesmäki, Harri, Prof., Aalto University, Department of Information and Computer Science, Finland
Thesis advisor
Lähdesmäki, Harri, Prof., Aalto University, Department of Information and Computer Science, Finland
Keywords
bioinformatics, computational biology, gene expression, transcriptional regulation, Gaussian processes, bioinformatiikka, laskennallinen biologia, geenien ilmentyminen, transkription säätely, gaussiset prosessit
Other note
Parts
  • [Publication 1]: Tarmo Äijö, Sanna M. Edelman, Tapio Lönnberg, Antti Larjo, Henna Järvenpää, Soile Tuomela, Emilia Engström, Riitta Lahesmaa and Harri Lähdesmäki. An integrative computational systems biology approach identifies lineage specific dynamic transcriptome signatures which drive the initiation of human T helper cell differentiation. BMC Genomics, 13:572, October 2012. doi:10.1186/1471-2164-13-572.
  • [Publication 2]: Tarmo Äijö, Kirsi Granberg and Harri Lähdesmäki. Sorad: A systems biology approach to predict and modulate dynamic signaling pathway response from phosphoproteome time-course measurements. Bioinformatics, 29(10):1283-91, May 2013. doi:10.1093/bioinformatics/btt130.
  • [Publication 3]: Tarmo Äijö, Vincent Butty, Zhi Chen, Verna Salo, Subhash Tripathi, Christopher B. Burge, Riitta Lahesmaa and Harri Lähdesmäki. A time-series analysis of RNA-seq data gives insights into the early human Th17 cell differentiation efficiency. Bioinformatics, 30(12):i113-i120, June 2014. doi:10.1093/bioinformatics/btu274.
  • [Publication 4]: Matthew E. Pipkin, Tarmo Äijö, Erbay Yigit, Ivana Djuretic, Quanwei Zhang, Liqun Xi, Ji-Ping Wang, Bjoern Peters, Harri Lähdesmäki and Anjana Rao. Gata3 and Runx3 binding underlies differential nucleosome organization in helper and cytolytic T cells. Nature Communications, March 2014.
Citation