Computational Analysis and Modeling of High-Throughput Data to Understand T-helper Cell Differentiation
Loading...
Journal Title
Journal ISSN
Volume Title
School of Science |
Doctoral thesis (article-based)
| Defence date: 2023-01-13
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Author
Date
2022
Major/Subject
Mcode
Degree programme
Language
en
Pages
72 + app. 84
Series
Aalto University publication series DOCTORAL THESES, 197/2022
Abstract
T-helper cells are essential for adaptive immunity. During immune response T-helper cells are influenced by cytokines which steer cell differentiation into cellular subsets having specific functions. The process is affected by cellular subsystems and causes profound changes in epigenetic modifications as well as gene and protein expressions which can be experimentally observed using high-throughput technologies. This thesis has three objectives. 1) To identify and characterize molecular elements involved in T-helper cell differentiation and immune response through analyzing datasets using bioinformatic tools. 2) To develop computational tool to detect enrichments of trait associated single nucleotide polymorphisms (SNPs) on genomic regions. 3) To develop computational frameworks for characterizing dynamic models for regulatory networks. The goals have been achieved in five studies. In the first study, proteomes and transcriptomes of Th17 and iTreg cells were profiled and analyzed to understand how they change during early phases of cell differentiation and how the transcriptomes and proteomes of the cell types differ from each other. The second publication characterized bindings of transcription factor (TF) STAT3 genome-wide during Th17 cell differentiation. As a SNP can alter binding affinity of a TF, we investigated whether SNPs associated with immune diseases co-localize in STAT3-binding sites. The analysis applied publicly available information on SNPs and empirical statistical methods. The third publication proposes a computational tool snpEnrichR implemented in R language for facilitating co-localization analyses of SNPs and genomic regions. Co-localization analysis of SNPs associated to various traits and STAT6 binding sites of cells differentiating toward Th2 type showed that incorporating proxies of the tag-SNPs enhances co-localization detection. The fourth publication introduced a method to infer dynamically evolving regulatory networks from time-course data. The method couples mechanistic ordinary differential equation (ODE) models with a latent process that approximates the network structure rewiring process. When applied to Th17 RNA-seq data the method predicted lineage specific subnetworks that are activated sequentially and control the differentiation process in an overlapping manner. The fifth publication studies the dynamic interplay of histone modifications signaling enhancer activity and transcription factor binding modeling them using systems of ODEs and simulated time-course data focusing on the parameters of the models and model selection. The method is able to find the correct model when measurement noise level is reasonable and the number of measurement time points is adequate. The datasets generated and the analyses performed as part of this thesis help to understand of T-helper cell differentiation better. The developed computational frameworks and tools available for use as well as further developments. The results provide a valuable resource for the community. T-auttajasolut ovat tärkeitä hankitulle immuniteetille. Immuunivasteen aikana T-auttajasolut erilaistuvat sytokiinien vaikutuksesta alasolutyypeiksi, joilla on kullakin omat tehtävänsä. Prosessissa solunsisäiset järjestelmät muuttavat solun epigenetiikkaa sekä proteiinien ja geenien ilmentymiä. Solun molekyyleistä voidaan saada havaintoja suurikapasiteettimittaustekniikoilla. Tässä väitöskirjassa on kolme tavoitetta: 1) Tunnistaa ja luonnehtia erilaistuvien T-solujen molekyylien toimintaa analysoimalla aineistoja bioinformatiikan menetelmin. 2) Kehittää laskennallinen menetelmä, joka tunnistaa SNPien rikastumat annetuilla genomialueilla. 3) Kehittää laskennallisia menetelmiä solun dynaamisten säätelyjärjestelmien mallintamiseen. Väitöskirjan tavoitteet saavutettiin viidellä tutkimuksella. Ensimmäisessä tutkimuksessa Th17 ja iTreg solujen transkriptomit ja proteomit profiloitiin ja analysoitiin biometriikan menetelmillä. Työssä selvitettiin solujen muutoksia erilaistumisen alkuvaiheessa ja solutyyppien geeni-ilmentymien eroja transkriptomi- ja proteomitasoilla. Toisessa tutkimuksessa selvitettiin koko genomin kattavasti transkriptiotekijä STAT3:n sitoutumista genomiin soluilla, jotka ovat erilaistumassa Th17 soluiksi. Sitoutumispaikkojen yhden emäksen monimuotoisuudet (SNP) vaikuttavat sitoutumusaffiniteettiin, minkä vuoksi tutkittiin, ovatko immuunisairauksiin liitetyt SNPit rikastuneet STAT3:n sitoutumispaikoissa. Analyysissa hyödynnettiin yleisesti SNPeistä saatavilla olevaa tietoa sekä empiirisiä tilastollisia menetelmiä. Kolmannessa työssä esiteltiin R-ohjelmointikielellä toteutettu laskennallinen työkalu snpEnrichR helpottamaan eri ominaisuuksiin liittyvien SNPien genomialueilla rikastumisen analysointia. STAT6:n sitoutumispaikkojen sekä eri sairauksiin liittyvien SNPien tutkiminen osoitti, että edustaja-SNPien hyödyntäminen tunniste-SNPien lisäksi auttaa tunnistamaan ko-lokalisaatiota. Neljännessä työssä kehitettiin menetelmä, jolla päätellään dynaamisesti kehittyvä säätelyverkko aikasarja-aineistosta. Menetelmä yhdistää mekanistisen tavallisen differentiaaliyhtälöryhmämallin piiloprosessiin, joka puolestaan approksimoi mallin rakenteen uudelleen kytkentöjä. Sovellettaessa Th17 RNA-seq dataan menetelmä ennusti solutyypille ominaiset alaverkot, jotka aktivoituvat peräkkäin ja kontrolloivat erilaistumisprosessia päällekkäin. Viidennessä työssä tutkittiin enhansereiden aktiivisuutta ilmaisevien histonimuutosten transkriptiotekijän genomiin sitoutumisen vuorovaikutusta mallintamalla niitä tavallisilla differentiaaliyhtälöillä (DY) hyödyntämällä simuloitua aikasarja dataa keskittyen mallin parametreihin ja mallinvalintaan. Menetelmä kykenee löytämään datan generoivan mallin, kun aineiston kohina on maltillista ja datapisteitä on riittävä määrä. Tämän väitöskirjan sisältämät analyysit auttavat ymmärtämään paremmin T-solujen erilaistumista. Kehitetyt laskennalliset viitekehykset ja työkalut ovat vapaasti käytettävissä. Tulokset tarjoavat arvokkaan resurssin tiedeyhteisölle.Description
Supervising professor
Lähdesmäki, Harri, Prof., Aalto University, Department of Computer Science, FinlandKeywords
T-helper cells, bioinformatics, SNP, dynamical systems, T-auttajasolu, bioinformatiikka, SNP, dynaamiset järjestelmät
Other note
Parts
-
[Publication 1]: Imran Mohammad, Kari Nousiainen, Santosh D. Bhosale, Inna Starskaia, Robert Moulder, Anne Rokka, Fang Cheng, Ponnuswamy Mohanasundaram, John E. Eriksson, David R.Goodlett, Harri Lähdesmäki, Zhi Chen. Quantitative proteomic characterization and comparison of T helper 17 and induced regulatory T cells. PloS Biology, 16.5 (2018): e2004194, May 2018.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201808014334DOI: 10.1371/journal.pbio.2004194 View at publisher
-
[Publication 2]: Subhash K Tripathi, Zhi Chen, Antti Larjo, Kartiek Kanduri, Kari Nousiainen, Tarmo Äijo, Isis Ricaño-Ponce, Barbara Hrdlickova, Soile Tuomela, Essi Laajala, Verna Salo, Vinod Kumar, Cisca Wijmenga, Harri Lähdesmäki, Riitta Lahesmaa. Genome-wide Analysis of STAT3-Mediated Transcription during Early Human Th17 Cell Differentiation. Cell Reports, 19.9 (2017): 1888-1901, May 2017.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201706205706DOI: 10.1016/j.celrep.2017.05.013 View at publisher
-
[Publication 3]: Kari Nousiainen, Kartiek Kanduri, Isis Ricaño-Ponce, Cisca Wijmenga, Riitta Lahesmaa, Vinod Kumar, Harri Lähdesmäki. snpEnrichR: analyzing co-localization of SNPs and their proxies in genomic regions. Bioinformatics, 34.23 (2018): 4112-4114, December 2018.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-201812216650DOI: 10.1093/bioinformatics/bty460 View at publisher
-
[Publication 4]: Jukka Intosalmi, Kari Nousiainen, Helena Ahlfors, Harri Lähdesmäki. Datadriven mechanistic analysis method to reveal dynamically evolving regulatory networks. Bioinformatics, 32.12 (2016): i288-i296, June 2016.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-202105056498DOI: 10.1093/bioinformatics/btw274 View at publisher
-
[Publication 5]: Kari Nousiainen, Jukka Intosalmi, Harri Lähdesmäki. A Mathematical Model for Enhancer Activation Kinetics During Cell Differentiation. In International Conference on Algorithms for Computational Biology, pp. 191-202, May 2019.
Full text in Acris/Aaltodoc: http://urn.fi/URN:NBN:fi:aalto-2021111110100DOI: 10.1007/978-3-030-18174-1_14 View at publisher