Analyzing time-series RNA-seq data for T helper 17 cell differentiation mouse and human
No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
School of Science |
Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Author
Date
2012
Department
Major/Subject
Informaatiotekniikka
Mcode
T-61
Degree programme
Language
en
Pages
vii + 76
Series
Abstract
T helper (Th) cells are white blood cells that play a critical role in immune-mediated diseases. Th cells are divided into subclasses based on their cytokine production. Depending on the antigen, cytokine environment and co-stimulatory signals naïve CD4+ Th cells can differentiate into recently identified T helper 17 cells. The discovery of Th17 cells has provided new insights into host defense and autoimmune diseases. To identify novel factors involved in Th17 cell differentiation we have analyzed time-series RNA-Seq data of activated Th cells and Th17 cells in mouse and human. This master's thesis describes the steps of computational analysis of RNA-Seq data, including preprocessing, clustering of samples and genes, differential expression calling and gene set enrichment analysis. The comprehensive gene expression data set allows us to study how the Th17 differentiation is modified with additional cytokines and how reducing the expression of aryl hydrocarbon receptor changes the differentiation process in mouse. In this thesis we compare results from two widely used tools for calling differential expression. We also compare our RNA-Seq results to the microarray data of human Th17 cells. Despite the very active research on T helper cell differentiation, most of the studies have been generated using mouse models. A central aim of this study was to find genes, which are regulated in both species. We develop a Gaussian process regression method to compare gene expression dynamics in mouse and human in more detail. We have found thousands of genes which are regulated during the differentiation of Th17 cell and identified those genes, which are common between human and mouse. This analysis gives a good basis for further experimental studies and provides directly testable novel biological hypotheses. The results are mainly reported as enriched gene sets and detailed results are saved for later publication.Auttaja T-solut (Th) ovat valkosoluja, joilla on kriittinen rooli immuunisairauksissa. Th-solut on jaettu alaluokkiin sytokiinituotannon perusteella. Riippuen antigeenistä, sytokiiniympäristöstä ja ärsykesignaaleista naiivit T-solut voivat erilaistua vastikään löydetyiksi tyypin 17 auttaja T-soluiksi. Tämä löytö on tarjonnut uutta ymmärrystä elimistön puolustusjärjestelmästä ja autoimmuunisairauksista. Olemme analysoineet aktivoitujen Th-solujen ja Th17-solujen geeniekspressiota hiiressä ja ihmisessä löytääksemme uusia tekijöitä, jotka ovat mukana Th17-solujen erilaistumisessa. Tämä diplomityö raportoi RNA-sekvensointimittausten laskennallisen analyysin vaiheet, kuten esimerkiksi esikäsittely, näytteiden ja geenien klusterointi, yli- ja aliekspressoituneiden geenien identifiointi sekä geenijoukon rikastuma-analyysi. Kattavan geeniekspressiodatan avulla voimme tutkia, miten eri sytokiinien lisääminen ja aryylihiilivetyreseptorin ekspression muokkaaminen muuttavat erilaistumista. Tässä diplomityössä vertailemme kahden, laajasti käytetyn, yIi- ja aliekspressoituneiden geenien etsimiseen tarkoitetun työkalun antamia tuloksia. Vertaamme myös RNA-sekvensoinnin tuloksia mikrosirukokeeseen, jossa on mitattu ihmisen Th17-soluja. Vaikka Th-solujen erilaistumista on tutkittu paljon, suurin osa tutkimuksista on tehty käyttäen hiirisoluja. Keskeinen tavoite tässä tutkimuksessa oli löytää geenejä, jotka ovat säädeltynä Th17-erilaistumisessa sekä ihmisessä että hiiressä. Olemme kehittäneet gaussisten prosessien regressioon perustuvan menetelmän vertaillaksemme geeniekspression dynamiikkaa tarkemmin hiiressä ja ihmisessä. Löysimme tuhansia geenejä, joita säädellään Th17-erilaistumisessa. Lisäksi identifioimme ne geenit, jotka ovat yhteisiä ihmisen ja hiiren välillä. Tämä analyysi antaa hyvän pohjan kokeellisille jatkotutkimuksille ja tarjoaa uusia, suoraan testattavia biologisia hypoteeseja. Tulokset on esitetty pääasiassa rikastuneina geeniryhminä ja tarkemmat tulokset on säästetty myöhempää julkaisua varten.Description
Supervisor
Lähdesmäki, HarriThesis advisor
Chen, Zhi JaneKeywords
bioinformatics, bioinformatiikka, T cells, T-solut, Th17 differentiation, Th17-erilaistuminen, RNA sequencing, RNA-sekvensointi, time-series, aikasarjat