Charasteristics of the Liver Transcriptome and its Genetic Regulation

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2022-08-22
Department
Major/Subject
Bioinformatics and Digital Health
Mcode
SCI3092
Degree programme
Master’s Programme in Life Science Technologies
Language
en
Pages
91
Series
Abstract
The FinnGen study is a unique, large-scale research project combining human genetics with digital health care data from the Finnish population in order to to provide new insights to various diseases. FinnGen performs genome-wide association studies (GWASs) to identify associations between genetic variants and diseases, such as intrahepatic cholestasis of pregnancy (ICP), with a perspective on Finnish-enriched variants. Although GWASs have provided various important findings on their own, follow-up analyses are often needed to understand the causal genes and molecular mechanisms behind the association signals. As the majority of GWAS variants lie in non-coding regions, they are thought regulate gene expression, i.e., act as an expression quantitative trait locus (eQTL). Therefore, the integration of GWAS results with transcriptomic data has become a key downstream analysis in GWAS. A commonly used method is colocalization analysis between eQTL and GWAS data. By testing for shared causal variants between the two traits, the analysis can pinpoint plausible causal genes underlying the disease associations. These approaches, however, may not work perfectly if the two data come from different populations. Given the unique genetic structure of Finns and the emerging findings from FinnGen, there is a growing interest to generate and analyse Finnish transcriptomic data. This thesis aims to characterize a Finnish liver transcriptome and its genetic regulation as well as to integrate the Finnish liver eQTLs with Finnish GWAS results via colocalization analysis in order to facilitate functional genomics follow up on Finnish-specific GWAS discoveries. To this end, an RNA sequencing (RNA-seq) analysis pipeline was designed and implemented to process a new collection of 136 Finnish liver (FinnLiver) RNA-seq samples. The primary analyses elucidated that the liver RNA-seq data generated and processed is of high quality and, as expected, reflective of liver tissue’s transcriptome. EQTL analysis identified that expression levels of 16.3% of the genes were associated with nearby common genetic variants. Comparison of the FinnLiver eQTLs with an international liver eQTL resource from the GTEx project showed that the majority (77.7%) of the eQTLs were concordant between the two data, indicating globally shared patterns of gene expression regulation, yet identified also a number of data set-specific signals. Integration of the eQTLs with the FinnGen ICP GWAS results revealed seven colocalizing genes. Four of these showed also significant colocalization in GTEx liver highlighting these as possible causal genes for ICP. The other three genes were specific in colocalization to FinnLiver, potentially pointing to the relevance of having population-specific transcriptomic data for GWAS follow-ups.

Suomalaisen väestön ainutlaatuista geneettistä rakennetta hyödynnetään FinnGen-tutkimuhankkeessa, joka yhdistää suomalaista terveysrekisteri- ja genomitietoa tavoitteenaan lisätä ymmärrystä sairauksien syistä. FinnGen-tutkimuksessa suoritetaan genomin laajuisia assosiaatioanalyyseja (GWAS), joiden tarkoituksena on löytää yhteyksiä perimän variaation ja tautien, kuten raskaushepatoosi, välille. Suuri osa GWAS-tuloksien varianteista sijoittuvat ei-koodaavalle alueille genomissa, minkä takia jatkoanalyyseja tarvitaan kausaalisten geenien havaitsemiseen. Ei-koodaavat variantit voivat reguloida geeniekspressiota ekspressio-kvantitatiivisen ominaisuuden lokuksena (eQTL), pikemminkin kuin vaikuttaa suoraan proteiinirakenteeseen. Nämä GWAS- ja eQTL-tulokset voidaan integroida GWAS jatkoanalyysina, jotta voidaan ja selvittää mikä geeni välittää geneettisen variaation vaikutuksen tautiin. Tähän käytetään kolokalisaatioanalyysia, joka etsii jaettuja kausaalisia variantteja GWAS- ja eQTL-tulosten välillä. Tämän diplomityön tavoitteena on karakterisoida suomalaisen maksan transkriptomi ja sen geneettistä säätelyä sekä integroida suomalaisen maksan eQTL-tulokset suomalaisten GWAS-tuloksien kanssa kolokalisaatioanalyysin avulla. Työn tarkoituksena on jatkoanalysoida toiminnallisen genetiikan avulla Suomeen rikastuneita GWAS-löydöksiä. Diplomityössä suunniteltiin ja rakennettiin pipeline RNA-sekvensointitiedon analysointiin, jolla prosessoitiin 136 suomalaisen maksan (FinnLiver) RNA-sekvensoitinäytettä. Maksanäytteiden geeniekspressioprofiileista, solutyyppikompositiosta sekä vertailusta kansainvälisen GTEx-aineiston maksan kanssa voitiin päätellä, että maksanäytteet todella olivat hyvälaatuista maksakudosta, mikä oli oletettavissa. EQTL-analyysi määritti 16,3 % geenin olevan assosioitunut lähellä olevan geneettisen variantin kanssa. Näistä 77,7 % oli yhteneväisiä kansainvälisen eQTL maksa-aineiston, GTEx:n kanssa, osoittaen globaalisti yhteisiä geeni ekspression regulaatiota. Tuloksissa havaittiin myös pelkästään toisessa datassa olevia merkitseviä signaaleja. EQTL ja FinnGen raskaushepatoosi GWAS tuloksien integroiminen toi ilmi seitsemän kolokalisoivaa geeniä, joista neljä olivat merkitseviä myös GTEx:n maksan kolokalisaatioanalyysissa, ja voisivat täten olla mahdollisia kausaalisia geenejä raskaushepatoosille. Kolme muuta geeniä näkyvät vain Finn-Liverissa, mahdollisesti osoittaen populaatio-spesifisyyden merkityksen GWAS-jatkotutkimuksissa.
Description
Supervisor
Rousu, Juho
Thesis advisor
Tukiainen, Taru
Keywords
transkriptomiikka, genetiikka, eQTL, GWAS
Other note
Citation