Functional characterization of diverse GH43 enzymes encoded in metagenomes of lignocellulose-active microbial communities

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

Kemian tekniikan korkeakoulu | Master's thesis

Date

2017-12-12

Department

Major/Subject

Biotechnology

Mcode

CHEM3022

Degree programme

Master's Programme in Chemical, Biochemical and Materials Engineering

Language

en

Pages

75

Series

Abstract

Carbohydrates are the main carbon source in plants and, as a photosynthetically renewable form of fixed carbon, plant biomass is considered as a prime target for replacing the petroleum derived fuels and for producing renewable chemicals and materials. The utilization of plant biomass requires degradation, through debranching and depolymerization, of the complex carbohydrate structures. Carbohydrate active enzymes (CAZymes) catalyze the breakdown, biosynthesis or modification of carbohydrates. The sequence based classification of the CAZymes began in 1991. In 2016, the CAZy database already comprised over 530 000 sequences from 5 enzyme classes. The era of large-scale genome and metagenome sequencing analysis has opened possibilities for deeper understanding of biological systems while at the same time highlighting the vast gap between the sequencing and the lagging characterization of encoded proteins. With readily available expression hosts, such as E. coli, genes of interest, particularly from bacterial sources, can be expressed and produced for biochemical characterization. Glycoside hydrolase family 43 (GH43) is one of the biggest GH families in the CAZy database, comprising 8498 GH43s in 34 subfamilies. However, from the 8498 sequences, only less than 2 % are biochemically characterized. The family includes a range of debranching, already biochemically characterized, CAZymes that promote the degradation of hemicellulose, especially arabinoxylans and pectin. In this work, the GH43 family was mined from six metagenomes of enriched lignocellulose active microbial communities. Five novel predicted GH43 proteins (GH43-GH95, GH43-GH16, CE12-GH43, GH43_18, and GH43-GH43_17) were successfully produced, purified, and screened on 26 substrates at three pH conditions. Based on the results, the GH43 from the completely uncharacterized subfamily 18, was studied in more detail as it showed clear exo activity with pNP-α-L-arabinofuranoside. The GH43_18 (aka AG-PHAbf43_18J) was screened further with six xylooligosaccharides and it was observed that the protein selectively releases 1-3 linked α-L-arabinose from the terminal xylosyl residue on the non-reducing end of the xylooligomers. Based on a literature survey, this type of highly selective α-L-arabinofuranosidase activity has not been previously reported.

Hiilihydraatit ovat kasvien suurimpia hiilivarastoja, ja fotosynteettisestin uusiutuvana hiililähteenä kasvibiomassa nähdään erinomaisena vaihtoehtona uusiutuvien materiaalien ja kemikaalien tuottamiselle sekä korvaamaan fossiilisia polttoaineita. Kasvibiomassan hyödyntäminen vaatii sen rakenteen hajoittamista monimutkaisia hiilihydraattirakenteita pilkkomalla. Hiilihydraattiaktiiviset entsyymit (CAZymes) katalysoivat joko hiilihydraattien hajoittamista, biosynteesiä tai muokkausta. CAZymes:ien sekvenssiin perustuva luokittelu aloitettiin vuonna 1991. 2016 CAZy tietokanta kattoi jo 530 000 sekvenssiä viidestä entsyymiluokasta. Mahdollisuus suurien tietomäärien, genomien ja metagenomien, analysointiin on avannut portteja biologisten systeemien syvemmälle ymmärtämiselle, mutta samaan aikaan kuilu proteiineja koodaavien geenien sekvensoinnin ja proteiinien karakterisoinnin välillä on kasvanut rajusti. Tarjolla olevien tuottomikrobien, kuten E. Colin, avulla kiinnostuksen kohteena olevat geenit, erityisesti bakteeriperäiset, voidaan tuottaa biokemiallista karakterisointia varten. Glykosidihydrolaasi perhe 43 (GH43) on yksi suurimmista GH perheistä CAZy tietokannassa, sisältäen 8498 GH43:a 34:ssä alaperheessä. Kuitenkin vasta alle 2 % kaikista 8498:sta GH43 sekvenssistä on biokemiallisesti karakterisoitu. Perhe pitää sisällään laajan joukon hemiselluloosan sivuketjuja hydrolysoivia, jo biokemiallisesti karakterisoituja, CAZymes:jä jotka tehostavat hemiselluloosan, erityisesti arabionoksylaanien ja pektiinin, hajoittamista. Tässä työssä GH43 perheen entsyymejä etsittiin kuudesta rikastetusta lignoselluloosa-aktiivisen mikrobisekapopulaation metagenomista. Viisi uutta ennustettua GH43 proteiinia (GH43-GH95, GH43-GH16, CE12-GH43, GH43_18 ja GH43-GH43_17) tuotettiin, puhdistettiin ja skriinattiin 26 substraatin kanssa kolmessa eri pH:ssa. GH43, täysin karakterisoimattomasta alaperheestä 18, joka osoitti skriinauksessa selvää eksoaktiivisuutta pNP-α-L-arabinofuranoosia kohtaan, karakterisoitiin työn aikana pidemmälle. Kyseinen GH43 (nimeltään AG-PHAbf43_18J) skriinattiin kuuden ksylo-oligosakkaridin kanssa ja huomattiin, että se hydrolysoi selektiivisesti 1-3 sidoksellista α-L-arabinoosia ksylo-oligomeerien ei-pelkistävästä päästä. Kirjallisuuskatsauksen perusteella kyseistä, hyvin spesifistä, α-L- arabinofuranosidaasiaktiivisuutta ei ole aiemmin julkaistu.

Description

Supervisor

Bankar, Sandip

Thesis advisor

Jurak, Edita

Keywords

PULs, GH43, functional characterization, enzyme mining, protein overexpression, protein purification

Other note

Citation