Studying sequence-expression correlation for recombinant proteins

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Kemian tekniikan korkeakoulu | Master's thesis
Date
2016-10-31
Department
Major/Subject
Biotekniikka ja elintarviketekniikka
Mcode
KE3002
Degree programme
KEM - Kemian tekniikan koulutusohjelma
Language
en
Pages
60+20
Series
Abstract
In recombinant protein production the expression can be optimized on several levels, including the choice of cultivation parameters, the expression host and the expression system. However, the optimization of the open reading frame of the expressed gene is too often ignored, although it may have a drastic effect on the expression. The optimization of the protein coding sequence does not have universal guidelines as little is understood about the contribution of different factors, and how to prioritize them. The key factors that affect the protein expression on gene level are GC-content, mRNA secondary structures, codon bias and rare codons, and the availability of charged tRNAs. However, these parameters are interdependent and changes in one affect the other, and they may have both local and global effects to the sequence. Cellulose binding modules (CBM) are interesting in the biomolecular material science as they could be used in cross-linking and functionalizing cellulose. In this work the expression and function of CBM1 proteins were optimized and studied by shuffling two putatively homologous CBM1 sequences block-wise and so detecting the contribution of different parts of the sequence to the expression levels and functionalities. Additionally, the codon optimization was studied by comparing the wild type sequence to the optimized sequence of Cel7A CBM. The CBMs were expressed as fusion proteins with alkaline phosphatase (AP) in several Escherichia coli expression strains. The expression levels were measured with AP enzymatic assay and sodium dodecyl sulfate gel electrophoresis (SDS-PAGE). The binding affinities of different CBMs were compared in binding experiments with nanosized cellulose and chitin. The production yield of Cel7Aopt was 101 mg/l cultivation at the best, whereas the original Ehux1b2 was only expressed 38-56 mg/l. The replacement of C block by the Cel7A sequence made the Ehux1b2C to be expressed the same level as Cel7Aopt. CyDisCo strain increased the expression but also caused much variation between clones. However, the binding tests showed that the original Ehux1b2 did not have binding affinity towards cellulose, but the replacement of the D-block with the sequence from Cel7A recovered the functionality. No other shuffled protein showed any affinity towards cellulose, and well expressed Ehux1b2C bound even less to either substrate than the original Ehux1b2. Additionally, the sequence analysis of natural CBM1 proteins revealed that the D-block contained many amino acids which are conserved especially within cellulose binding modules, and which are presumably essential for the binding ability.

Rekombinanttiproteiinien ekspressiota voidaan optimoida useilla eri tasoilla, kuten kasvatusolosuhteilla, sekä tuottoisännän ja ekspressiomekanismin valinnalla. Itse proteiinia koodaavan sekvenssin optimointi jää kuitenkin usein liian vähälle huomiolle, vaikka sillä voi olla suuri vaikutus ekspressioon. Proteiinia koodaavan sekvenssin optimoinnille ei ole selkeitä sääntöjä, sillä geenitason eri tekijöiden vaikutuksista ekspressioon tiedetään hyvin vähän. Avainasemassa proteiiniekspression säätelemisessä ovat kuitenkin GC-pitoisuus, lähetti-RNA:n sekundäärirakenteet, kodonikäyttö ja harvinaiset kodonit, sekä aminohapollisten siirtäjä-RNA:iden saatavuus. Nämä tekijät ovat kuitenkin sidoksissa toisiinsa, joten yhden tekijän muuttaminen saa aikaan muutoksia myös toisessa tekijässä, ja vaikutukset voivat esiintyä paikallisesti tai koko sekvenssin tasolla. Selluloosaan sitoutuvat proteiinit (cellulose binding module, CBM) ovat kiinnostavia biomolekyylimateriaalitutkimuksessa, sillä niiden kykyä tarttua selluloosaketjuun voitaisiin käyttää selluloosan funktionalisoinnissa ja luomaan verkkorakennetta. Tässä työssä CBM1-sekvenssejä tutkittiin sekoittamalla kahden CBM1-proteiinin sekvenssejä lohkoittain ja tutkimalla näiden neljän hybridiproteiinin avulla eri osioiden vaikutuksia proteiiniekspressioon ja proteiinien toiminnallisuuteen. Lisäksi kodonioptimointia tutkittiin ottamalla koeasetelmaan mukaan Cel7A-proteiinin villityyppisekvenssi optimoidun sekvenssin rinnalle. Selluloosaan sitoutuvia proteiineja tuotettiin fuusioproteiinina alkaalifosfataasin (alkaline phosphatase, AP) kanssa useassa eri Escherichia coli -tuottokannassa. Ekspressiotasoja mitattiin alkaalifosfataasin entsyymiassaylla sekä natriumdodekyylisulfaattipolyakrylamidigeelielektroforeesilla (sodium dodecyl sulfate polyacrylamide gel electrophoresis, SDS-PAGE). Eri proteiinien toiminnallisuutta tutkittiin sitoutumiskokeilla nanokokoiseen selluloosaan ja kitiiniin. Cel7Aopt-proteiinin saanto oli parhaimmillaan 101 mg/l kasvatusta, kun taas Ehux1b2 oli tuottotasoiltaan selvästi alhaisempi, vain 38-56 mg/l. Ehux1b2C, jossa C-lohko korvattiin Cel7A:n sekvenssillä, tuottui kuitenkin yhtä hyvin kuin verrokkina toiminut Cel7A. CyDisCo-kannan käyttö lisäsi proteiinin tuottoa, mutta aiheutti laajaa vaihtelua eri pesäkkeiden välillä. Alkuperäinen Ehux1b2 ei sitoutunut selluloosaan lähes lainkaan, mutta D-lohkon mutaatio Cel7A:n sekvenssin mukaiseksi teki proteiinin yhtä toimivaksi kuin verrokki. Muut substituutiot eivät lisänneet proteiinin sitoutumista, etenkään hyvin tuottunut Ehux1b2C. Lisäksi luonnossa esiintyvien selluloosaan tarttuvien proteiinien analyysi osoitti, että D-lohkossa on monia konservoituneita aminohappoja, jotka ovat oletettavasti tärkeitä juuri selluloosaan sitoutumisessa.
Description
Supervisor
Linder, Markus
Thesis advisor
Rooijakkers, Bart
Keywords
protein expression, Escherichia coli, protein shuffling, cellulose binding module, nanocellulose, codon optimization
Other note
Citation