Title: | InBase 2.0: Sequence database and research tool for auto- catalytic self-splicing proteins InBase 2.0: Tietokanta ja tutkimustyökalu automaattisesti isäntäproteiinista irti silmukoituville proteiineille |
Author(s): | Kuula, Jani |
Date: | 2015-05-11 |
Language: | en |
Pages: | 74+7 |
Major/Subject: | Laskennallinen ja kognitiivinen biotiede |
Degree programme: | BIO - Bioinformaatioteknologia |
Supervising professor(s): | Lampinen, Jouko |
Thesis advisor(s): | Iwai, Hideo |
Keywords: | proteins, inteins, hint, sequence analysis, biological databases |
Location: | P1 | Archive |
|
|
Abstract:Inteinit ovat proteiineja, jotka silmukoituvat automaattisesti irti isäntäproteiinista ilman entsyymejä tai muita katalyyttejä. Silmukoitumisesta seuraa toimiva isäntäproteiini ja vapaa inteini. Tämä automaattinen leikkauttuminen on inteini -proteiinien perusominaisuus ja myös muita samankaltaisilla ominaisuuksilla varustettuja proteiiniryhmiä on löydetty. Kaikissa näissä ryhmissä - inteinit mukaanluettuna - on proteiini -alue (engl. domain) nimeltä HINT, joka vastaa leikkautumisesta. Tällä hetkellä ryhmät ovat inteinit, bakteeriperäiset inteinien kaltaiset proteiinit A, B ja C, sekä Hedgehog ja Vint -ryhmät. Monet näiden ryhmien proteiineista ovat huonosti tutkittuja. Tämän työn tarkoituksena on rakentaa verkkopohjainen työkalu - nimeltään InBase 2.0 - näiden ryhmien ominaisuuksien tutkimiseen sekä tietokanta proteiinisekvenssien tallennukseen. InBase 2.0:n tietokanta on relaatiotietokanta, jossa proteiinisekvensseihin voidaan linkittää niihin liittyvää tietoa. Tallaista tietoa on esimerkiksi sekvenssiin liittyvät julkaisut, sekvenssien luokitukset ja leikkautumisaktiivisuus. InBase 2.0:n työkalupaketti sisältää sekvenssianalyysissä yleisesti käytettyjä ohjelmistoja. Työkalut ovat BLAST, InterProScan 5, ClustalW ja WebLogo. Useat inteinit sisältävät myös proteiini -domainin nimeltä hakeutuva endonukleaasi. Tämä domaini voi kopioida inteiniä koodavan DNA -sekvenssin toisaalle organismin genomissa. Uusi sijainti tulee kuitenkin sisältää lyhyen ko. inteinille spesifisen DNA -sekvenssin, ns. tunnistusalue. Osalta inteineistä tämä tunnistusalue on tunnettu. Tätä tietoa käytettiin hyväksi, kun InBase 2.0:n työkaluista rakennettiin yhteiskäyttökokonaisuus, jolla näitä tunnistusalueita pyritään ennustamaan. Kokonaisuus toimii kyeten selvittämään tunnetut tunnistusalueet, mutta ei sitä kuinka pitkä tämä alue on. Toinen päätehtävä InBase 2.0:lla on se että HINT domainin sisältävien proteiinien luokittelu on hankalaa ja epämääräistä. Tähän ongelmaan pyritään saada selkeämpi määrittely käyttäen hyväksi InBase 2.0 työkaluja. |
|
|
Files | Size | Format | View |
---|---|---|---|
There are no open access files associated with this item. |
Page content by: Aalto University Learning Centre | Privacy policy of the service | About this site