Automatic Extraction of Protein-Protein Interactions from Medical Papers
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2005
Department
Major/Subject
Informaatiotekniikka
Mcode
T-115
Degree programme
Language
en
Pages
(8) + 64
Series
Abstract
Tämä diplomityö esittelee tiedoneristämisjärjestelmän, jonka tarkoituksena on eristää etenkin proteinien välisistä vuorovaikutuksista kertovaa tietoa biolääketieteellisistä teksteistä. Järjestelmä käyttää tekstin analysointiin kaupallisesti saatavilla olevaa, yleiskäyttöistä luonnollisen kielen jäsennintä, sekä kahden tyyppisiä sääntöjä: linkkisääntöjä ja säännöllisiä lausekkeita. Edellisistä linkkisäännöt tarkastelevat jäsentimen tuottamia, sanojen suhteista (kuten adjektiivi, subjekti tai objekti) kertovia syntaktisia riippuvuuksia. Järjestelmää testataan joukolla annotoituja lauseita ja järjestelmän hahmontunnistusmodulin tehokkuutta mitataan. Kokeen järjestely, tulokset ja analyysi kuvataan luvussa 6. Numeeriset tulokset ovat seuraavat: saanti 51%, tarkkuus 100% ja f-score 68%.Description
Supervisor
Simula, OlliThesis advisor
Arppe, AnttiKeywords
information extraction, tiedon eristäminen, IE, luonnollisen kielen käsittely, natural language processing, bioinformatiikka, NLP, bioinformatics