Automatic Extraction of Protein-Protein Interactions from Medical Papers

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2005

Major/Subject

Informaatiotekniikka

Mcode

T-115

Degree programme

Language

en

Pages

(8) + 64

Series

Abstract

Tämä diplomityö esittelee tiedoneristämisjärjestelmän, jonka tarkoituksena on eristää etenkin proteinien välisistä vuorovaikutuksista kertovaa tietoa biolääketieteellisistä teksteistä. Järjestelmä käyttää tekstin analysointiin kaupallisesti saatavilla olevaa, yleiskäyttöistä luonnollisen kielen jäsennintä, sekä kahden tyyppisiä sääntöjä: linkkisääntöjä ja säännöllisiä lausekkeita. Edellisistä linkkisäännöt tarkastelevat jäsentimen tuottamia, sanojen suhteista (kuten adjektiivi, subjekti tai objekti) kertovia syntaktisia riippuvuuksia. Järjestelmää testataan joukolla annotoituja lauseita ja järjestelmän hahmontunnistusmodulin tehokkuutta mitataan. Kokeen järjestely, tulokset ja analyysi kuvataan luvussa 6. Numeeriset tulokset ovat seuraavat: saanti 51%, tarkkuus 100% ja f-score 68%.

Description

Supervisor

Simula, Olli

Thesis advisor

Arppe, Antti

Keywords

information extraction, tiedon eristäminen, IE, luonnollisen kielen käsittely, natural language processing, bioinformatiikka, NLP, bioinformatics

Other note

Citation