Information Retrieval in the World Wide Web

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
1999
Major/Subject
Ohjelmistotekniikka
Mcode
Tik-106
Degree programme
Language
en
Pages
75
Series
Abstract
Tämä työ keskittyy World Wide Web (WWW) -ympäristössä tapahtuvan tiedonhaun kehittämiseen. Tiedonhakuprosessi jaetaan indeksointi- ja etsimisvaiheeseen. Nämä vaiheet analysoidaan huomioiden WWW:n erityispiirteet verrattuna perinteisiin informaatiojärjestelmiin. Indeksointivaiheessa WWW:n tietoavaruus muutetaan hakukelpoiseksi tietorakenteeksi. WWW:n suuri koko ja erittäin heterogeeninen sisältö vaativat monipuolisen ja tarkan indeksoinnin laadukkaiden hakutulosten saavuttamiseksi. Pelkkä dokumenttien sisällön analysoiminen ei tarjoa riittävästi informaatiota, vaan myös muita lähteitä, kuten linkkirakennetta, tulee käyttää indeksin rakentamiseen. Indeksin laatua voidaan edelleen parantaa lisäämällä dokumentteihin metatietoa, sillä automaattiset analysointimenetelmät eivät pysty purkamaan kaikkea informaatiota ihmisille tarkoitetuista dokumenteista, eikä kaikki tarvittava tieto edes ole löydettävissä dokumenttien sisällöstä. WWW:ssä käytettäväksi soveltuvat metatietojärjestelmät esitellään. Etsintävaiheessa käyttäjän tulisi kyetä ilmaisemaan tiedontarpeensa tiedonhakujärjestelmän kielellä. Käyttäjän tiedontarpeet jaetaan lyhytkestoisiin ja pitkäkestoisiin tarpeisiin. Tätä jakoa vastaavasti tiedonhaun kysely- ja suodatusmallit esitellään. Hakulausekkeen muodostamisen lisäksi informaation esitystekniikat ovat tärkeitä, koska vastausjoukot tulee järjestää käyttäjälle esittämistä varten. Klusterointitekniikat, joilla informaatiota voidaan esittää eri tasoilla, käydään läpi. Työn viimeinen osa käsittelee COBRA-projektia, jonka päämääränä oli kehittää sähköisen välitystoiminnan arkkitehtuurimalli. Käsite tiedonvälitys määritellään, ja sitä verrataan tiedonhakuun. Projektin puitteissa toteutettu tiedonvälitysjärjestelmä esitellään.
Description
Supervisor
Soisalon-Soininen, Eljas
Thesis advisor
Lehtinen, Kari
Keywords
information retrieval, WWW, information brokering, Internet, information systems, informaation haku, search engine, informaation välitys, indexing, informaatiojärjestelmät, WWW, hakukone, Internet, indeksointi
Other note
Citation