Information Retrieval in the World Wide Web

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

1999

Major/Subject

Ohjelmistotekniikka

Mcode

Tik-106

Degree programme

Language

en

Pages

75

Series

Abstract

Tämä työ keskittyy World Wide Web (WWW) -ympäristössä tapahtuvan tiedonhaun kehittämiseen. Tiedonhakuprosessi jaetaan indeksointi- ja etsimisvaiheeseen. Nämä vaiheet analysoidaan huomioiden WWW:n erityispiirteet verrattuna perinteisiin informaatiojärjestelmiin. Indeksointivaiheessa WWW:n tietoavaruus muutetaan hakukelpoiseksi tietorakenteeksi. WWW:n suuri koko ja erittäin heterogeeninen sisältö vaativat monipuolisen ja tarkan indeksoinnin laadukkaiden hakutulosten saavuttamiseksi. Pelkkä dokumenttien sisällön analysoiminen ei tarjoa riittävästi informaatiota, vaan myös muita lähteitä, kuten linkkirakennetta, tulee käyttää indeksin rakentamiseen. Indeksin laatua voidaan edelleen parantaa lisäämällä dokumentteihin metatietoa, sillä automaattiset analysointimenetelmät eivät pysty purkamaan kaikkea informaatiota ihmisille tarkoitetuista dokumenteista, eikä kaikki tarvittava tieto edes ole löydettävissä dokumenttien sisällöstä. WWW:ssä käytettäväksi soveltuvat metatietojärjestelmät esitellään. Etsintävaiheessa käyttäjän tulisi kyetä ilmaisemaan tiedontarpeensa tiedonhakujärjestelmän kielellä. Käyttäjän tiedontarpeet jaetaan lyhytkestoisiin ja pitkäkestoisiin tarpeisiin. Tätä jakoa vastaavasti tiedonhaun kysely- ja suodatusmallit esitellään. Hakulausekkeen muodostamisen lisäksi informaation esitystekniikat ovat tärkeitä, koska vastausjoukot tulee järjestää käyttäjälle esittämistä varten. Klusterointitekniikat, joilla informaatiota voidaan esittää eri tasoilla, käydään läpi. Työn viimeinen osa käsittelee COBRA-projektia, jonka päämääränä oli kehittää sähköisen välitystoiminnan arkkitehtuurimalli. Käsite tiedonvälitys määritellään, ja sitä verrataan tiedonhakuun. Projektin puitteissa toteutettu tiedonvälitysjärjestelmä esitellään.

Description

Supervisor

Soisalon-Soininen, Eljas

Thesis advisor

Lehtinen, Kari

Keywords

information retrieval, WWW, information brokering, Internet, information systems, informaation haku, search engine, informaation välitys, indexing, informaatiojärjestelmät, WWW, hakukone, Internet, indeksointi

Other note

Citation