Information Retrieval in the World Wide Web

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorLehtinen, Kari
dc.contributor.authorMikkonen, Heikki
dc.contributor.departmentTietotekniikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorSoisalon-Soininen, Eljas
dc.date.accessioned2020-12-03T23:31:24Z
dc.date.available2020-12-03T23:31:24Z
dc.date.issued1999
dc.description.abstractTämä työ keskittyy World Wide Web (WWW) -ympäristössä tapahtuvan tiedonhaun kehittämiseen. Tiedonhakuprosessi jaetaan indeksointi- ja etsimisvaiheeseen. Nämä vaiheet analysoidaan huomioiden WWW:n erityispiirteet verrattuna perinteisiin informaatiojärjestelmiin. Indeksointivaiheessa WWW:n tietoavaruus muutetaan hakukelpoiseksi tietorakenteeksi. WWW:n suuri koko ja erittäin heterogeeninen sisältö vaativat monipuolisen ja tarkan indeksoinnin laadukkaiden hakutulosten saavuttamiseksi. Pelkkä dokumenttien sisällön analysoiminen ei tarjoa riittävästi informaatiota, vaan myös muita lähteitä, kuten linkkirakennetta, tulee käyttää indeksin rakentamiseen. Indeksin laatua voidaan edelleen parantaa lisäämällä dokumentteihin metatietoa, sillä automaattiset analysointimenetelmät eivät pysty purkamaan kaikkea informaatiota ihmisille tarkoitetuista dokumenteista, eikä kaikki tarvittava tieto edes ole löydettävissä dokumenttien sisällöstä. WWW:ssä käytettäväksi soveltuvat metatietojärjestelmät esitellään. Etsintävaiheessa käyttäjän tulisi kyetä ilmaisemaan tiedontarpeensa tiedonhakujärjestelmän kielellä. Käyttäjän tiedontarpeet jaetaan lyhytkestoisiin ja pitkäkestoisiin tarpeisiin. Tätä jakoa vastaavasti tiedonhaun kysely- ja suodatusmallit esitellään. Hakulausekkeen muodostamisen lisäksi informaation esitystekniikat ovat tärkeitä, koska vastausjoukot tulee järjestää käyttäjälle esittämistä varten. Klusterointitekniikat, joilla informaatiota voidaan esittää eri tasoilla, käydään läpi. Työn viimeinen osa käsittelee COBRA-projektia, jonka päämääränä oli kehittää sähköisen välitystoiminnan arkkitehtuurimalli. Käsite tiedonvälitys määritellään, ja sitä verrataan tiedonhakuun. Projektin puitteissa toteutettu tiedonvälitysjärjestelmä esitellään.fi
dc.format.extent75
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/87188
dc.identifier.urnURN:NBN:fi:aalto-2020120446026
dc.language.isoenen
dc.programme.majorOhjelmistotekniikkafi
dc.programme.mcodeTik-106fi
dc.rights.accesslevelclosedAccess
dc.subject.keywordinformation retrievalen
dc.subject.keywordWWWfi
dc.subject.keywordinformation brokeringen
dc.subject.keywordInternetfi
dc.subject.keywordinformation systemsen
dc.subject.keywordinformaation hakufi
dc.subject.keywordsearch engineen
dc.subject.keywordinformaation välitysfi
dc.subject.keywordindexingen
dc.subject.keywordinformaatiojärjestelmätfi
dc.subject.keywordWWWen
dc.subject.keywordhakukonefi
dc.subject.keywordInterneten
dc.subject.keywordindeksointifi
dc.titleInformation Retrieval in the World Wide Weben
dc.titleTiedonhaku World Wide Web -ympäristössäfi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_39639
local.aalto.idinssi14624
local.aalto.openaccessno

Files