On the Axiomatics of Web Information Retrieval

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Date
2007
Major/Subject
Matematiikka
Mcode
Mat-1
Degree programme
Language
fi
Pages
Series
Abstract
Millä perusteella hakukone järjestää internet-sivut siten, että parhaiten hakusanaa vastaava sivu on hakukoneen tuottaman listan kärjessä? Jos parhaiten hakusanaa vastaava internet-sivu on suomenkielinen, onko sama sivu paras, jos haetaan ainoastaan suomenkielisiltä sivuilta? Tässä työssä tarkastellaan hakukoneen tekemää valintaa internet-sivujen laajasta joukosta. Sivujen välisiin linkkeihin perustuvissa hakumenetelmissä, kuten HITS, PageRank ja SALSA, internet-sivut järjestetään sen perusteella, missä asemassa ne ovat muihin sivuihin nähden. HITS-hakumenetelmässä internet-sivu on hyvässä asemassa, jos sille on useita linkkejä muilta sivuilta. Tällöin sivua sanotaan arvovaltaiseksi. Parhaita sivuja ovat ne, joille on useita linkkejä arvovaltaisilta sivuilta. Työn tärkein tulos on se, että HITS-menetelmän rajatussa haussa internet-sivujen paremmuusjärjestys saattaa riippua merkittävästi hakualueesta. Esimerkiksi haettaessa samalla hakusanalla sivuja koko internetistä ja ainoastaan suomenkielisiltä sivuilta saattavat parhaiten hakusanaa vastaavat sivut olla eri järjestyksessä. Tämä perustuu siihen, että suomenkielinen sivu voi olla linkkien kannalta tärkeässä asemassa, kun otetaan huomioon koko internet, mutta sama sivu saattaa olla huonossa asemassa kun tarkastellaan ainoastaan suomenkielisten sivujen välisiä linkkejä. Vastaavasti suomenkielinen sivu voi olla hyvässä asemassa suomenkielisten sivujen keskuudessa mutta huonossa asemassa maailmanlaajuisesti. Hakukoneiden tekemän valinnan tarkastelussa on sovellettu taloustieteiden ja sosiologian tutkimuksissa kehitettyä valinnan teoriaa, jonka varhaisimmat teokset on kirjoitettu 1700-luvun lopussa. Teorian tutkijat ovat esittäneet tiettyjä ehtoja, jotka valintojen tulisi toteuttaa ollakseen rationaalisesti perusteltuja. Työssä on osoitettu, että mikään näistä ehdoista ei välttämättä toteudu sovellettaessa HITS-menetelmää parhaiden internet-sivujen valitsemisessa.
Description
Supervisor
Valkeila, Esko
Keywords
theory of choice, valinnan teoria, classical rational choice, klassinen rationaalinen valinta, web information retrieval, hakukoneet, search engines, aksiomatiikka, axiomatics, HITS, HITS, hakualgoritmit, search algorithms
Other note
Citation