End-user image searching strategies in a commercial image database
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2009
Department
Major/Subject
Viestintätekniikka
Mcode
AS-75
Degree programme
Language
en
Pages
vii + 117 s. +liitt. 22
Series
Abstract
Fast growing image collections and direct end-user access enabled by the digital technology impose challenges for image indexing and retrieval methods. Knowledge about user behaviour in image retrieval is required in order develop robust, high precision image retrieval and indexing solutions. This study examined the search strategies of end-users in the web image database of a picture agency. The idea of search strategies is originated in the study of textual information retrieval. Major part of previous image retrieval studies have focused on the analysis of image attributes in query terms to depict visual information needs. The studies on search strategies have been mainly conducted with a relatively small set of subjects who perform simulated search tasks in monitored circumstances. Data has been collected in interaction with the user and as transaction logs extracted from the search system. This study examined how a large, anonymous search log could be used to study image search strategies. Image searches were analyzed by semantic levels, linguistic types of query terms and detailed image attributes in queries. A framework for categorization of search tactics was also developed by adapting the classifications found in the research literature. The tactics and image attributes were further analyzed to typify and explain user search behaviour. The image searches were characterised by the shortness of sessions and queries. The searches-contained typically only one type of terms, for example half of the sessions contained only specific query terms. People's names were the most frequent type of image attribute. The most common tactic was changing the query terms to parallel terms or terms representing another viewpoint to the search subject. Moving on the hierarchical levels of concepts was rather rare. The search sessions seemed often to be experimental in nature.Nopeasti kasvavat sähköiset kuvatietokannat ja loppukäyttäjien suora pääsy kuvatietokannan hakuihin asettavat vaatimuksia kuvaindeksoinnin ja -haun menetelmien kehitykselle. Näiden menetelmien kehityksessä tarvitaan tietoa hakijoiden hakukäyttäytymisestä. Tämä tutkimus käsittelee loppukäyttäjien kuvahakustrategioita kuvatoimiston verkkokaupassa. Hakustrategia-käsite kehitettiin tekstuaalisen tiedonhaun tutkimuksen parissa. Suurin osa aiemmasta kuvahakututkimuksesta on keskittynyt kuvatarpeiden kuvaamiseen erittelemällä hauista kuva-attribuutteja. Kuvahakustrategioita on puolestaan tutkittu lähinnä pienillä hakijajoukoilla, jotka ovat suorittaneet annettuja kuvahakutehtäviä valvotuissa, keinotekoisissa oloissa. Dataa hauista on kerätty suoraan hakijalta sekä koneellisesti muodostettujen hakulokien muodossa. Tässä diplomityössä tutkittiin, kuinka suurta, anonyymiä hakulokia voidaan käyttää kuvahakustrategioiden tutkimiseen. Kuvahauista analysointiin hakutermien semanttisia tasoja, lingvistisiä tyyppejä ja kuva-attribuutteja yksityiskohtaisella tasolla. Kuvahakutaktiikoita analysoitiin luokittelurakenteella, joka muodostettiin soveltamalla aiempia kirjallisuudessa esiintyneitä luokitteluja. Löydettyjä taktiikoita ja kuva-attribuutteja käytettiin hakustrategiatyyppien muodostamisessa ja selittämisessä. Kuvahaut olivat tässä tutkimuksessa tyypillisesti lyhyitä sekä sessio- että kyselytasolla. Hauissa oli yleensä vain yhden tyyppisiä termejä, esimerkiksi puolet hakusessiosta sisälsivät vain spesifisiä hakutermejä. Ihmisten nimet olivat yleisin hauissa käytetty kuva-attribuutti. Yleisin hakutaktiikka oli hakutermien muuttaminen rinnakkaisiksi termeiksi tai toista hakunäkökulmaa edustaviksi termeiksi. Liikkuminen käsitteiden eri hierarkkisilla tasoilla oli harvinaista. Yleisesti haut vaikuttivat olevan kokeiluluontoisia.Description
Supervisor
Oittinen, PirkkoThesis advisor
Westman, StinaKeywords
information retrieval, tiedonhaku, image searching, kuvanhaku, seach strategy, hakustrategia, seach tactic, hakutaktiikka, image attributes, kuva-attribuutit, seach patterns, hakukuviot