Implementation of Content-Based WWW Image Search Engine
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2000
Department
Major/Subject
Informaatiotekniikka
Mcode
Tik-61
Degree programme
Language
en
Pages
96
Series
Abstract
Viime vuosina on World Wide Web noussut hyvin suosituksi informaatiolähteeksi. WWW:n tarjoaman valtavan ja alati muuttuvan informaation hyödyntämiseksi tarvitaan kuitenkin tehokkaita käsittelymenetelmiä. Hakukoneet käyttävät etukäteen kerättyjä ja jatkuvasti päivitettyjä tietokantoja WWW:n sisällöstä löytääkseen vastauksen käyttäjän esittämään hakuun. Eräs erityisen haastava hakutehtävä on käyttäjän määrittelemiä ominaisuuksia sisältävien kuvien hakeminen WWW:stä. Kuvadata sisältää paljon enemmän informaatiota kuin tekstidata, eikä visuaalista informaatiota voida tehokkaasti hakea perinteisiä teksti-informaation hakumenetelmiä käyttäen. Tästä johtuen sisältöpohjaista kuvahakua on viime aikoina tutkittu laajasti. Sisältöpohjaisen kuvahaun perustana käytetään kuvien visuaalisia piirteitä, jotka voidaan poimia automaattisesti kuvasta ilman ihmisen vaikutusta tai tulkintaa. Tämän työn kirjallisuustutkimusosassa perehdytään olennaisiin asioihin, jotka liittyvät sisältöpohjaiseen kuvahakuun WWW:stä. Tutkimusosuus on kaksiosainen. Ensimmäisessä osassa käsitellään kuvien keräykseen WWW:stä liittyviä merkittävimpiä haasteita ja esitetään niihin joitakin ratkaisuja. Tutkimusosuuden toinen osa liittyy sisältöpohjaiseen kuvahakuun. Aihetta käsitellään erityisesti WWW-kuvatietokantojen näkökulmasta. Myös useita olemassa olevia WWW-kuvahakukoneita esitellään. Huomattava osa työstä koostuu jo olemassa olevan kokeellisen PicSOM-kuvahakujärjestelmän laajentamisesta WWW-kuvahakukoneeksi. Tämän laajennuksen tärkeä osa on Imgrobot-nimisen WWW-hakurobotin toteutus. Hakurobotin käyttötarkoituksena on kerätä WWW:stä kuvatietokanta ja ylläpitää sitä. PicSOM-järjestelmän uusittu toteutus ja tällä hetkellä käytössä olevat piirteet on myös kuvattu. Lisäksi esitellään uusi menetelmä, joka mahdollistaa WWW:n rakenteesta kerättävän tiedon käyttämisen indeksoivana piirteenä. Toinen tärkeä osa työstä on selvittää PicSOM-järjestelmän toimivuus yli miljoona kuvaa sisältävillä tietokannoilla. Asian selvittämiseksi on Imgrobotin avulla kerätty verkosta kuvatietokanta, jonka koko on 1008844 kuvaa. Tehdyt kokeet osoittavat, että PicSOM pystyy tehokkaasti hakemaan käyttäjän haluamia kuvia myös kyseisen suuruusluokan kuvatietokannoista.Description
Supervisor
Oja, ErkkiThesis advisor
Laaksonen, JormaKoskela, Markus
Keywords
content-based image retrieval, sisältöpohjainen kuvahaku, Web robot, WWW-hakurobotti, self-organizing map, itseorganisoiva kartta, image search engine, kuvahakukone