Maximum Entropy Modeling and Semantic Concept Detection

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorIyengar, Giridharan
dc.contributor.authorArgillander, Janne
dc.contributor.departmentSähkö- ja tietoliikennetekniikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorLaine, Unto K.
dc.date.accessioned2020-12-04T19:25:35Z
dc.date.available2020-12-04T19:25:35Z
dc.date.issued2005
dc.description.abstractSaatavilla olevan multimedian määrä on kasvanut niin suureksi, että sen hallinta ilman apuvälineitä on mahdotonta. Tätä hallintaa helpottavat hakumenetelmät, joiden avulla voidaan siirtyä multimediaesityksessä haluttuun kohtaan. Nämä hakumenetelmät perustuvat olemassa oleviin indekseihin, jotka on luotu käsin. Nykyään keskimääräisen käyttäjän kotikoneelta löytyy kuitenkin niin paljon multimediatiedostoja, että niiden manuaalinen läpikäyminen olisi liian työlästä. Tässä työssä haen ratkaisua tähän ongelmaan esittelemällä menetelmän, joka kykenee indeksoimaan multimediatiedostoja automaattisesti. Työssäni esittelemäni menetelmä käyttää hyödykseen sekä visuaalisia, että puheeseen perustuvia vihjeitä. Nämä vihjeet esitetään tilastolliselle maksimi-entropiaprosessille predikaattien avulla. Menetelmän suorituskyky on suoraan verrannollinen näiden predikaattien toimivuuteen. Tämän vuoksi predikaattien suunnittelu on yksi tämän työn keskeisimmistä kohdista. Tehdyt kokeet osoittavat, että multimodaalinen menetelmä toimii paremmin, kuin yhtä modaliteettia käyttävät menetelmät. Vertailu paljastaa myös, että esitetty menetelmä toimii vastaavalla tasolla TRECVID kilpailun voittaneen menetelmän kanssa. On myös huomioitava, että esitetty menetelmä on geneerinen ja TRECVID kilpailussa olleita menetelmiä huomattavasti yksinkertaisempi. Tämän vuoksi esitetty multimodaalinen menetelmä on lupaava ja jatkotutkimuksen arvoinen.fi
dc.format.extent62
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/92681
dc.identifier.urnURN:NBN:fi:aalto-2020120451516
dc.language.isoenen
dc.programme.majorAkustiikka ja äänenkäsittelytekniikkafi
dc.programme.mcodeS-89fi
dc.rights.accesslevelclosedAccess
dc.subject.keywordmaximum entropyen
dc.subject.keywordmaksimi-entropiafi
dc.subject.keywordMaxEnten
dc.subject.keywordMaxEntfi
dc.subject.keywordconcept detectionen
dc.subject.keywordsemanttinen konseptifi
dc.subject.keywordautomatic annotationen
dc.subject.keywordautomaattinen annotaatiofi
dc.titleMaximum Entropy Modeling and Semantic Concept Detectionen
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_34609
local.aalto.idinssi28900
local.aalto.inssilocationP1 Ark S80
local.aalto.openaccessno

Files