Maximum Entropy Modeling and Semantic Concept Detection
| dc.contributor | Aalto-yliopisto | fi |
| dc.contributor | Aalto University | en |
| dc.contributor.advisor | Iyengar, Giridharan | |
| dc.contributor.author | Argillander, Janne | |
| dc.contributor.department | Sähkö- ja tietoliikennetekniikan osasto | fi |
| dc.contributor.school | Teknillinen korkeakoulu | fi |
| dc.contributor.school | Helsinki University of Technology | en |
| dc.contributor.supervisor | Laine, Unto K. | |
| dc.date.accessioned | 2020-12-04T19:25:35Z | |
| dc.date.available | 2020-12-04T19:25:35Z | |
| dc.date.issued | 2005 | |
| dc.description.abstract | Saatavilla olevan multimedian määrä on kasvanut niin suureksi, että sen hallinta ilman apuvälineitä on mahdotonta. Tätä hallintaa helpottavat hakumenetelmät, joiden avulla voidaan siirtyä multimediaesityksessä haluttuun kohtaan. Nämä hakumenetelmät perustuvat olemassa oleviin indekseihin, jotka on luotu käsin. Nykyään keskimääräisen käyttäjän kotikoneelta löytyy kuitenkin niin paljon multimediatiedostoja, että niiden manuaalinen läpikäyminen olisi liian työlästä. Tässä työssä haen ratkaisua tähän ongelmaan esittelemällä menetelmän, joka kykenee indeksoimaan multimediatiedostoja automaattisesti. Työssäni esittelemäni menetelmä käyttää hyödykseen sekä visuaalisia, että puheeseen perustuvia vihjeitä. Nämä vihjeet esitetään tilastolliselle maksimi-entropiaprosessille predikaattien avulla. Menetelmän suorituskyky on suoraan verrannollinen näiden predikaattien toimivuuteen. Tämän vuoksi predikaattien suunnittelu on yksi tämän työn keskeisimmistä kohdista. Tehdyt kokeet osoittavat, että multimodaalinen menetelmä toimii paremmin, kuin yhtä modaliteettia käyttävät menetelmät. Vertailu paljastaa myös, että esitetty menetelmä toimii vastaavalla tasolla TRECVID kilpailun voittaneen menetelmän kanssa. On myös huomioitava, että esitetty menetelmä on geneerinen ja TRECVID kilpailussa olleita menetelmiä huomattavasti yksinkertaisempi. Tämän vuoksi esitetty multimodaalinen menetelmä on lupaava ja jatkotutkimuksen arvoinen. | fi |
| dc.format.extent | 62 | |
| dc.identifier.uri | https://aaltodoc.aalto.fi/handle/123456789/92681 | |
| dc.identifier.urn | URN:NBN:fi:aalto-2020120451516 | |
| dc.language.iso | en | en |
| dc.programme.major | Akustiikka ja äänenkäsittelytekniikka | fi |
| dc.programme.mcode | S-89 | fi |
| dc.rights.accesslevel | closedAccess | |
| dc.subject.keyword | maximum entropy | en |
| dc.subject.keyword | maksimi-entropia | fi |
| dc.subject.keyword | MaxEnt | en |
| dc.subject.keyword | MaxEnt | fi |
| dc.subject.keyword | concept detection | en |
| dc.subject.keyword | semanttinen konsepti | fi |
| dc.subject.keyword | automatic annotation | en |
| dc.subject.keyword | automaattinen annotaatio | fi |
| dc.title | Maximum Entropy Modeling and Semantic Concept Detection | en |
| dc.type.okm | G2 Pro gradu, diplomityö | |
| dc.type.ontasot | Master's thesis | en |
| dc.type.ontasot | Pro gradu -tutkielma | fi |
| dc.type.publication | masterThesis | |
| local.aalto.digiauth | ask | |
| local.aalto.digifolder | Aalto_34609 | |
| local.aalto.idinssi | 28900 | |
| local.aalto.inssilocation | P1 Ark S80 | |
| local.aalto.openaccess | no |