A decoder for large-vocabulary continuous speech recognition

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.authorHirsimäki, Teemu
dc.contributor.departmentTietotekniikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorKurimo, Mikko
dc.date.accessioned2020-12-04T15:17:26Z
dc.date.available2020-12-04T15:17:26Z
dc.date.issued2002
dc.description.abstractYksi automaattisten puheentunnistusjärjestelmien keskeisistä osista on dekooderi, jonka tehtävänä on etsiä akustisten mallien ja kielimallien perusteella parhaiten puheeseen sopiva sanajono. Tässä diplomityössä on toteutettu dekooderi C++-kielellä tutkimuskäyttöön. Erityisesti huomiota on kiinnitetty siihen, että dekooderin kanssa voidaan käyttää suuria sanastoja ja laajan kontekstin kielimalleja. Järjestelmän perustana on niin kutsuttu pinomenetelmä, jossa tunnistushypoteeseja pidetään ajan mukaan järjestetyissä pinoissa. Lisäksi akustinen mallinnus on erotettu kielimallinnuksesta, minkä vuoksi laajojenkin kielimallien liittäminen järjestelmään on mahdollista. Dekooderin toteutuksen lisäksi tässä työssä kuvataan myös puheentunnistusjärjestelmän muiden tärkeimpien osien toimintaa sekä oleellisimpia ongelmia, joita täytyy ratkaista, kun foneemipohjaisen tunnistuksen sijaan tehdäänkin sanastoihin ja kielimalleihin perustuvaa tunnistusta. Järjestelmän toimivuutta on testattu suomenkielisellä puheaineistolla, ja testeissä on tutkittu sanaston koon ja dekooderin parametrien vaikutusta tunnistustuloksiin.fi
dc.format.extent46
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/90171
dc.identifier.urnURN:NBN:fi:aalto-2020120449006
dc.language.isoenen
dc.programme.majorInformaatiotekniikkafi
dc.programme.mcodeT-61fi
dc.rights.accesslevelclosedAccess
dc.subject.keyworddecoderen
dc.subject.keyworddekooderifi
dc.subject.keywordspeech recognitionen
dc.subject.keywordpuheentunnistusfi
dc.subject.keywordcontinuous speechen
dc.subject.keywordjatkuva puhefi
dc.subject.keywordlarge vocabularyen
dc.subject.keywordsuuri sanastofi
dc.subject.keywordlanguage modelsen
dc.subject.keywordkielimallitfi
dc.subject.keywordhidden Markov modelsen
dc.subject.keywordkätketyt Markov-mallitfi
dc.titleA decoder for large-vocabulary continuous speech recognitionen
dc.titleSuurten sanastojen dekooderi jatkuvan puheen tunnistukseenfi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_03351
local.aalto.idinssi19051
local.aalto.openaccessno

Files