Combination Methods for Language Models in Speech Recognition

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorKurimo, Mikko
dc.contributor.authorBroman, Simo
dc.contributor.departmentTeknillisen fysiikan ja matematiikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorHonkela, Timo
dc.date.accessioned2020-12-04T19:30:23Z
dc.date.available2020-12-04T19:30:23Z
dc.date.issued2005
dc.description.abstractTilastollinen kielimalli on oleellinen osa nykyaikaista puheentunnistusjärjestelmää, jossa sen tehtävä on pisteyttää sanahypoteesit kielellisen informaation perusteella. Lukuisia kielimalleja on esitetty kirjallisuudessa. Parhaat tulokset on saavutettu käyttämällä eri kielimalleja yhdessä. Useita menetelmiä kielimallien yhdistelyyn on esitetty, mutta kattavaa tutkimusta eri menetelmistä ei ole esitetty. Tässä työssä tutkitaan kirjallisuudessa esitettyjä yhdistämismenetelmiä. Lisäksi työssä esitetään uusi menetelmä, joka perustuu uskottavuustiheysfunktion estimointiin histogrammien avulla. Teoreettisen tarkastelun lisäksi neljää yhdistämismenetelmää arvioidaan puheentunnistuskokeilla sekä kielimallin hyvyyttä kuvaavilla perplexity-kokeilla. Aineistona käytetään suomenkielisiä uutisartikkeleita. Yhdisteltävinä kielimalleina toimii neljä kielimallia, jotka esitellään työssä. Perplexity-kokeissa kaikilla yhdistämismenetelmillä saavutettiin kielimalleista riippuen tilastollisesti merkittävää parannusta vertailukohtana toimineeseen 4-grammi-malliin. Paras tulos, 46 % parannus 4-grammimalliin verrattuna, saatiin yhdistämällä useita malleja uudella bin-estimointi-menetelmällä. Puheentunnistuskokeissa saavutettiin parhaimmillaan 4 % parannus sanavirheessä ja 7 % parannus äännevirheessä.fi
dc.format.extent64
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/92771
dc.identifier.urnURN:NBN:fi:aalto-2020120451606
dc.language.isoenen
dc.programme.majorInformaatiotekniikkafi
dc.programme.mcodeT-61fi
dc.rights.accesslevelclosedAccess
dc.subject.keywordlanguage modelingen
dc.subject.keywordkielenmallinnusfi
dc.subject.keywordspeech recognitionen
dc.subject.keywordpuheentunnistusfi
dc.subject.keywordcombination methodsen
dc.subject.keywordyhdistämismenetelmätfi
dc.subject.keywordcombining language modelsen
dc.subject.keywordkielimallien yhdistäminenfi
dc.titleCombination Methods for Language Models in Speech Recognitionen
dc.titleKielimallien yhdistämismenetelmiä puheentunnistuksessafi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthask
local.aalto.digifolderAalto_89617
local.aalto.idinssi28993
local.aalto.openaccessno

Files