Combination Methods for Language Models in Speech Recognition

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2005

Major/Subject

Informaatiotekniikka

Mcode

T-61

Degree programme

Language

en

Pages

64

Series

Abstract

Tilastollinen kielimalli on oleellinen osa nykyaikaista puheentunnistusjärjestelmää, jossa sen tehtävä on pisteyttää sanahypoteesit kielellisen informaation perusteella. Lukuisia kielimalleja on esitetty kirjallisuudessa. Parhaat tulokset on saavutettu käyttämällä eri kielimalleja yhdessä. Useita menetelmiä kielimallien yhdistelyyn on esitetty, mutta kattavaa tutkimusta eri menetelmistä ei ole esitetty. Tässä työssä tutkitaan kirjallisuudessa esitettyjä yhdistämismenetelmiä. Lisäksi työssä esitetään uusi menetelmä, joka perustuu uskottavuustiheysfunktion estimointiin histogrammien avulla. Teoreettisen tarkastelun lisäksi neljää yhdistämismenetelmää arvioidaan puheentunnistuskokeilla sekä kielimallin hyvyyttä kuvaavilla perplexity-kokeilla. Aineistona käytetään suomenkielisiä uutisartikkeleita. Yhdisteltävinä kielimalleina toimii neljä kielimallia, jotka esitellään työssä. Perplexity-kokeissa kaikilla yhdistämismenetelmillä saavutettiin kielimalleista riippuen tilastollisesti merkittävää parannusta vertailukohtana toimineeseen 4-grammi-malliin. Paras tulos, 46 % parannus 4-grammimalliin verrattuna, saatiin yhdistämällä useita malleja uudella bin-estimointi-menetelmällä. Puheentunnistuskokeissa saavutettiin parhaimmillaan 4 % parannus sanavirheessä ja 7 % parannus äännevirheessä.

Description

Supervisor

Honkela, Timo

Thesis advisor

Kurimo, Mikko

Keywords

language modeling, kielenmallinnus, speech recognition, puheentunnistus, combination methods, yhdistämismenetelmät, combining language models, kielimallien yhdistäminen

Other note

Citation