Methods for spectral envelope estimation in noise robust speech recognition

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology | Diplomityö
Date
2009
Major/Subject
Informaatiotekniikka
Mcode
T-61
Degree programme
Tietotekniikan tutkinto-ohjelma
Language
en
Pages
(10) + 62
Series
Abstract
Puheentunnistusjärjestelmien käytännön sovellusten on toimittava haasteellisissa ympäristöissä, joissa tietoa mahdollisten häiriöäänien laadusta ei välttämättä ole saatavilla ennakkoon. Puhesignaalin lyhytaikaisen spektrin verhokäyrä sisältää puheen välittämään viestiin liittyvän tiedon muodossa, joka sietää kohinaa paremmin kuin sen perustana oleva spektri. Malleja verhokäyrästä voidaankin siten käyttää tuottamaan puhesignaaleille piirre-esitystapoja, joihin ympäristöstä peräisin olevat häiriöäänet vaikuttavat vähemmän. Tässä työssä eri menetelmiä verhokäyrän mallintamiseen tarkastellaan osana laajan sanavaraston jatkuvan puheen tunnistusjärjestelmän piirreirroitusta. Tunnistusvirheiden määrää todellisissa kohinaisissa ympäristöissä nauhoitetulle puheelle vertaillaan eri piirre-esitystapojen välillä. Vertailtavat piirteet perustuvat perinteiseen, painotettuun ja hiljattain esiteltyyn stabiloituun painotettuun lineaariprediktioon. Myös menetelmiä stabiloidun painotetun lineaariprediktion parametrien automaattiseen mukautukseen analysoitavalle äänisignaalille sopivaksi tutkitaan. Merkittävästi parempia tunnistustuloksia saavutetaan perinteiseen ja painotettuun lineaariprediktioon perustuvia verhokäyrän malleja käyttävillä piirteillä, kun tunnistettavana on kohinaista puhetta ja käytetään puhtaalla puheella opetettuja akustisia malleja.
Description
Supervisor
Oja, Erkki
Thesis advisor
Palomäki, Kalle
Keywords
automatic speech recognition, automaattinen puheentunnistus, feature extraction, piirreirroitus, spectral envelope estimation, spektrin verhokäyrän mallinnus, weighted linear prediction, painotettu lineaariprediktio
Citation