Methods for spectral envelope estimation in noise robust speech recognition

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorPalomäki, Kalle
dc.contributor.authorKallasjoki, Heikki
dc.contributor.departmentTietotekniikan laitosfi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorOja, Erkki
dc.date.accessioned2020-12-05T14:47:01Z
dc.date.available2020-12-05T14:47:01Z
dc.date.issued2009
dc.description.abstractPuheentunnistusjärjestelmien käytännön sovellusten on toimittava haasteellisissa ympäristöissä, joissa tietoa mahdollisten häiriöäänien laadusta ei välttämättä ole saatavilla ennakkoon. Puhesignaalin lyhytaikaisen spektrin verhokäyrä sisältää puheen välittämään viestiin liittyvän tiedon muodossa, joka sietää kohinaa paremmin kuin sen perustana oleva spektri. Malleja verhokäyrästä voidaankin siten käyttää tuottamaan puhesignaaleille piirre-esitystapoja, joihin ympäristöstä peräisin olevat häiriöäänet vaikuttavat vähemmän. Tässä työssä eri menetelmiä verhokäyrän mallintamiseen tarkastellaan osana laajan sanavaraston jatkuvan puheen tunnistusjärjestelmän piirreirroitusta. Tunnistusvirheiden määrää todellisissa kohinaisissa ympäristöissä nauhoitetulle puheelle vertaillaan eri piirre-esitystapojen välillä. Vertailtavat piirteet perustuvat perinteiseen, painotettuun ja hiljattain esiteltyyn stabiloituun painotettuun lineaariprediktioon. Myös menetelmiä stabiloidun painotetun lineaariprediktion parametrien automaattiseen mukautukseen analysoitavalle äänisignaalille sopivaksi tutkitaan. Merkittävästi parempia tunnistustuloksia saavutetaan perinteiseen ja painotettuun lineaariprediktioon perustuvia verhokäyrän malleja käyttävillä piirteillä, kun tunnistettavana on kohinaista puhetta ja käytetään puhtaalla puheella opetettuja akustisia malleja.fi
dc.format.extent(10) + 62
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/96810
dc.identifier.urnURN:NBN:fi:aalto-2020120555644
dc.language.isoenen
dc.programmeTietotekniikan tutkinto-ohjelmafi
dc.programme.majorInformaatiotekniikkafi
dc.programme.mcodeT-61fi
dc.rights.accesslevelopenAccess
dc.subject.keywordautomatic speech recognitionen
dc.subject.keywordautomaattinen puheentunnistusfi
dc.subject.keywordfeature extractionen
dc.subject.keywordpiirreirroitusfi
dc.subject.keywordspectral envelope estimationen
dc.subject.keywordspektrin verhokäyrän mallinnusfi
dc.subject.keywordweighted linear predictionen
dc.subject.keywordpainotettu lineaariprediktiofi
dc.titleMethods for spectral envelope estimation in noise robust speech recognitionen
dc.titleMenetelmiä spektrin verkkokäyrän mallintamiseen kohinasietoista puheentunnistusta vartenfi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthyes
local.aalto.digifolderAalto_12369
local.aalto.idinssi38405
local.aalto.inssiarchivenr7209
local.aalto.inssilocationP1 Ark Aalto
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
master_Kallasjoki_Heikki_2009.pdf
Size:
26 MB
Format:
Adobe Portable Document Format