Learning Centre

Implementation of isolated word speech recognizer on a digital sitnal processor

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Lipasti, Lauri
dc.contributor.author Sääksjärvi, Joonas
dc.date.accessioned 2020-12-04T14:43:10Z
dc.date.available 2020-12-04T14:43:10Z
dc.date.issued 2002
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/89523
dc.description.abstract Tässä diplomityössä tarkastellaan puheentunnistimen toteutusvaihtoehtoja. Tunnistin on erillään puhuttujen sanojen puheentunnistin, joka käyttää toimintoihinsa yhtä kiinteänpilkun laskentaa suorittavaa signaaliprosessoria. Toteutuksen tarvitseman signaaliprosessoriohjelman muistin määrä ja laskennan tarve ovat rajoitettuja, mikä on otettava huomioon vaihtoehtoja tarkasteltaessa. Kätkettyä Markov- paradigmaa (HMM) hyödyntävän tunnistimen toteuttamiseen valitaan kaksi eri Markov-mallin variaatiota. Diskreetti Markov- malli (DHMM) ja puolijatkuvan sekajakauman Markov- malli (SCHMM) vaikuttavat tunnistimen tarvitsemaan laskennan ja muistin määrään. Myös tunnistimen opetukseen tarvittavan datan määrä, ja siten tunnistimen käytettävyys, riippuu valitusta HMM-mallin tyypistä. Mallin ja sen parametroinnin ohella toinen puheentunnistimelle tärkeä toiminto on esikäsittely, jonka tarkoituksena on johtaa aikatason puhesignaalista piirrekuvaus, jonka luokittelu olisi mahdollisimman helppoa. Puheäänen laajan vaihtelevuuden takia tulisi piirrekuvauksen kyetä erottelemaan ne puhesignaalin ominaisuudet, jotka ovat kaikkein oleellisimpia tunnistuksen kannalta. Esikäsittelyn menetelminä työssä verrataan Mel-kepstrikertoimia (MFCC) ja Bark-kepstrikertoimia (BFCC), jotka molemmat hyödyntävät ihmisen kuuloaistia mallintavaa auditorista mallia. Puheentunnistimen toiminta huononee usein kuitenkin taustakohinan lisääntyessä. Taustakohinan ja -melun vaikutuksen vähentäminen on mahdollista joukolla kohinasietoisuutta parantavia menetelmiä. Tässä työssä kokeillaan kohinaspektrin vähennystä sekä puhuja-adaptaatiota MAP-menetelmällä. Parhaimman toteutusvaihtoehdon löytämiseksi arvioidaan kiinteänpilkun laskennan, sekä muisti- ja laskentakuorman tarve eri toteutusvaihtoehdoilla sekä tunnistimen toiminta mallinnetaan simulaatioiden avulla. Tulokset esitetään menetelmien vertailun, sekä tunnistimen käytettävyyttä parantavien lisäominaisuuksien, kuten sanahylkäyksen, osalta. fi
dc.format.extent 66
dc.language.iso fi en
dc.title Implementation of isolated word speech recognizer on a digital sitnal processor en
dc.title Erillisten sanojen puhentunnistimen toteutus signaaliprosessorilla fi
dc.contributor.school Teknillinen korkeakoulu fi
dc.contributor.school Helsinki University of Technology en
dc.contributor.department Sähkö- ja tietoliikennetekniikan osasto fi
dc.subject.keyword isolated word en
dc.subject.keyword puheentunnistus fi
dc.subject.keyword speech recognition en
dc.subject.keyword sanatunnistus fi
dc.subject.keyword pattern recognition en
dc.subject.keyword hahmontunnistus fi
dc.subject.keyword digital signal processor en
dc.subject.keyword kiinteänpilkun laskenta fi
dc.subject.keyword fixed-point calculation en
dc.subject.keyword Markov- malli fi
dc.subject.keyword hidden Markov -model en
dc.subject.keyword signaaliprosessori fi
dc.subject.keyword DHMM en
dc.subject.keyword DHMM fi
dc.subject.keyword SCHMM en
dc.subject.keyword SCHMM fi
dc.subject.keyword discrete MAP-adaptation en
dc.subject.keyword MFCC fi
dc.subject.keyword MFCC speech feature en
dc.subject.keyword BFCC fi
dc.subject.keyword BFCC en
dc.subject.keyword diskreetti MAP-adaptaatio fi
dc.subject.keyword OPD-word rejection en
dc.subject.keyword OPD-hylkäysfunktio fi
dc.identifier.urn URN:NBN:fi:aalto-2020120448358
dc.programme.major Laitteistotekniikka fi
dc.programme.mcode S-88 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Pro gradu -tutkielma fi
dc.contributor.supervisor Laine, Unto K.
local.aalto.openaccess no
local.aalto.digifolder Aalto_36133
dc.rights.accesslevel closedAccess
local.aalto.idinssi 18241
dc.type.publication masterThesis
dc.type.okm G2 Pro gradu, diplomityö
local.aalto.digiauth ask


Files in this item

Files Size Format View

There are no open access files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse