Learning Centre

An adaptive method to achieve speaker independence in a speech recognition system

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Kurimo, Mikko
dc.contributor.author Siivola, Vesa
dc.date.accessioned 2020-12-03T23:40:56Z
dc.date.available 2020-12-03T23:40:56Z
dc.date.issued 1999
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/87345
dc.description.abstract Tässä diplomityössä etsitään tapoja parantaa puheentunnistimen tarkkuutta, kun tunnistinta ei ole opetettu käyttäjän puheella. Työssä tarkastellaan useita tapoja vaikuttaa tähän, alkaen tunnistimen perusmallin valinnasta tekniikoihin, joilla yritetään vähentää taustakohinan vaikutusta ja mukauttaa eli adaptoida puheen malli käyttäjän puhetyylin mukaan. Sekä kohinan kompensointi että mallin mukauttaminen tapahtuu laitetta käytettäessä, eikä mitään opetusistuntoa vaadita. Nämä ominaisuudet ovat tärkeitä, kun yritetään tehdä julkista palvelua, kuten esimerkiksi automaattista lennonvarausjärjestelmää, eikä käyttäjää voida vaivata opetusistunnolla. Työssä käytetty tunnistin perustuu kätkettyihin Markov-malleihin. Tunnistimen perusrakenneyksikkönä kokeillaan yhden foneemin sijasta käyttää siirtymää yhdestä foneemista toiseen ja huomataan, että jälkimmäinen toimii paremmin vastaavalla määrällä parametrejä. Kepstrien keskiarvojen normalisoinnilla yritetään kompensoida tekijöitä, jotka muuttavat irrotettuja piirteitä konsistentisti. Tämä menetelmä toimii kohtuullisen hyvin. Puheen mallin adaptoimiseen käytetty algoritmi johdetaan maksimi a posteriori -adaptoinnista ja itseorganisoituvista kartoista. Adaptaatio toimii hyvin yhden foneemin mallilla, mutta foneemien siirtymiä käytettäessä tulokset eivät juurikaan parane syistä, jotka esitetään työssä. fi
dc.format.extent 55
dc.language.iso en en
dc.title An adaptive method to achieve speaker independence in a speech recognition system en
dc.title Adaptiivinen menetelmä puhujariippumattomuuden saavuttamiseksi puheentunnistusjärjestelmässä fi
dc.contributor.school Teknillinen korkeakoulu fi
dc.contributor.school Helsinki University of Technology en
dc.contributor.department Sähkö- ja tietoliikennetekniikan osasto fi
dc.subject.keyword speech recognition fi
dc.subject.keyword speaker adaptation fi
dc.subject.keyword speaker compensation fi
dc.subject.keyword hidden Markov models fi
dc.subject.keyword self-organizing map fi
dc.subject.keyword features of speech fi
dc.subject.keyword puheentunnistus fi
dc.subject.keyword puhuja-adaptaatio fi
dc.subject.keyword puhujan kompensoiminen fi
dc.subject.keyword kätketyt Markov-mallit fi
dc.subject.keyword itseorganisoituva kartta fi
dc.subject.keyword puheen piirteet fi
dc.identifier.urn URN:NBN:fi:aalto-2020120446183
dc.programme.major Informaatiotekniikka fi
dc.programme.mcode Tik-61 fi
dc.type.ontasot Master's thesis en
dc.type.ontasot Pro gradu -tutkielma fi
dc.contributor.supervisor Oja, Erkki
local.aalto.openaccess no
local.aalto.digifolder Aalto_40356
dc.rights.accesslevel closedAccess
local.aalto.idinssi 14795
dc.type.publication masterThesis
dc.type.okm G2 Pro gradu, diplomityö
local.aalto.digiauth ask


Files in this item

Files Size Format View

There are no open access files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse

Statistics