dc.contributor |
Aalto-yliopisto |
fi |
dc.contributor |
Aalto University |
en |
dc.contributor.advisor |
Kurimo, Mikko |
|
dc.contributor.author |
Siivola, Vesa |
|
dc.date.accessioned |
2020-12-03T23:40:56Z |
|
dc.date.available |
2020-12-03T23:40:56Z |
|
dc.date.issued |
1999 |
|
dc.identifier.uri |
https://aaltodoc.aalto.fi/handle/123456789/87345 |
|
dc.description.abstract |
Tässä diplomityössä etsitään tapoja parantaa puheentunnistimen tarkkuutta, kun tunnistinta ei ole opetettu käyttäjän puheella.
Työssä tarkastellaan useita tapoja vaikuttaa tähän, alkaen tunnistimen perusmallin valinnasta tekniikoihin, joilla yritetään vähentää taustakohinan vaikutusta ja mukauttaa eli adaptoida puheen malli käyttäjän puhetyylin mukaan.
Sekä kohinan kompensointi että mallin mukauttaminen tapahtuu laitetta käytettäessä, eikä mitään opetusistuntoa vaadita.
Nämä ominaisuudet ovat tärkeitä, kun yritetään tehdä julkista palvelua, kuten esimerkiksi automaattista lennonvarausjärjestelmää, eikä käyttäjää voida vaivata opetusistunnolla.
Työssä käytetty tunnistin perustuu kätkettyihin Markov-malleihin.
Tunnistimen perusrakenneyksikkönä kokeillaan yhden foneemin sijasta käyttää siirtymää yhdestä foneemista toiseen ja huomataan, että jälkimmäinen toimii paremmin vastaavalla määrällä parametrejä.
Kepstrien keskiarvojen normalisoinnilla yritetään kompensoida tekijöitä, jotka muuttavat irrotettuja piirteitä konsistentisti.
Tämä menetelmä toimii kohtuullisen hyvin.
Puheen mallin adaptoimiseen käytetty algoritmi johdetaan maksimi a posteriori -adaptoinnista ja itseorganisoituvista kartoista.
Adaptaatio toimii hyvin yhden foneemin mallilla, mutta foneemien siirtymiä käytettäessä tulokset eivät juurikaan parane syistä, jotka esitetään työssä. |
fi |
dc.format.extent |
55 |
|
dc.language.iso |
en |
en |
dc.title |
An adaptive method to achieve speaker independence in a speech recognition system |
en |
dc.title |
Adaptiivinen menetelmä puhujariippumattomuuden saavuttamiseksi puheentunnistusjärjestelmässä |
fi |
dc.contributor.school |
Teknillinen korkeakoulu |
fi |
dc.contributor.school |
Helsinki University of Technology |
en |
dc.contributor.department |
Sähkö- ja tietoliikennetekniikan osasto |
fi |
dc.subject.keyword |
speech recognition |
fi |
dc.subject.keyword |
speaker adaptation |
fi |
dc.subject.keyword |
speaker compensation |
fi |
dc.subject.keyword |
hidden Markov models |
fi |
dc.subject.keyword |
self-organizing map |
fi |
dc.subject.keyword |
features of speech |
fi |
dc.subject.keyword |
puheentunnistus |
fi |
dc.subject.keyword |
puhuja-adaptaatio |
fi |
dc.subject.keyword |
puhujan kompensoiminen |
fi |
dc.subject.keyword |
kätketyt Markov-mallit |
fi |
dc.subject.keyword |
itseorganisoituva kartta |
fi |
dc.subject.keyword |
puheen piirteet |
fi |
dc.identifier.urn |
URN:NBN:fi:aalto-2020120446183 |
|
dc.programme.major |
Informaatiotekniikka |
fi |
dc.programme.mcode |
Tik-61 |
fi |
dc.type.ontasot |
Master's thesis |
en |
dc.type.ontasot |
Pro gradu -tutkielma |
fi |
dc.contributor.supervisor |
Oja, Erkki |
|
local.aalto.openaccess |
no |
|
local.aalto.digifolder |
Aalto_40356 |
|
dc.rights.accesslevel |
closedAccess |
|
local.aalto.idinssi |
14795 |
|
dc.type.publication |
masterThesis |
|
dc.type.okm |
G2 Pro gradu, diplomityö |
|
local.aalto.digiauth |
ask |
|