Triphone clustering in Finnish continuous speech recognition

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorLaine, Unto K.
dc.contributor.authorUrsin, Markku
dc.contributor.departmentTietotekniikan osastofi
dc.contributor.schoolTeknillinen korkeakoulufi
dc.contributor.schoolHelsinki University of Technologyen
dc.contributor.supervisorKurimo, Mikko
dc.date.accessioned2020-12-04T15:14:32Z
dc.date.available2020-12-04T15:14:32Z
dc.date.issued2002
dc.description.abstractTässä diplomityössä tutkitaan kontekstiriippuvien foneemimallien (trifonien) käyttöä suomenkielisen puhujariippuvan jatkuvan puheen tunnistimessa. Työn ensimmäisessä osassa tarkastellaan ihmisen puheentuotto- ja kuulojärjestelmiä, suomen kielen ominaisuuksia puheentunnistuksen kannalta sekä esitellään puheentunnistusjärjestelmien yleinen rakenne ja toiminta. Selostuksessa painotetaan foneemien kontekstiriippuvuutta sekä koartikulatorisia efektejä. Työn toisessa osassa opetetaan puhujariippuva tunnistin käyttäen kätkettyjä Markov-malleja (HMM) sekä Hidden Markov Model Toolkit (HTK)-ohjelmistoa. Trifoniklusteroinnissa kokeillaan datalähtöistä binääriseen päätöspuuhun perustuvaa menetelmää sekä menetelmiä, jotka käyttävät hyväkseen tietoa foneemien äännetyypeistä sekä ääntämispaikoista. Parhaat tunnistustulokset saavutetaan puuklusterointimenetelmällä, jolloin myös malleja on suurin määrä. Tunnistuskokeiden virheitä tarkastellaan laajasti. Foneemikohtaiset tyypilliset virheet ja eniten virheitä tuottaneet kontekstit analysoidaan.fi
dc.format.extent125
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/90116
dc.identifier.urnURN:NBN:fi:aalto-2020120448951
dc.language.isoenen
dc.programme.majorInformaatiotekniikkafi
dc.programme.mcodeTik-61fi
dc.rights.accesslevelopenAccess
dc.subject.keywordspeech recognitionen
dc.subject.keywordpuheentunnistusfi
dc.subject.keywordphonemic speech recognitionen
dc.subject.keywordfoneeminen puheentunnistusfi
dc.subject.keywordcontext-dependencyen
dc.subject.keywordkontekstiriippuvuusfi
dc.subject.keywordtriphonesen
dc.subject.keywordtrifonitfi
dc.subject.keywordtriphone clusteringen
dc.subject.keywordtrifinien klusterointifi
dc.subject.keywordhidden Markov modelsen
dc.subject.keywordkätketyt Markov-mallitfi
dc.subject.keywordHMMen
dc.titleTriphone clustering in Finnish continuous speech recognitionen
dc.titleTrifoniklusterointi suomenkielisessä jatkuvassa puheentunnistuksessafi
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotMaster's thesisen
dc.type.ontasotPro gradu -tutkielmafi
dc.type.publicationmasterThesis
local.aalto.digiauthyes
local.aalto.digifolderAalto_01855
local.aalto.idinssi18992
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
master_Ursin_Markku_2002.pdf
Size:
41.44 MB
Format:
Adobe Portable Document Format