Ääntöväylän liikeradan arviointi käyttäen häviöllistä Kelly-Lochbaum mallia

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorRäsänen, Okko
dc.contributor.authorRasilo, Heikki
dc.contributor.schoolElektroniikan, tietoliikenteen ja automaation tiedekuntafi
dc.contributor.supervisorLaine, Unto K.
dc.date.accessioned2012-03-12T07:09:27Z
dc.date.available2012-03-12T07:09:27Z
dc.date.issued2010
dc.description.abstractOn esitetty teorioita, joiden mukaan puheen ymmärtämistä helpottaa aikaisempi kokemus puheen tuottamisesta. Muuntamalla akustinen puhesignaali hypoteesiksi puhujan artikulaatioeleistä voidaan saavuttaa puhujariippumattomampi ja äänteitä paremmin erotteleva kuvaus puheesta. Tämä työ esittelee metodin, jolla ääntöväylän liikeratoja voidaan arvioida suoraan puhesignaaleista. Tässä työssä luodaan Kelly-Lochbaum-tyyppinen ääntöväylämalli käyttäen apuna puheentuottamisen teoriaa. Malli on varustettu huulisäteilyllä ja säädettävällä huulten pituudella. Mallia käyttäen luodaan hakutaulukko, joka kuvaa vastaavuuksia puheen hetkellisten spektriominaisuuksien ja artikulatoristen muotojen välillä. Hakutaulukkoa voidaan käyttää mappaukseen akustisen ja artikulatorisen avaruuden välillä. Luotua mallia käytetään ääntöväylän liikeratojen arvioinnissa jatkuvan puheen aikana. Liikeradat löydetään käyttämällä yksinkertaista optimointialgoritmia, joka estimoi liikeradan minimoimalla artikulaatioon kuluvaa energiaa.fi
dc.description.abstractThere are theories that during speech perception, the understanding of speech is boosted by the knowledge of the articulatory gestures based on former speech production experience. By transforming an acoustic speech signal into a hypothesis about the articulatory gestures of the speaker, it is possible to obtain a more accurate, speaker-independent description of speech. This thesis introduces a method of estimating vocal tract trajectories from speech signals. Using the theory of speech production, a lossy Kelly-Lochbaum vocal tract model equipped with lip radiation impedance and variable lip rounding length is created. A lookup table consisting of correspondences between spectral qualities of instantaneous speech signals and articulatory shapes is created using this model. The lookup table can be used to perform acoustic-to-articulatory mapping. The obtained model is used in estimation of vocal tract shape trajectories in continuous speech. Smooth and minimum energy trajectories are found by using a simple optimization algorithm.en
dc.format.extent[6] + 73
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/3260
dc.identifier.urnURN:NBN:fi:aalto-201203131491
dc.language.isoenen
dc.locationP1fi
dc.programme.majorAkustiikka ja äänenkäsittelytekniikkafi
dc.programme.mcodeS-89
dc.publisherAalto Universityen
dc.publisherAalto-yliopistofi
dc.rights.accesslevelopenAccess
dc.subject.keywordspeechen
dc.subject.keywordvocal tracten
dc.subject.keywordacousticsen
dc.subject.keywordtrajectory estimationen
dc.subject.keywordspeech productionen
dc.subject.keywordspeech perceptionen
dc.subject.keywordacoustic-to-articulatory mappingen
dc.subject.keywordpuhefi
dc.subject.keywordääntöväyläfi
dc.subject.keywordakustiikkafi
dc.subject.keywordliikeradan estimointifi
dc.subject.keywordpuheen tuottofi
dc.subject.keywordpuheen havaitseminenfi
dc.subject.keywordartikulatorinen karttafi
dc.titleÄäntöväylän liikeradan arviointi käyttäen häviöllistä Kelly-Lochbaum malliafi
dc.titleEstimation of vocal tract shape trajectory using lossy Kelly-Lochbaum modelen
dc.typeG2 Pro gradu, diplomityöfi
dc.type.dcmitypetexten
dc.type.okmG2 Pro gradu, diplomityö
dc.type.ontasotDiplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.publicationmasterThesis
local.aalto.digifolderAalto_91492
local.aalto.idinssi40138
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
urn100242.pdf
Size:
1.62 MB
Format:
Adobe Portable Document Format