Puheen segmentointi ja klusterointi uutta puheentunnistimen arkkitehtuuria varten

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.advisor Laine, Unto K.; Prof.
dc.contributor.author Räsänen, Okko
dc.date.accessioned 2011-12-08T09:36:20Z
dc.date.available 2011-12-08T09:36:20Z
dc.date.issued 2007
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/1030
dc.description.abstract Perinteiset automaattiset puheentunnistusmenetelmät eivät pärjää suorituskyvyssä ihmisen puheenhavaintokyvylle. Voidaksemme kuroa tämän eron umpeen, on kehitettävä täysin uudentyyppisiä arkkitehtuureja puheentunnistusta varten. Puhetta ja kieltä itsestään ihmisen lailla oppiva järjestelmä on yksi tällainen vaihtoehto. Tämä diplomityö esittelee erään lähtökohdan oppivalle järjestelmälle, koostuen uudenlaisesta sokeasta puheen segmentointialgoritmista, segmenttien piirteistyksestä, sekä menetelmistä vähittäiselle puhedatan luokittelulle klusteroinnin avulla. Kaikki metodit arvioitiin kattavilla kokeilla, ja itse arviontimenetelmien luonteeseen kiinnitettiin huomiota. Segmentoinnissa saavutettiin alan kirjallisuuteen nähden hyvät tulokset. Järjestelmän mahdollisia jatkokehityssuuntauksia on hahmoteltu muunmuassa mahdollisten muistiarkkitehtuurien ja älykkään top-down palautteen osalta. fi
dc.description.abstract To reduce the gap between performance of traditional speech recognition systems and human speech recognition skills, a new architecture is required. A system that is capable of incremental learning offers one such solution to this problem. This thesis introduces a bottom-up approach for such a speech processing system, consisting of a novel blind speech segmentation algorithm, a segmental feature extraction methodology, and data classification by incremental clustering. All methods were evaluated by extensive experiments with a broad range of test material and the evaluation methodology was itself also scrutinized. The segmentation algorithm achieved above standard quality results compared to what is found in current literature regarding blind segmentation. Possibilities for follow-up research of memory structures and intelligent top-down feedback in speech processing are also outlined. en
dc.format.extent 95, [2]
dc.format.mimetype application/pdf
dc.language.iso en en
dc.publisher Helsinki University of Technology en
dc.publisher Teknillinen korkeakoulu fi
dc.subject.other Electrical engineering en
dc.title Puheen segmentointi ja klusterointi uutta puheentunnistimen arkkitehtuuria varten fi
dc.title Speech segmentation and clustering methods for a new speech recognition architecture en
dc.type G2 Pro gradu, diplomityö fi
dc.contributor.department Department of Electrical and Communications Engineering en
dc.contributor.department Sähkö- ja tietoliikennetekniikan osasto fi
dc.subject.keyword speech segmentation en
dc.subject.keyword speech clustering en
dc.subject.keyword data classification en
dc.subject.keyword feature extraction en
dc.subject.keyword speech perception en
dc.subject.keyword pattern recognition en
dc.subject.keyword bottom-up processing en
dc.subject.keyword top-down processing en
dc.subject.keyword puheen segmentointi fi
dc.subject.keyword puheen klusterointi fi
dc.subject.keyword äänimateriaalin luokittelu fi
dc.subject.keyword piirteistys fi
dc.subject.keyword hahmontunnistus fi
dc.subject.keyword puheen havaitseminen fi
dc.subject.keyword bottom-up prosessointi fi
dc.subject.keyword top-down prosessointi fi
dc.identifier.urn urn:nbn:fi:tkk-010123
dc.type.dcmitype text en
dc.programme.major Acoustics and Audio Signal Processing en
dc.programme.major Akustiikka ja äänenkäsittelytekniikka fi
dc.programme.mcode S-89
dc.type.ontasot Diplomityö fi
dc.type.ontasot Master's thesis en
dc.contributor.supervisor Laine, Unto K.; Prof.
dc.programme Elektroniikan ja sähkötekniikan koulutusohjelma fi
dc.contributor.lab Laboratory of Acoustics and Audio Signal Processing en
dc.contributor.lab Akustiikan ja äänenkäsittelytekniikan laboratorio fi
dc.location P1 fi


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse

My Account