Title: | Methods for the application of glottal inverse filtering to statistical parametric speech synthesis Glottaalisen käänteissuodatuksen käyttö tilastollisessa parametrisessa puhesynteesissä |
Author(s): | Airaksinen, Manu |
Date: | 2018 |
Language: | en |
Pages: | 102 + app. 84 |
Department: | Signaalinkäsittelyn ja akustiikan laitos Department of Signal Processing and Acoustics |
ISBN: | 978-952-60-8028-4 (electronic) 978-952-60-8027-7 (printed) |
Series: | Aalto University publication series DOCTORAL DISSERTATIONS, 109/2018 |
ISSN: | 1799-4942 (electronic) 1799-4934 (printed) 1799-4934 (ISSN-L) |
Supervising professor(s): | Alku, Paavo, Academy Prof., Aalto University, Department of Signal Processing and Acoustics, Finland |
Subject: | Electrical engineering, Linguistics |
Keywords: | glottal inverse filtering, speech analysis, speech synthesis, glottaalinen käänteissuodatus, puheanalyysi, puhesynteesi |
|
|
Abstract:Puhe on olennainen osa ihmistenvälistä informaation siirtoa. Vaikka kielellistä sisältöä pidetään yleisesti puheen tärkeimpänä ominaisuutena, puhesignaali sisältää myös runsaasti muuta informaatiota kuten prosodisia vihjeitä, jotka muokkaavat siirrettävän informaation merkitystä. Tämä informaatio tuotetaan suurilta osin näennäisjaksollisella glottisherätteellä, joka on puheen herätteenä toimiva akustinen virtaussignaali. Säätämällä äänihuulten alapuolista painetta ja äänihuulten kireyttä ihmiset muuttavat glottisherätteen ominaisuuksia viestittääkseen esimerkiksi tunnetilaa. |
|
Parts:[Publication 1]: Manu Airaksinen, Tuomo Raitio, Brad Story, and Paavo Alku. Quasi closed phase glottal inverse filtering analysis with weighted linear prediction. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Volume 22, issue 3, pages 596–607, March/April 2014. DOI: 10.1109/TASLP.2013.2294585 View at Publisher [Publication 2]: Manu Airaksinen, Tom Bäckström, and Paavo Alku. Quadratic programming approach to glottal inverse filtering by joint norm-1 and norm-2 optimization. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Volume 25, issue 5, pages 929–939, March/April 2017. DOI: 10.1109/TASLP.2016.2620718 View at Publisher [Publication 3]: Dhananjaya Gowda, Manu Airaksinen, and Paavo Alku. Forward–backward quasi-closed phase weighted linear prediction analysis of speech for accurate formant detection and estimation. The Journal of the Acoustical Society of America, Volume 142, issue 3, pages 1542–1553, September 2017. DOI: 10.1121/1.5001512 View at Publisher [Publication 4]: Manu Airaksinen, Tom Bäckström, and Paavo Alku. Automatic estimation of the lip radiation effect in glottal inverse filtering. In Proceedings of Interspeech, Singapore, pages 398–402, September 2014.[Publication 5]: Manu Airaksinen, Tuomo Raitio, and Paavo Alku. Noise robust estimation of the voice source using a deep neural network. In Proceedings of 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane, Australia, pages 5137–5141, March 2015. DOI: 10.1109/ICASSP.2015.7178950 View at Publisher [Publication 6]: Manu Airaksinen, Bajibabu Bollepalli, Jouni Pohjalainen, and Paavo Alku. Glottal vocoding with frequency-warped time-weighted linear prediction. IEEE Signal Processing Letters, Volume 24, issue 4, pages 445–450, March/April 2017. DOI: 10.1109/LSP.2017.2665687 View at Publisher [Publication 7]: Manu Airaksinen, Lauri Juvela, Bajibabu Bollepalli, Junichi Yamagishi, and Paavo Alku. A comparison between STRAIGHT, glottal, and sinusoidal vocoding in statistical parametric speech synthesis. Accepted for publication in IEEE/ACM Transactions on Audio, Speech, and Language Processing, May 2018. DOI: 10.1109/TASLP.2018.2835720 View at Publisher |
|
|
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Page content by: Aalto University Learning Centre | Privacy policy of the service | About this site