Analysis of voice activity detection and discontinuous transmission methods in 3G MGW

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2006

Major/Subject

Akustiikka ja äänenkäsittelytekniikka

Mcode

S-89

Degree programme

Language

en

Pages

ix + 92 s. + liitt. 18

Series

Abstract

Jotta VoIP-verkoissa voitaisiin vähentää lähetettävien pakettien määrää, verkkoon tuleva akustinen signaali määritetään puheaktiivisuuden mukaan joko aktiiviseksi tai epäaktiiviseksi. Aktiivinen signaali on tärkeää informaation välityksessä, kun taas epäaktiivinen signaali on kohinaa tai hiljaisuutta, joka voidaan olla lähettämättä verkkoon, jotta lähetykseen vaadittavaa kaistanleveyttä voitaisiin vähentää. Signaalin määritystä puheeksi tai kohinaksi kutsutaan puheaktiivisuuden tunnistamiseksi ja lähetyksen ajoittaista katkaisemista epäjatkuvaksi lähetykseksi. Tämän työn tarkoituksena on arvioida kolmea algoritmia, joita voidaan käyttää puheaktiivisuuden tunnistukseen ja keinotekoisen taustakohinan tuottamiseen vastaanottimessa. Tärkein päämäärä on löytää algoritmi, joka kykenee toimimaan laadukkaan puhekoodeista riippumattoman puheaktiivisuuden-tunnistusalgoritmin pohjana. Tavoitteena on arvioida algoritmeja analysoimalla saavutettua puheenlaatua ja säästöjä kaistanleveydessä. Suurimmat ongelmat epäjatkuvassa lähetyksessä ovat toisinaan tapahtuva puheen määritys kohinaksi ja taustakohinan tason virheellinen arviointi. Tutkittuja algoritmeja analysoidaan käyttämällä hyväksi sekä objektiivisia että subjektiivisia menetelmiä, joiden avulla pyritään saamaan selville, kuinka kuuntelijat reagoivat algoritmeissa mahdollisesti esiintyviin puutteisiin. Lisäksi työssä tarkastellaan, kuinka tarkan arvion subjektiivisesta äänenlaadusta ihmisen kuuloa jäljittelevä psykoakustinen malli kykenee antamaan kohinaisilla näytteillä. Objektiivisten mittausten ja suoritetun ACR-kuuntelutestin tulokset osoittivat, että käytettäessä laadukasta algoritmia kuuntelijat eivät kyenneet havaitsemaan eroa epäjatkuvan ja jatkuvan lähetyksen välillä. Lisäksi kävi ilmi, että aika ajoin kuuntelijat suosivat epäjatkuvaa lähetystä, mikä oikeuttaa keinotekoisen kohinan käyttöön vastaanottimessa. Tutkimuksemme mukaan tutkittujen algoritmien tehokkuudet kaistanleveyden säästössä eivät olleet erityisen hyviä tietyillä taustakohinoilla, mutta säästöihin ei silti kannata pyrkiä puheenlaadun kustannuksella. Tuloksiemme perusteella objektiiviset menetelmät tuottavat epätarkkoja ennusteita subjektiivisesta puheenlaadusta, kun niitä käytetään kohinaisiin puhenäytteisiin.

Description

Supervisor

Alku, Paavo

Thesis advisor

Himanen. Teemu

Keywords

acoustic signal analysis, äänisignaalin analysointi, discontinuous transmission, epäjatkuva lähetys, voice activity detection, puheaktiivisuuden tunnistus, silence suppression, hiljaisuuden poistaminen, subjective listening quality, subjektiivinen puheen laatu, objective listening quality, objektiivinen puheenlaatu

Other note

Citation