Analysis, synthesis, and perception of spatial sound : binaural localization modeling and multichannel loudspeaker reproduction

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.authorMerimaa, Juha
dc.contributor.departmentDepartment of Electrical and Communications Engineeringen
dc.contributor.departmentSähkö- ja tietoliikennetekniikan osastofi
dc.contributor.labLaboratory of Acoustics and Audio Signal Processingen
dc.contributor.labAkustiikan ja äänenkäsittelytekniikan laboratoriofi
dc.date.accessioned2012-02-17T07:50:56Z
dc.date.available2012-02-17T07:50:56Z
dc.date.issued2006-08-11
dc.description.abstractIn everyday audio environments, sound from several sources arrives at a listening position both directly from the sources and as reflections from the acoustical environment. This thesis deals, within some limitations, with analysis of the resulting spatial sound field, reproduction of perceptually relevant features of the sound as measured in a chosen listening position, as well as with modeling of the related auditory localization. For the localization, the auditory system needs to independently determine the direction of each source, while ignoring the reflections and superposition effects of any possible concurrently arriving sound. A modeling mechanism with these desired properties is proposed. Interaural time difference (ITD) and interaural level difference (ILD) cues are only considered at time instants when only the direct sound of a single source has non-negligible energy within a critical band and, thus, when the evoked ITD and ILD represent the direction of that source. It is shown how to identify such time instants as a function of the interaural coherence (IC). The source directions suggested by the selected ITD and ILD cues are also shown to imply the results of a number of published psychophysical studies. Although the room reflections are usually suppressed in auditory localization, they contribute to the perception of the acoustical environment. The reviewed physical analysis techniques and psychoacoustical knowledge on spatial hearing are applied in development of the Spatial Impulse Response Rendering (SIRR) method. SIRR aims at recreating ITD, ILD, IC, and monaural localization cues by using a perceptually motivated analysis-synthesis method. The method is described in the context of multichannel loudspeaker reproduction of room responses with convolving reverberators. The analyzed quantities consist of the time- and frequency-dependent direction of arrival and diffuseness of sound. Based on the analysis data and a recorded omnidirectional signal, multichannel responses suitable for reproduction with any chosen surround loudspeaker setup are synthesized. In formal listening tests, it is shown that SIRR creates a more natural spatial impression than can be achieved with conventional techniques.en
dc.description.abstractTyypillisissä ääniympäristöissä usean äänilähteen ääni saapuu kuuntelupaikkaan sekä suoraan lähteistä että heijastuksina akustisesta ympäristöstä. Tämä väitöskirja käsittelee tuloksena olevan äänikentän analyysiä valitussa kuuntelupisteessä, ihmiskuulijan kannalta oleellisten tilaominaisuuksien toistoa ja auditorisen paikannuksen mallinnusta. Auditorisen paikannuksen tapauksessa kuulojärjestelmä pystyy yleensä toisistaan riippumatta määrittämään äänilähteiden suunnat jättäen huomiotta huoneheijastukset ja mahdollisen samanaikaisesti saapuvan äänen aiheuttamat summautumisilmiöt. Väitöskirjassa esitetään nämä ominaisuudet sisältävä suuntakuulon mallinnusmekanismi. Korvien väliset aikaero (ITD) ja tasoero (ILD) huomioidaan vain ajanhetkinä, jolloin ainoastaan yhden lähteen suoran äänen energia on merkityksellinen analysoidulla kriittisellä kaistalla, ja jolloin ITD ja ILD siis kuvaavat kyseisen äänilähteen suuntaa. Työssä osoitetaan, että tällaiset ajanhetket voidaan tunnistaa korvien välisen koherenssin (IC) avulla. Mallin avulla valittujen ITD- ja ILD-vihjeiden osoitetaan myös vastaavan useiden aikaisemmin julkaistujen psykofyysisten kokeiden tuloksia. Vaikka huoneheijastuksia ei yleensä huomioida auditorisessa paikannuksessa, ne vaikuttavat akustisen ympäristön kuulohavaintoon. Väitöskirjassa kuvattuja analyysimenetelmiä ja tietoa tilakuulon toiminnasta hyödynnetään Spatial Impulse Response Rendering (SIRR) -menetelmän kehittämisessä. SIRR pyrkii toistamaan ITD-, ILD-, IC- ja monauraaliset paikannusvihjeet psykoakustisesti motivoidun analyysi-synteesimenetelmän avulla. Menetelmä esitetään sovellettuna konvoluoivien kaikulaitteiden avulla tapahtuvan huonevasteiden monikanavakaiutintoistoon. Analysoidut suureet ovat äänen tulosuunta ja diffuusisuus ajan ja taajuuden funktiona. Analyysitulosten ja pallosuuntakuvioisen mikrofonisignaalin avulla syntetisoidaan millä tahansa valitulla monikanavakaiutinjärjestelmällä tapahtuvaan toistoon soveltuvat monikanavavasteet. Formaaleissa kuuntelukokeissa osoitetaan myös, että SIRR tuottaa luonnollisemman tilavaikutelman kuin perinteiset tekniikat.fi
dc.description.versionrevieweden
dc.format.extent175
dc.format.mimetypeapplication/pdf
dc.identifier.isbn951-22-8291-7
dc.identifier.issn1456-6303
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/2726
dc.identifier.urnurn:nbn:fi:tkk-007138
dc.language.isoenen
dc.programme.majorAcoustics/Audio technologyen
dc.programme.majorAkustiikka/audiotekniikkafi
dc.publisherHelsinki University of Technologyen
dc.publisherTeknillinen korkeakoulufi
dc.relation.ispartofseriesReport / Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processingen
dc.relation.ispartofseriesRaportti / Teknillinen korkeakoulu, Akustiikan ja äänenkäsittelytekniikan laboratoriofi
dc.relation.ispartofseries77en
dc.subject.keywordauditory localizationen
dc.subject.keywordbinaural modelsen
dc.subject.keywordprecedence effecten
dc.subject.keywordmultichannel reproductionen
dc.subject.keywordroom responsesen
dc.subject.keywordauditorinen paikannusfi
dc.subject.keywordbinauraaliset mallitfi
dc.subject.keywordpresedenssiefektifi
dc.subject.keywordmonikanavainen äänentoistofi
dc.subject.keywordhuonevasteetfi
dc.subject.otherElectrical engineeringen
dc.subject.otherPhysicsen
dc.titleAnalysis, synthesis, and perception of spatial sound : binaural localization modeling and multichannel loudspeaker reproductionen
dc.titleTilaäänen analyysi, synteesi ja havaitseminen – binauraalinen paikannusmallinnus ja monikanavakaiutintoistofi
dc.typeG4 Monografiaväitöskirjafi
dc.type.dcmitypetexten
dc.type.ontasotVäitöskirja (monografia)fi
dc.type.ontasotDoctoral dissertation (monograph)en
local.aalto.digiauthask
local.aalto.digifolderAalto_65234
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
isbn9512282917.pdf
Size:
4.91 MB
Format:
Adobe Portable Document Format