Perceptual and modeling studies on spatial sound

 |  Login

Show simple item record

dc.contributor Aalto-yliopisto fi
dc.contributor Aalto University en
dc.contributor.author Hirvonen, Toni
dc.date.accessioned 2012-02-24T08:47:53Z
dc.date.available 2012-02-24T08:47:53Z
dc.date.issued 2007-12-07
dc.identifier.isbn 978-951-22-9051-2
dc.identifier.issn 1456-6303
dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/2952
dc.description.abstract Humans have the ability to perceive various spatial auditory attributes, such as the localization and width of sound sources. The study of spatial hearing is important not only in terms of basic perceptual research, but also because ever more sophisticated audio reproduction algorithms and systems are introduced to consumers. From such systems, listeners regularly perceive complicated spatial auditory scenes involving several simultaneous sounds from different directions. These scenes can be thought as being complex ones, as opposed to perceiving a single, point-like source in an anechoic environment. The first part of this thesis investigates the perceptual issues related to such complex sound scenes via subjective listening tests. A single anechoic source results in localization cues that most listeners unambiguously interpret as indicating the actual direction of the sound. In the case of several interfering sound sources, the cues may vary greatly as a function of frequency. As illustrated by the results presented here, this is a common occurrence in modern multichannel reproduction systems. To gain further insight on this little-researched phenomenon, specific test cases where localization cues were manipulated as a function of frequency in the horizontal plane were investigated. The subjects reported the localization and width of the complex sounds, and these responses revealed several interesting phenomena. Most importantly, the listeners always perceived a horizontally wide sound source as being much narrower than it's physical width. Strong perceptual contrasts were also found to be significant. Another focus of this thesis is auditory modeling. The stimuli used in the previous experiments were simulated utilizing established auditory modeling techniques. The simulation results were not found to correspond entirely with the psychoacoustical results in all cases, prompting additional weighting of different frequencies in the modeling. This thesis also introduces a novel, general auditory model concept inspired by recent psychoacoustical results that partly contradict the previous modeling approaches. The model's capacity to account for common spatial hearing phenomena was examined. The initial simulation results validate the proposed concept. Quantitative comparisons with psychoacoustical results, including the data obtained from the listening tests performed in this thesis, are planned to be done in the future. en
dc.description.abstract Ihmisillä on kyky havainnoida äänen tilaominaisuuksia, kuten äänilähteen lokalisaatiota ja leveyttä. Tilaäänen tutkimus on tärkeää sekä havainnoinnin perustutkimuksen, että myös kuluttajille tarjottavien hienostuneiden äänentoistojärjestelmien yleistymisen kannalta. Tälläiset järjestelmät tuottavat kuulijoille äänimaisemia, jotka koostuvat useista samanaikaisista ja erisuuntaisista lähteistä. Tälläiset äänimaisemat voidaan ajatella monimutkaisiksi verrattuna yhteen pistemäiseen lähteeseen heijastuksettomassa tilassa. Tämän väitöskirjan ensimmäinen osa tutkii edellisten kaltaisiin monimutkaisiin äänimaisemiin liittyvää havainnointia subjektiivisilla kuuntelukokeilla. Yksittäinen äänilähde kaiuttomassa tilassa tuottaa lokalisaatiovihjeitä, jotka useimmat kuulijat assosioivat äänilähteen todelliseen suuntaan. Useiden lähteiden tapauksessa vihjeet taas voivat vahdella huomattavasti taajuuden funktiona. Kuten työn tuloksista nähdään, tälläiset tilanteet ovat yleisiä moderneissä äänentoistojärjestemissä. Ilmiön tutkimista varten konstruoitiin kuuntelukoenäytteitä, joissa horisontaalitason suuntavihjeitä manipuloitiin halutulla tavalla. Kuulijat ilmaisivat kompleksisten ääninaytteiden lokalisaation ja leveyden ja nämä tulokset paljastivat lukuisia mielenkiintoisia ilmiöitä. Kuulijat eivät koskaan havainneet fyysiesti leveän äänilähteen koko leveyttä, vaan arvoivat leveyden paljon vähäisemmäksi. Vahvojen perkeptuaalisten kontrastien vaikutus havaittiin myös merkittäväksi. Väitöskirjan toinen tutkimuskohde on auditorinen mallinus. Edellämainittujen kokeiden koenäytteet simuloitiin käyttäen tunnettuja mallinnustekniikoita. Simulaatiotulokset eivät täysin vastanneet kuuntelukokeen tuloksia kaikissa tapauksissa, josta johtuen ehdotettiin eri taajuuskaistojen lisäpainotusta mallinnuksessa. Väitöskirja esittelee myös uudenlaisen yleisen auditorisen mallin konseptin, johon viimeaikaiset, vanhojen mallinnustekniikoiden kanssa ristiriitaiset, neurofysiologiset tulokset ovat vaikuttaneet. Mallin kykyä selittää yksinkertaisia psykoakustisia ilmiöitä tutkittiin. Alustavat simulaatiotulokset validoivat ehdotetun konseptin. Kvantitatiivisten vertailujen teko psykoakustisten tulosten, mukaalukien tämän väitöskirjan näytteiden, kanssa on suunnitteilla tulevaisuudessa. fi
dc.format.extent 74, [70]
dc.format.mimetype application/pdf
dc.language.iso en en
dc.publisher Helsinki University of Technology en
dc.publisher Teknillinen korkeakoulu fi
dc.relation.ispartofseries Raportti / Teknillinen korkeakoulu, Akustiikan ja äänenkäsittelytekniikan laboratorio en
dc.relation.ispartofseries 83 en
dc.relation.haspart Pulkki, V. and Hirvonen, T., Localization of Virtual Sources in Multichannel Audio Reproduction, IEEE Transactions on Speech and Audio Processing, Vol. 13, No. 1, Jan. 2005, pp. 105-119. [article1.pdf] © 2005 IEEE. By permission.
dc.relation.haspart Hirvonen, T. and Pulkki, V., Center and Spatial Extent of Auditory Events as Caused by Multiple Sound Sources in Frequency-Dependent Directions, Acta Acustica united with Acustica, Vol. 92, No. 2, Jan. 2006, pp. 320-330. [article2.pdf] © 2006 S. Hirzel Verlag. By permission.
dc.relation.haspart Hirvonen, T., Segregation of Two Simultaneously Arriving Narrowband Noise Signals as a Function of Spatial and Frequency Separation, in Proceedings of the 8th International Conference on Digital Audio Effects (DAFx'05), Madrid, Spain, September 20-22, 2005. [article3.pdf] © 2005 by author.
dc.relation.haspart Hirvonen, T. and Pulkki, V., Perception and Analysis of Selected Auditory Events with Frequency-Dependent Directions, Journal of the Audio Engineering Society, Vol. 54, No. 9, Sep. 2006, pp. 803-814. [article4.pdf] © 2006 Audio Engineering Society. By permission.
dc.relation.haspart Hirvonen, T. and Pulkki, V., Interaural Coherence Estimation with Instantaneous ILD, in Proceedings of the 7th Nordic Signal Processing Symposium (NORSIG 2006), Reykjavik, Iceland, June 7-9, 2006, pp. 122-125. [article5.pdf] © 2006 IEEE. By permission.
dc.relation.haspart Hirvonen, T. and Pulkki, V., Predicting Binaural Masking Level Difference and Dichotic Pitch Using Instantaneous ILD Model, in Proceedings of the AES 30th International Conference on Intelligent Audio Environments, Saariselkä, Finland, March 15-17, 2007. [article6.pdf] © 2007 Audio Engineering Society. By permission.
dc.relation.haspart Pulkki, V. and Hirvonen, T., Computational Count-Comparison Models for ITD and ILD decoding, in Proceedings of the 19th International Congress on Acoustics (ICA 2007), Madrid, Spain, September 2-7, 2007. [article7.pdf] © 2007 by authors.
dc.subject.other Electrical engineering en
dc.title Perceptual and modeling studies on spatial sound en
dc.title Tutkimuksia tilaäänen havaitsemisesta ja mallinnuksesta fi
dc.type G5 Artikkeliväitöskirja fi
dc.description.version reviewed en
dc.contributor.department Department of Electrical and Communications Engineering en
dc.contributor.department Sähkö- ja tietoliikennetekniikan osasto fi
dc.subject.keyword spatial hearing en
dc.subject.keyword auditory modeling en
dc.subject.keyword virtual sources en
dc.subject.keyword tilaääni fi
dc.subject.keyword kuulon mallinnus fi
dc.subject.keyword virtuaalilähteet fi
dc.identifier.urn urn:nbn:fi:tkk-010808
dc.type.dcmitype text en
dc.type.ontasot Väitöskirja (artikkeli) fi
dc.type.ontasot Doctoral dissertation (article-based) en
dc.contributor.lab Laboratory of Acoustics and Audio Signal Processing en
dc.contributor.lab Akustiikan ja äänenkäsittelytekniikan laboratorio fi


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search archive


Advanced Search

article-iconSubmit a publication

Browse