Simulaatiotutkimus hajontamatriiseihin pohjautuvista ICA-estimaateista

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Ask about the availability of the thesis by sending email to the Aalto University Learning Centre oppimiskeskus@aalto.fi
Date
2015-06-09
Department
Major/Subject
Systeemi- ja operaatiotutkimuksen pääaine
Mcode
F3008
Degree programme
Teknillisen fysiikan ja matematiikan koulutusohjelma
Language
en
Pages
85+10
Series
Abstract
Independent component analysis is a relatively new computational technique for finding hidden components in a multivariate data or signals. In recent years ICA has become more known method as computation capacity has grown and more information has become digitalized, making ICA computations possible also for real time situations. In this thesis, we conduct a simulation study to compare different scatter matrix based independent component analysis estimates. In simulations we use Minimum Distance-index to measure the performance of these estimates. The purpose of this study is to find out if there is any benefit from using robust scatter matrix estimates. We also test using Minimum Distance-index how different scatter matrix based ICA-estimates behave when our data is not pure and has outliers. We also introduce several ICA applications with the most known of them being the cocktail party problem. In cocktail party problem the speech signals are separated from sample signals recorded in a room where several people are speaking simultaneously. Our results show that the outliers can have a very strong effect on the estimates depending on the original data distributions. However we did not observe much difference between estimates based on different scatter matrices. The difference was observable only in certain situations where the estimates were very close to the original data and based on our results we would recommend to always test several scatter matrix combinations and choose the suitable combination for each data.

Riippumattomien komponenttien analyysi (ICA) on suhteellisen uusi laskennallinen tekniikka, jonka tarkoituksena on löytää moniulotteisessa aineistossa tai signaaleissa piilevät riippumattomat komponentit. ICA on tullut entistä relevantimmaksi aineistojen ja tietokantojen muuttuessa digitaalisiksi sekä kasvavan laskentatehon mahdollistamien laskujen myötä. Tämä työ on simulaatiotutkimus, jossa tutkitaan eri hajontamatriisien toimintaa ICA estimaattien laskemisessa. Estimointien vertailuun käytetään Minimum Distance-indeksiä, jolla voi verrata estimaattien sopimista alkuperäiseen aineistoon. Yhtenä työn lähtökohtana on tutkia onko robustimpien hajontamatriisien käytöstä hyötyä perinteisiin hajontaestimaatteihin verrattuna. Lisäksi testaamme, mikä vaikutus estimaattien toimintaan poikkeavilla havainnoilla on. Työssä esitellään myös muutamia ICA sovelluksia, niistä tunnetuimpana cocktail-juhla-ongelma. Cocktail-juhla-ongelmassa yritetään erottaa alkuperäiset äänisignaalit toisistaan tilanteessa, jossa huoneessa on useampi samanaikainen puhuja ja äänisignaalit sekoittuvat toisiinsa. Simulaation tulokset näyttävät, että poikkeavilla havainnoilla voi olla hyvinkin suuri vaikutus estimaattien toimivuuteen riippuen alkuperäisestä datasta. Eri hajontamatriiseihin perustuvien estimaattien välillä emme kuitenkaan löytäneet suuria eroja lukuunottamatta tiettyjä tilanteita, joissa estimaattien toimivuus oli todella hyvä. Tulostemme perusteella suosittelemme aina valitsemaan dataan parhaiten sopivan hajontamatriisi yhdistelmän.
Description
Supervisor
Ilmonen, Pauliina
Thesis advisor
Ilmonen, Pauliina
Keywords
independent component analysis, ICA, principal component analysis, minimum distance-index, simulation, Mfunctionals
Other note
Citation