Polytopal Big Data Statistics

No Thumbnail Available
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2014
Department
Major/Subject
Matematiikka
Mcode
Mat-1
Degree programme
Language
en
Pages
v + 41 s.
Series
Abstract
Polytopes are geometric objects which arise in combinatorial problems and problems in optimization. Polytope theory can be used to construct new statistical techniques that help us analyze modern massive data sets. Big Data refers to methodologies that take into consideration the computational limitations of algorithms when dealing with large data sets. In the first part of this thesis the topic of extension complexities of polytopes is considered. There has been a lot of recent research on the matter and it is closely related to Big Data. A combinatorial proof on the extension complexity of the correlation polytope from a new paper is presented and a minor error is corrected. As a new result, the strength of the proof is displayed and a possible stronger result is discussed. In the second part of this thesis a result from a recent article on computational statistics is generalized. The original research displays the trade-offs between statistical and computational aspects of recovering a high-dimensional vector corrupted by Gaussian noise. The contribution of this thesis is a result that includes the possibility of correlation in the noise. Results on error bounds similar to those in the article are reported.

Polytoopit ovat geometrisia kappaleita matematiikkassa ja niitä esiintyy erityisesti kombinatoriikkaan liittyvissä ongelmissa. Tässä diplomityössä tutustutaan kahteen matemaattiseen ongelmaan, joissa molemmissa esiintyy polytooppeja. Kumpikin ongelma on läheisesti yhteydessä tilastotieteeseen ja isojen tietomäärien - Big Datan - analysointiin. Ensimmäinen ongelma liittyy polytooppien tehokkaaseen esittämistapaan. Tarkastelemme tuloksia viimeaikaisista tutkimuksista, jotka liittyvät polytooppien esittämiseen korkeampiulotteisissa Euklidisissa avaruuksissa. Tutkimme lähemmin korrelaatiopolytoopin esittämistä ja raportoimme tuloksia uudesta artikkelista. Lisäksi näytämme artikkelissa esitetyn menetelmän rajat, korjaamme siellä esiintyneen virheen ja keskustelemme mahdollisesta vahvemmasta tuloksesta. Toisessa ongelmassa keskitymme yleistämään tuloksen artikkelista vuodelta 2013. Yleistämme artikkelissa käytetyn tilastollisen mallin kattamaan korrelaation ja todistamme virherajoja. Näytämme, että artikkelissa esitetyt väitteet pitävät paikkansa myös yleisemmälle mallille.
Description
Supervisor
Engström, Alexander
Keywords
Big Data, polytoopit, tilastotiede, extension complexity, polytopes, statistics
Other note
Citation