Polytopal Big Data Statistics

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Perustieteiden korkeakoulu | Master's thesis

Date

2014

Department

Major/Subject

Matematiikka

Mcode

Mat-1

Degree programme

Language

en

Pages

v + 41 s.

Series

Abstract

Polytopes are geometric objects which arise in combinatorial problems and problems in optimization. Polytope theory can be used to construct new statistical techniques that help us analyze modern massive data sets. Big Data refers to methodologies that take into consideration the computational limitations of algorithms when dealing with large data sets. In the first part of this thesis the topic of extension complexities of polytopes is considered. There has been a lot of recent research on the matter and it is closely related to Big Data. A combinatorial proof on the extension complexity of the correlation polytope from a new paper is presented and a minor error is corrected. As a new result, the strength of the proof is displayed and a possible stronger result is discussed. In the second part of this thesis a result from a recent article on computational statistics is generalized. The original research displays the trade-offs between statistical and computational aspects of recovering a high-dimensional vector corrupted by Gaussian noise. The contribution of this thesis is a result that includes the possibility of correlation in the noise. Results on error bounds similar to those in the article are reported.

Polytoopit ovat geometrisia kappaleita matematiikkassa ja niitä esiintyy erityisesti kombinatoriikkaan liittyvissä ongelmissa. Tässä diplomityössä tutustutaan kahteen matemaattiseen ongelmaan, joissa molemmissa esiintyy polytooppeja. Kumpikin ongelma on läheisesti yhteydessä tilastotieteeseen ja isojen tietomäärien - Big Datan - analysointiin. Ensimmäinen ongelma liittyy polytooppien tehokkaaseen esittämistapaan. Tarkastelemme tuloksia viimeaikaisista tutkimuksista, jotka liittyvät polytooppien esittämiseen korkeampiulotteisissa Euklidisissa avaruuksissa. Tutkimme lähemmin korrelaatiopolytoopin esittämistä ja raportoimme tuloksia uudesta artikkelista. Lisäksi näytämme artikkelissa esitetyn menetelmän rajat, korjaamme siellä esiintyneen virheen ja keskustelemme mahdollisesta vahvemmasta tuloksesta. Toisessa ongelmassa keskitymme yleistämään tuloksen artikkelista vuodelta 2013. Yleistämme artikkelissa käytetyn tilastollisen mallin kattamaan korrelaation ja todistamme virherajoja. Näytämme, että artikkelissa esitetyt väitteet pitävät paikkansa myös yleisemmälle mallille.

Description

Supervisor

Engström, Alexander

Keywords

Big Data, polytoopit, tilastotiede, extension complexity, polytopes, statistics

Other note

Citation