Polytopal Big Data Statistics

 dc.contributor Aalto-yliopisto fi dc.contributor Aalto University en dc.contributor.author Nummenpalo, Jerri dc.date.accessioned 2015-07-01T08:15:12Z dc.date.available 2015-07-01T08:15:12Z dc.date.issued 2014 dc.identifier.uri https://aaltodoc.aalto.fi/handle/123456789/17068 dc.description.abstract Polytopes are geometric objects which arise in combinatorial problems and problems in optimization. Polytope theory can be used to construct new statistical techniques that help us analyze modern massive data sets. Big Data refers to methodologies that take into consideration the computational limitations of algorithms when dealing with large data sets. In the first part of this thesis the topic of extension complexities of polytopes is considered. There has been a lot of recent research on the matter and it is closely related to Big Data. A combinatorial proof on the extension complexity of the correlation polytope from a new paper is presented and a minor error is corrected. As a new result, the strength of the proof is displayed and a possible stronger result is discussed. In the second part of this thesis a result from a recent article on computational statistics is generalized. The original research displays the trade-offs between statistical and computational aspects of recovering a high-dimensional vector corrupted by Gaussian noise. The contribution of this thesis is a result that includes the possibility of correlation in the noise. Results on error bounds similar to those in the article are reported. en dc.description.abstract Polytoopit ovat geometrisia kappaleita matematiikkassa ja niitä esiintyy erityisesti kombinatoriikkaan liittyvissä ongelmissa. Tässä diplomityössä tutustutaan kahteen matemaattiseen ongelmaan, joissa molemmissa esiintyy polytooppeja. Kumpikin ongelma on läheisesti yhteydessä tilastotieteeseen ja isojen tietomäärien - Big Datan - analysointiin. Ensimmäinen ongelma liittyy polytooppien tehokkaaseen esittämistapaan. Tarkastelemme tuloksia viimeaikaisista tutkimuksista, jotka liittyvät polytooppien esittämiseen korkeampiulotteisissa Euklidisissa avaruuksissa. Tutkimme lähemmin korrelaatiopolytoopin esittämistä ja raportoimme tuloksia uudesta artikkelista. Lisäksi näytämme artikkelissa esitetyn menetelmän rajat, korjaamme siellä esiintyneen virheen ja keskustelemme mahdollisesta vahvemmasta tuloksesta. Toisessa ongelmassa keskitymme yleistämään tuloksen artikkelista vuodelta 2013. Yleistämme artikkelissa käytetyn tilastollisen mallin kattamaan korrelaation ja todistamme virherajoja. Näytämme, että artikkelissa esitetyt väitteet pitävät paikkansa myös yleisemmälle mallille. fi dc.format.extent v + 41 s. dc.language.iso en en dc.title Polytopal Big Data Statistics en dc.title Polytoopit tilastotieteessä ja Big Datassa fi dc.type G2 Pro gradu, diplomityö fi dc.contributor.school Perustieteiden korkeakoulu fi dc.contributor.school Perustieteiden korkeakoulu fi dc.subject.keyword Big Data fi dc.subject.keyword polytoopit fi dc.subject.keyword tilastotiede fi dc.subject.keyword extension complexity en dc.subject.keyword polytopes en dc.subject.keyword statistics en dc.identifier.urn URN:NBN:fi:aalto-201507013710 dc.type.dcmitype text en dc.programme.major Matematiikka fi dc.programme.mcode Mat-1 dc.type.ontasot Diplomityö fi dc.type.ontasot Master's thesis en dc.contributor.supervisor Engström, Alexander local.aalto.openaccess no local.aalto.digifolder Aalto_90002 dc.rights.accesslevel closedAccess local.aalto.idinssi 49344 dc.type.publication masterThesis dc.type.okm G2 Pro gradu, diplomityö
﻿

Files in this item

Files Size Format View

There are no open access files associated with this item.