Methods and approaches to decomposing large scale social networks

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

2010

Major/Subject

Tietojenkäsittelyteoria

Mcode

T-119

Degree programme

Tietotekniikan tutkinto-ohjelma

Language

en

Pages

vii + 46 s.

Series

Abstract

Decomposing large scale social networks is a hard problem. In this thesis we discuss and analyze the real-world problem of dividing large social graphs into smaller geographically separated pieces in a way that keeps the communication cost as small as possible from the point of view of storage, access, and replication expenses. An abstract model is formed to capture the essential properties of the communication cost problem. This model is then analyzed against other well-known problems, especially the graph partitioning problem and certain community finding problems. The problem is also solved in a way that combines graph partitioning with ideas from other areas. The end product is a practical, parallelizable algorithm suitable for decomposing large-scale social networks. Algorithm performance and behaviour is being analyzed by simulations done against different kinds of input in a test-bed. Properties of test data are also analyzed and a more in-depth analysis is done for corner-case situations where the algorithm fails to produce an optimal outcome.

Valtavien sosiaalisten verkkojen paloittelu on vaikea ongelma. Tässä diplomityössä käydään läpi ja analysoidaan teollisuudesta kumpuavaa ongelmaa, jossa jaetaan sosiaalinen verkko pienempiin, maantieteellisesti irrallisiin osiin tavalla, joka huomioi tiedon varastoinnin, tiedon saatavuuden ja tiedon monistamisen mukaiset tarpeet ja kustannukset. Viestinnänkuluongelman ydinkohdat ja oleelliset ominaisuudet muotoillaan abstraktiin malliin, jota tutkitaan ja verrataan muihin tunnettuihin ongelmatyyppeihin. Erityisesti graafinjako-ongelmaan ja eräisiin yhteisönhakuongelmien muotoihin kiinnitetään huomiota. Mallista muotoillaan myös ratkaisualgoritmi yhdistellen menetelmiä graafinjakoalgoritmeista ja muista tutkimusalueista. Lopputuotteena syntyy käytännöllinen rinnakkaistuva algoritmi, joka soveltuu valtavien sosiaalisten verkostojen paloitteluun. Algoritmin käyttäytymistä analysoidaan simulaatioin käyttäen erilaisia syötteitä. Syötteiden edustavuutta tutkitaan, kuten myös rajatapauksia, joissa algoritmi ei tuota parasta mahdollista tulosta.

Description

Supervisor

Niemelä, Ilkka

Thesis advisor

Alakuijala, Jyrki

Keywords

Fiedler vector, Fiedler-vektori, social network, sosiaalinen verkko, graph partitioning, graafinjako, community finding, yhteisönhakuongelma, parallel computing, rinnakkaislaskenta

Other note

Citation