Methods and approaches to decomposing large scale social networks
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
School of Science |
Master's thesis
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
2010
Major/Subject
Tietojenkäsittelyteoria
Mcode
T-119
Degree programme
Tietotekniikan tutkinto-ohjelma
Language
en
Pages
vii + 46 s.
Series
Abstract
Decomposing large scale social networks is a hard problem. In this thesis we discuss and analyze the real-world problem of dividing large social graphs into smaller geographically separated pieces in a way that keeps the communication cost as small as possible from the point of view of storage, access, and replication expenses. An abstract model is formed to capture the essential properties of the communication cost problem. This model is then analyzed against other well-known problems, especially the graph partitioning problem and certain community finding problems. The problem is also solved in a way that combines graph partitioning with ideas from other areas. The end product is a practical, parallelizable algorithm suitable for decomposing large-scale social networks. Algorithm performance and behaviour is being analyzed by simulations done against different kinds of input in a test-bed. Properties of test data are also analyzed and a more in-depth analysis is done for corner-case situations where the algorithm fails to produce an optimal outcome.Valtavien sosiaalisten verkkojen paloittelu on vaikea ongelma. Tässä diplomityössä käydään läpi ja analysoidaan teollisuudesta kumpuavaa ongelmaa, jossa jaetaan sosiaalinen verkko pienempiin, maantieteellisesti irrallisiin osiin tavalla, joka huomioi tiedon varastoinnin, tiedon saatavuuden ja tiedon monistamisen mukaiset tarpeet ja kustannukset. Viestinnänkuluongelman ydinkohdat ja oleelliset ominaisuudet muotoillaan abstraktiin malliin, jota tutkitaan ja verrataan muihin tunnettuihin ongelmatyyppeihin. Erityisesti graafinjako-ongelmaan ja eräisiin yhteisönhakuongelmien muotoihin kiinnitetään huomiota. Mallista muotoillaan myös ratkaisualgoritmi yhdistellen menetelmiä graafinjakoalgoritmeista ja muista tutkimusalueista. Lopputuotteena syntyy käytännöllinen rinnakkaistuva algoritmi, joka soveltuu valtavien sosiaalisten verkostojen paloitteluun. Algoritmin käyttäytymistä analysoidaan simulaatioin käyttäen erilaisia syötteitä. Syötteiden edustavuutta tutkitaan, kuten myös rajatapauksia, joissa algoritmi ei tuota parasta mahdollista tulosta.Description
Supervisor
Niemelä, IlkkaThesis advisor
Alakuijala, JyrkiKeywords
Fiedler vector, Fiedler-vektori, social network, sosiaalinen verkko, graph partitioning, graafinjako, community finding, yhteisönhakuongelma, parallel computing, rinnakkaislaskenta