Cluster Analysis of Forest Parcel Data

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Helsinki University of Technology | Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author

Date

1999

Major/Subject

Informaatiotekniikka

Mcode

Tik-115

Degree programme

Language

en

Pages

v + 67

Series

Abstract

Klusterianalyysi kuuluu tutkivan data-analyysin piiriin, jossa pyritään analysoimaan suuria tietoaineistoja automaattisten menetelmien avulla. Klusterianalyysi pyrkii selvittämään sisältääkö tutkittava tietoaineisto luonnollisia osajoukkoja. Mikäli tietoaineistossa on havaittavissa ryhmittymistä eli klusteroitumista, pyritään nämä osajoukot määrittämään erilaisten klusterointialgoritmien avulla. Korkeaulotteisen tietoaineiston ryhmittymisen tutkimiseen voidaan käyttää erilaisia projektiomenetelmiä, kuten pääkomponenttianalyysia, käyräviivaisten komponenttien analyysia tai itseorganisoivaa karttaa. Myös ryhmittymisestä kvantitatiivista tietoa antava algoritmi implementoitiin. Klustereiden määrittämiseen käytettiin tässä työssä ohjaamattomia menetelmiä, jotka eivät vaadi osajoukkojen lukumäärän kiinnittämistä etukäteen. Klusterointiin käytettiin hierarkkisia ja kohdefunktioon perustuvia menetelmiä. Klusteroinnin hyvyyttä pyrittiin arvioimaan käyttäen apuna taustamuuttujia ja teoreettista hyvyysmittaa. Tässä työssä tehtiin klusterianalyysi Suomessa hakkuukoneilla kaadetuille metsäpalstoille. Palstoista pyrittiin löytämään luonnollisia ryhmiä ja tutkimaan erottuisivatko nämä ryhmät palstakohtaisten taustatietojen avulla. Käsitellyt palstatiedot eivät muodostaneet selkeitä ryhmiä tehtyjen kokeiden perusteella. Tämä työ on tehty Informaatiotekniikan laboratoriossa Teknillisessä korkeakoulussa osana Oppivat ja älykkäät järjestelmät-teknologiaohjelmaa. Projektin ovat rahoittaneen Metsäteho Oy ja Teknologian kehittämiskeskus TEKES.

Description

Supervisor

Simula, Olli

Thesis advisor

Himberg, Johan

Keywords

cluster analysis, klusterianalyysi, unsupervised clustering, ohjaamaton klusterointi, explorative data-analysis, eksploratiivinen data-analyysi, self-organizing map, itseorganisoiva kartta, analysis of forest parcel data, palstatiedon analysointi, visualization of high-dimensional data, moniulotteisen datan visualisointi

Other note

Citation