Cluster Analysis of Forest Parcel Data
No Thumbnail Available
URL
Journal Title
Journal ISSN
Volume Title
Helsinki University of Technology |
Diplomityö
Checking the digitized thesis and permission for publishing
Instructions for the author
Instructions for the author
Authors
Date
1999
Major/Subject
Informaatiotekniikka
Mcode
Tik-115
Degree programme
Language
en
Pages
v + 67
Series
Abstract
Klusterianalyysi kuuluu tutkivan data-analyysin piiriin, jossa pyritään analysoimaan suuria tietoaineistoja automaattisten menetelmien avulla. Klusterianalyysi pyrkii selvittämään sisältääkö tutkittava tietoaineisto luonnollisia osajoukkoja. Mikäli tietoaineistossa on havaittavissa ryhmittymistä eli klusteroitumista, pyritään nämä osajoukot määrittämään erilaisten klusterointialgoritmien avulla. Korkeaulotteisen tietoaineiston ryhmittymisen tutkimiseen voidaan käyttää erilaisia projektiomenetelmiä, kuten pääkomponenttianalyysia, käyräviivaisten komponenttien analyysia tai itseorganisoivaa karttaa. Myös ryhmittymisestä kvantitatiivista tietoa antava algoritmi implementoitiin. Klustereiden määrittämiseen käytettiin tässä työssä ohjaamattomia menetelmiä, jotka eivät vaadi osajoukkojen lukumäärän kiinnittämistä etukäteen. Klusterointiin käytettiin hierarkkisia ja kohdefunktioon perustuvia menetelmiä. Klusteroinnin hyvyyttä pyrittiin arvioimaan käyttäen apuna taustamuuttujia ja teoreettista hyvyysmittaa. Tässä työssä tehtiin klusterianalyysi Suomessa hakkuukoneilla kaadetuille metsäpalstoille. Palstoista pyrittiin löytämään luonnollisia ryhmiä ja tutkimaan erottuisivatko nämä ryhmät palstakohtaisten taustatietojen avulla. Käsitellyt palstatiedot eivät muodostaneet selkeitä ryhmiä tehtyjen kokeiden perusteella. Tämä työ on tehty Informaatiotekniikan laboratoriossa Teknillisessä korkeakoulussa osana Oppivat ja älykkäät järjestelmät-teknologiaohjelmaa. Projektin ovat rahoittaneen Metsäteho Oy ja Teknologian kehittämiskeskus TEKES.Description
Supervisor
Simula, OlliThesis advisor
Himberg, JohanKeywords
cluster analysis, klusterianalyysi, unsupervised clustering, ohjaamaton klusterointi, explorative data-analysis, eksploratiivinen data-analyysi, self-organizing map, itseorganisoiva kartta, analysis of forest parcel data, palstatiedon analysointi, visualization of high-dimensional data, moniulotteisen datan visualisointi