3D geological modelling and pattern recognition – Case study Sakatti

No Thumbnail Available

URL

Journal Title

Journal ISSN

Volume Title

Insinööritieteiden korkeakoulu | Master's thesis

Date

2024-01-22

Department

Major/Subject

Geoinformatics

Mcode

Degree programme

Master's Programme in Geoinformatics (GIS)

Language

en

Pages

63 + 5

Series

Abstract

3D geological modelling has become a fundamental activity in geosciences and engineering to visualise and represent subsurface formations. A geological model is a computer representation of the geological subsurface for a specific area of interest that describes geological volumes such as rock types and structures. The boundaries between geological volumes are based largely on categorical, e.g. lithological logging data, and numerical borehole data, e.g. geochemical analysis data. The use of geochemical data can provide non-subjective information for modelling. Volume boundary definition is too often performed in single variable mode, even though modelling could be supported by multivariate data analysis. In this case study of the Sakatti deposit, the goal was to use multivariate statistical analysis to identify possible beneficial relationships between variables and in uncovering new patterns to support future 3D modelling. Such analyses are quantitative and independent approaches. This study was based on the Sakatti Geology and mineralization 3D Model Update 2020 and the data contained therein. Multi-variate statistical analysis of a 13-part subcompositional geochemical dataset (26445 samples) was performed. Multivariate analyses included hierarchical clustering, principal component analysis, and k-means clustering. The multivariate analysis methods used showed relatively good results and provided usable information that can be used in geological modelling. However, the results were not comprehensive due to the limited subcompositional data available. Hierarchical cluster analysis was an efficient technique to identify compositional dependencies between the variables used, and principal component analysis provided multi-element PC scores that could be used as an alternative source of information in assessing geochemical variations and defining volume boundaries. K-means clustering did not extract geologically significant groups, i.e. for the elements used, the geochemical contrast was not high enough to obtain enough distinct clusters. Further studies using principal component analysis and k-means clustering could be combined with careful consideration of which variables are needed for the classification and interpretation of the rock types.

Geologisesta 3D mallinnuksesta on tullut osa geologiaa ja insinööritieteitä, kun halutaan kuvata pinnanalaista kallioperää. Geologinen malli on tietyn alueen, tutkimuskohteen, tietokoneavusteinen esitys, joka kuvaa esiintymän kivilajien ja muiden piirteiden tilavuudellista jakautumista. Geologisten volyymien pinnat perustuvat suurelta osin kategoriseen aineistoon, kuten geologien määrittämään kivilajitietoon, ja numeeriseen kairasydänaineistoon, kuten geokemialliset analyysitulokset. Geokemiallisen aineiston käyttö antaa ei-subjektiivista tietoa mallinnusta varten. Geologisten volyymin rajapintojen mallintaminen tehdään usein yhtä muuttujaa hyödyntäen, vaikka mallinnusta voitaisiin tukea monimuuttuja-analyysistä saatavalla aineistolla. Tutkittaessa Sakatin esiintymää tavoitteena oli käyttää monimuuttuja analyysejä tunnistamaan muuttujien välisiä suhteita ja niiden muodostamia kuvioita, joita voisi hyödyntää seuraavissa vaiheissa 3D-mallinnusta. Tällaiset analyysit ovat kvantitatiivisia ja riippumattomia lähestymistapoja. Tutkimus perustui vuoden 2020 Sakatin geologiseen ja mineralisaatio 3D-malliin ja mallinnuksessa käytettyyn aineistoon. Monimuuttuja-analyyseissä käytettiin 13 alkuaineesta koostuvaa geokemian aineistoa (26445 näytettä). Tutkimuksessa hyödynnettiin hierarkkista klusterointia, pääkomponenttianalyysia ja k-means klusterointia. Käytetyt monimuuttuja-analyysimenetelmät osoittivat suhteellisen hyviä tuloksia ja tarjosivat käyttökelpoista tietoa, jota voidaan hyödyntää mallinnuksessa. Tulokset eivät kuitenkaan olleet kattavia käytössä olevien alkuaineiden vähäisyyden vuoksi. Hierarkkinen klusterianalyysi oli tehokas tunnistamaan käytettyjen alkuaineiden välisiä riippuvuussuhteita. Pääkomponenttianalyysistä saatuja uusia komponentteja, jotka koostuvat useasta muuttujasta, voidaan käyttää vaihtoehtoisena tietolähteenä geokemiallisen vaihtelun arvioinnissa ja geologisten volyymien määrittämisessä. K-means klusterointi ei erottanut geologisesti merkittäviä klustereita, sillä käytössä olevilla alkuaineilla menetelmä ei kyennyt luomaan selkeitä kivilajikohtaisia klustereita riittävän suuren geokemiallisen kontrastin puuttuessa. Pääkomponenttianalyysia ja k-means klusterointia voi hyödyntää jatkotutkimuksissa, mutta tällöin tulee tarkoin miettiä tutkimuskysymyksen kannalta, mitä muuttujia tarvitaan halutun tiedon luokitteluun ja tulkintaan.

Description

Supervisor

Rönnholm, Petri

Thesis advisor

Lamberg, Pertti

Keywords

multivariate analysis, compositional data analysis, principal component analysis, hierarchical clustering, k-means clustering

Other note

Citation