Title: | Development and Optimization of ETL
Processes for Blockchain Data Analystics ETL-prosessien kehittäminen ja optimointi Blockchain Data Analyticsille |
Author(s): | García De Viedma Pérez, Lucas |
Date: | 2023-08-21 |
Language: | en |
Pages: | 52 + 13 |
Major/Subject: | Data Science |
Degree programme: | Master's Programme in ICT Innovation |
Supervising professor(s): | Pollari-Malmi, Kerttu |
Thesis advisor(s): | Áviles, Rafael |
Keywords: | Blockchain, Data engineering, Data processing, View materialization, Data engineering |
Location: |
Archive
OEV |
|
|
Abstract:Cosmos-lohkoketjujen ekosysteemi on toisiinsa liitettyjen lohkoketjujen hajautettu verkko, joka on suunniteltu yhteentoimivaksi ja skaalautuvaksi. Tämän opinnäytetyön tavoitteena on optimoida lohkoketjujen data-analytiikan tietosuunnitteluprosessi Cosmos-ekosysteemissä, ja siinä keskitytään erityisesti Osmosikseen, joka on Cosmos-verkkoon rakennettu hajautettu pörssi. Binary Builders AG:n tytäryhtiön Numia Datan hyödyntämä nykyinen datan sisäänotto- ja tallennusprosessi aiheuttaa haasteita epäolennaisen tiedon suodattamisessa, suurten tietomäärien käsittelyssä ja monimutkaisten kyselyjen kehittämisessä. Tämän opinnäytetyön ensisijaisena tavoitteena on parantaa datan suunnitteluprosessia tuottamalla tehokkaaseen data-analytiikkaan sopivampia tietorakenteita. Lähestymistapa koostuu kolmesta päävaiheesta. Lähestymistapa koostuu kolmesta päävaiheesta. Ensinnäkin Cosmos- ja Osmosis-viestit analysoidaan perusteellisesti, jotta voidaan tunnistaa analytiikan kannalta olennaiset tietokentät. Tähän analyysiin kuuluu lohkoketjun tuottaman raakadatan tutkiminen ja tutkimustyökalujen ja dokumentaation hyödyntäminen. Toiseksi määritettyjen tietokenttien perusteella määritellään uudet tietorakenteet tietojen tallentamiseksi ja tehokkaan data-analytiikan helpottamiseksi. Nämä rakenteet suunnitellaan vastaamaan Numia Datan BigQuery-tietovaraston ominaisuuksia. Toiseksi määritettyjen tietokenttien perusteella määritellään uudet tietorakenteet tietojen tallentamiseksi ja tehokkaan data-analytiikan helpottamiseksi. Nämä rakenteet suunnitellaan vastaamaan Numia Datan BigQuery-tietovaraston ominaisuuksia. Lopuksi kehitetään putkilinjoja, joiden avulla nämä uudet tietorakenteet voidaan luoda ja varmistaa uusien tietojen kustannustehokas ja tehokas syöttö. Näiden putkistojen kehittämisessä hyödynnetään Numia Datan nykyisiä ETL-työkaluja, DBT:tä ja BigQueryä. Tätä lähestymistapaa noudattamalla tämän opinnäytetyön tavoitteena on virtaviivaistaa tietosuunnitteluprosessia ja mahdollistaa arvokkaiden oivallusten poimiminen lohkoketjujen tiedoista tehokkaammin ja automaattisemmin. |
|
|
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Page content by: Aalto University Learning Centre | Privacy policy of the service | About this site