Aalto Data Repository: Research data management, sharing and publishing in the world of data intensive science

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2016-01-18
Department
Major/Subject
Ohjelmistotekniikka
Mcode
T3001
Degree programme
Tietotekniikan koulutusohjelma
Language
en
Pages
8 + 77
Series
Abstract
All fields of science are becoming data intensive. The decrease of computing price and the evolution of data collection methods have created novel research opportunities. This new data intensive paradigm puts a new kind of premium to research data, since it more than ever before forms the lifeblood of research. As a result the demand for publishing research data has increased from both funding bodies and the research community. These factors combined present novel challenges for research data management and publication. This thesis sheds light on the current status of research data management, sharing and publishing. The primary contribution of the thesis is the examination of existing technical solution to these research data challenges. In addition requirements for successful research data solutions are proposed. The secondary contribution of the thesis is the research of the cultural atmosphere surrounding research data management, sharing and publishing. Technical solutions for the three research data challenges were found mainly from within the open source community. Solutions like Dataverse, Invenio, Hydra Project and CKAN offer platforms for sharing and publishing data. Solutions like iRODS can be used to manage research data. These solutions serve their purpose, but there is no good integrated solution that would solve all three research data challenges. The lack of holistic solutions combined with the lack of culture and knowledge about research data management result in limited research data publishing and sharing. Future work should, in addition to building an integrated solution for sharing, publishing and managing research data, aim to make the culture around research data management more open.

Tutkimustieto on nykypäivänä keskeinen osa kaikkea tutkimusta. Tieteellisen laskennan hinnan lasku ja tutkimustiedon keräämismenetelmien kehitys ovat johtaneet uusiin tutkimusmenetelmiin. Tutkimustietokeskeinen suuntaus asettaa tutkimustiedon tärkeämpään asemaan kuin koskaan aiemmin, sillä ilman laadukasta tutkimustietoa parhaat tulokset jäävät saavuttamatta. Tämän johdosta tutkijayhteisö ja tutkimuksen rahoittajatahot ovat alkaneet vaatia tutkimustiedon julkaisemista. Näiden kehitysten johdosta tutkimsutiedon hallintaan ja julkaisuun täytyy kehittää uusia ratkaisuja. Tämä opinnäytetyö valottaa tutkimustiedon julkaisemisen, jakamisen ja hallinnan nykytilannetta. Opinnäytteen pääpanos on näitä tutkimustiedon haasteita ratkovien teknisten toteutusten tutkimus, minkä lisäksi työssä ehdotetaan onnistuneen tutkimustietoratkaisun vaatimuksia. Opinnäytetyö tutkii myös tutkimustiedon julkaisemisen ja hallinnan kulttuuria ja käytäntöjä. Opinnäytetyössä esitellään pääasiassa avoimen lähdekoodin ratkaisuja tutkimustiedon haasteisiin. Dataversen, Invenion, Hydra-projektin ja CKANin kaltaiset järjestelmät ovat alustoja tutkimustiedon julkaisemiseen. iRODSin kaltaiset sovellukset soveltuvat tutkimustiedon hallintaan. Nämä ratkaisut toimivat, mutta yhdistettyä ratkaisua tutkimustiedon hallintaan, julkaisuun ja jakamiseen ei ole. Kokonaisratkaisujen sekä tutkimustiedon hallintaan ja jakamiseen liittyvän kulttuurin puutteesta seuraa, että tutkimustietoa jaetaan vähän verrattuna sen määrään. Jatkotutkimuksen tulisi keskittyä tutkimustiedon hallinnan, jakamisen ja julkaisemisen yhdistävän palvelun lisäksi etsimään ratkaisuja aiheeseen liittyvän kulttuurin ja tietotaidon parantamiseen.
Description
Supervisor
Heljanko, Keijo
Thesis advisor
Heljanko, Keijo
Keywords
research data, repository, open data, open publishing, data policy, data lifecycle
Citation