Developing a tool for information retrieval and research purposes utilizing BookSampo data

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2023-03-20
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
96+7
Series
Abstract
The goal of this thesis was to develop a new tool for information retrieval and research purposes based on the BookSampo data set. The current BookSampo portal uses Linked Data but offers limited search capabilities to the user that do not fully utilize the possibilities of Linked Data. The goal of the new portal was to offer the users both ways to visualize the data as well as a facet-based search, where the user could search and filter the result data set using different facets. The portal was developed using the Sampo Model based Sampo-UI framework that makes it possible to build new semantic portals without requiring a lot of actual programming work. Developing new semantic portals using the Sampo-UI framework is based on editing configuration files that define the wanted components as well as the data location using a SPARQL endpoint. The data used in the portal was the BookSampo dataset, the quality of which was also assessed during the development process. The final product is a Sampo-UI based semantic portal that uses unmodified BookSampo data, which was assessed to be of good quality considering the sheer volume of the data set. The portal offers the user five different perspectives that can be used for looking at and searching for data. The perspectives have their own visualizations developed for them based on the annotation coverage of the data that can be used for viewing the data in different formats, e.g., as a chart or on a map. Sampo-UI framework fit the purpose well and makes it possible to develop the portal easily further in the future. The BookSampo data has and will be receiving the needed fixes, after which it could be published to public use and then improved based on the feedback received from users.

Tämän diplomityön tavoitteena oli kehittää uusi tiedonhakuun ja tutkimukseen soveltuva työkalu, joka hyödyntää Kirjasampo-aineistoja. Kirjasammon nykyinen portaali käyttää linkitettyä dataa, mutta tarjoaa käyttäjille rajoitetut hakumahdollisuudet, jotka eivät täysin hyödynnä kaikkia linkitetyn datan mahdollisuuksia. Uuden portaalin tarkoituksena oli tarjota käyttäjille niin aineiston visualisointeja kuin myös fasettipohjaisen haun, jolla käyttäjä voi fasettien avulla hakea ja rajata tuloksena saatavaa dataa. Portaali kehitettiin käyttämällä Sampo-malliin perustuvaa Sampo-UI-ohjelmointikehystä, joka mahdollistaa semanttisten portaalien kehityksen ilman suurempaa varsinaista ohjelmointiurakkaa. Semanttisten portaalien kehittäminen Sampo-UI-ohjelmointikehyksellä perustuu konfiguraatiotiedostojen muokkaamiseen, missä määritetään niin portaalin halutut komponentit kuin myös datan sijainti SPARQL-rajapinnan avulla. Kehitettävän portaalin datana toimi Kirjasampo-aineisto, jonka laatua kartoitettiin ja arvioitiin kehityksen ohella. Lopputuloksena syntyi Sampo-UI-pohjainen portaali, joka käyttää muokkaamattomia Kirjasampo-aineistoja. Käytetyt aineistot osoittautuivat laadultaan tarkoitukseen hyviksi, kun otetaan huomioon datasetin suuruus. Portaali tarjoaa käyttäjille viisi eri perspektiiviä, joista tarkastella ja hakea dataa. Perspektiiveille on datan annotointien kattavuuden perusteella kehitetty omat visualisointinsa, joilla juuri kyseisen perspektiivin dataa voi tarkastella erilaisilla tavoilla kuten esimerkiksi kaaviomuodossa tai kartalla. Sampo-UI-ohjelmointikehys soveltui tehtävään hyvin ja mahdollistaa portaalin helpon jatkokehityksen tulevaisuudessa. Kirjasammon dataan on tehty ja tullaan tekemään tarvittavia korjauksia, joiden jälkeen portaali olisi mahdollista julkaista yleisölle ja kehittää käyttäjiltä saatavan palautteen perusteella.
Description
Supervisor
Hyvönen, Eero
Thesis advisor
Rantala, Heikki
Keywords
semantic web, linked data, digital libraries, bibliographical linked data, semantic portals
Other note
Citation