Building Ontology and Data Infrastructure for Semantic Web Applications

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
School of Science | Doctoral thesis (article-based) | Defence date: 2023-04-28
Date
2023
Major/Subject
Mcode
Degree programme
Language
en
Pages
66 + app. 86
Series
Aalto University publication series DOCTORAL THESES, 28/2023
Abstract
Semantic Web and Linked Data are paradigms aiming for more efficient and more sophisticated knowledge management through machine-understandable semantics and functional links between entities and relations present in data. Central to this idea is the concept of ontologies: knowledge structures explicitly describing the concepts of a certain domain in a machine-processable way. This dissertation explores ways of developing ontologies from existing thesauri which have been used to produce high-quality metadata for a very long time and how those ontologies can be used in information retrieval. The main research methods used are design science and action research. Extensive application to practice has been used to demonstrate the viability of the proposed solutions. The key results in the dissertation comprise of methods for creating and maintaining a linked open cloud of ontologies and then utilizing those ontologies in linked data publication and for improving semantic search. The primary focus is on data that has been annotated using legacy thesauri that then have been converted into ontologies and the benefits afforded by that. The semantic search techniques employ document expansion using the relations between concepts provided by the ontologies and improvements to information retrieval results are demonstrated. Primary domains explored are related to cultural heritage but the dissertation includes a case study where the methods are implemented for juridical data, as well. The research pioneered in this dissertation has been widely adopted into use in Finnish libraries, archives, museums, and public administration through the national Finto ontology service maintained by the National Library of Finland.

Semanttinen web ja linkitetty data tähtäävät tehokkaampaan ja älykkäämpään tiedonhallintaan koneymmärrettävän semantiikan sekä datassa esiintyvien resurssien ja niiden välisiä suhteita merkitsevien toiminnallisten linkkien avulla. Keskeisessä osassa tässä lähestymistavassa ovat ontologiat: tietorakennelmat, jotka kuvaavat eksplisiittisesti jonkin tietyn aihealueen käsitteet koneellisesti hyödynnettävässä muodossa. Tämä väitöskirja tutkii tapoja ontologioiden kehittämiseen perustuen olemassa oleviin sanastoihin, joita on jo pitkään käytetty laadukkaan metatiedon tuottamiseen sekä siihen miten luotuja ontologioita voidaan käyttää tiedonhaussa. Keskeisimmät käytetyt tutkimusmenetelmät ovat suunnittelutiede ja toimintatutkimus. Ehdotettujen ratkaisujen toteuttamiskelpoisuus on todennettu soveltamalla niitä laajasti käytäntöön. Väitöskirjan avaintulokset muodostuvat metodeista linkitetyn ontologiapilven luomiseen ja ylläpitoon sekä siitä miten pilven ontologioita voidaan hyödyntää linkitetyn datan julkaisussa ja parantamaan semanttista tiedonhakua. Keskeisimpänä mielenkiinnon kohteena on data, joka on kuvailtu käyttäen perinteisiä tesauruksia, jotka on sittemmin muutettu ontologioiksi ja mitä hyötyjä näin voidaan saavuttaa. Semanttisen haun menetelmät hyödyntävät dokumentin laajennusta perustuen ontologioista saatuihin käsitteiden välisiin suhteisiin ja saavutettu parannus tiedonhaun näkökulmasta osoitetaan. Keskeisimmät aihealueet liittyvät kulttuuriperintöön, mutta väitöskirja sisältää myös tapaustutkimuksen, jossa esiteltyjä menetelmiä sovelletaan lakitietoon. Tässä väitöskirjassa kehitettyjä tutkimustuloksia on otettu laajasti käyttöön suomalaisissa kirjastoissa, arkistoissa, museoissa ja julkishallinnossa Kansalliskirjaston ylläpitämän kansallisen sanasto- ja ontologiapalvelu Finton kautta.
Description
Supervising professor
Hyvönen, Eero, Prof., Aalto University, Department of Computer Science, Finland
Thesis advisor
Tuominen, Jouni, Dr., Aalto University, Finland
Keywords
linked data, semantic web, ontologies, document expansion, semantic portals, SKOS, linkitetty data, semanttinen web, ontologiat, haunlaajennos, semanttiset portaalit
Other note
Parts
  • [Publication 1]: Matias Frosterus and Eero Hyvönen. Bridging the Search Gap between the Web of Pages and Web of Data by Combining Ontological Document Expansion with Text Search. In Proceedings of the International Conferences on Digital Libraries and the Semantic Web 2009 (ICSD2009), Università di Trento, Trento, Italy, September 2009
  • [Publication 2]: Matias Frosterus, Eero Hyvönen, and Joonas Laitio. DataFinland—A Semantic Portal for Open and Linked Datasets. In The Semantic Web: Research and Applications 8th Extended Semantic Web Conference, ESWC 2011, Heraklion, Crete, Greece, May 29 – June 2, 2011. Proceedings, Part I, Grigoris Antoniou, Marko Grobelnik, Elena Simperl, Bijan Parsia, Dimitris Plexousakis, Pieter de Leenheer, and Jeff Z. Pan (editors), Springer, Berlin, Heidelberg, pp. 243–254, June 2011.
    DOI: 10.1007/978-3-642-21064-8_17 View at publisher
  • [Publication 3]: Matias Frosterus, Jouni Tuominen, Sini Pessala, and Eero Hyvönen. Linked Open Ontology Cloud–Managing a System of Interlinked Crossdomain Light-weight Ontologies. International Journal of Metadata, Semantics and Ontologies, vol. 10, no. 3, pp. 189–201, December 2015.
    DOI: 10.1504/IJMSO.2015.073879 View at publisher
  • [Publication 4]: Matias Frosterus, Jouni Tuominen, and Eero Hyvönen. Facilitating Reuse of Legal Data in Applications—Finnish Law as a Linked Open Data Service. In Volume 271 of Legal Knowledge and Information Systems: JURIX 2014: The Twenty-Seventh Annual Conference, Kraków, Poland, Rinke Hoekstra (editor), IOS Press, pp. 115–124, December 2014.
    DOI: 10.3233/978-1-61499-468-8-115 View at publisher
  • [Publication 5]: Tuukka Ruotsalo and Matias Frosterus. Diversifying Semantic Entity Search: Independent Component Analysis Approach. International Journal of Semantic Computing, vol. 7, no. 4, pp. 407–426, ISSN 1793-7108, June 2014. DOI 10.1142/S1793351X13400138
Citation