Building Ontology and Data Infrastructure for Semantic Web Applications
Semantic Web and Linked Data are paradigms aiming for more efficient and more sophisticated knowledge management through machine-understandable semantics and functional links between entities and relations present in data. Central to this idea is the concept of ontologies: knowledge structures explicitly describing the concepts of a certain domain in a machine-processable way. This dissertation explores ways of developing ontologies from existing thesauri which have been used to produce high-quality metadata for a very long time and how those ontologies can be used in information retrieval. The main research methods used are design science and action research. Extensive application to practice has been used to demonstrate the viability of the proposed solutions. The key results in the dissertation comprise of methods for creating and maintaining a linked open cloud of ontologies and then utilizing those ontologies in linked data publication and for improving semantic search. The primary focus is on data that has been annotated using legacy thesauri that then have been converted into ontologies and the benefits afforded by that. The semantic search techniques employ document expansion using the relations between concepts provided by the ontologies and improvements to information retrieval results are demonstrated. Primary domains explored are related to cultural heritage but the dissertation includes a case study where the methods are implemented for juridical data, as well. The research pioneered in this dissertation has been widely adopted into use in Finnish libraries, archives, museums, and public administration through the national Finto ontology service maintained by the National Library of Finland.Semanttinen web ja linkitetty data tähtäävät tehokkaampaan ja älykkäämpään tiedonhallintaan koneymmärrettävän semantiikan sekä datassa esiintyvien resurssien ja niiden välisiä suhteita merkitsevien toiminnallisten linkkien avulla. Keskeisessä osassa tässä lähestymistavassa ovat ontologiat: tietorakennelmat, jotka kuvaavat eksplisiittisesti jonkin tietyn aihealueen käsitteet koneellisesti hyödynnettävässä muodossa. Tämä väitöskirja tutkii tapoja ontologioiden kehittämiseen perustuen olemassa oleviin sanastoihin, joita on jo pitkään käytetty laadukkaan metatiedon tuottamiseen sekä siihen miten luotuja ontologioita voidaan käyttää tiedonhaussa. Keskeisimmät käytetyt tutkimusmenetelmät ovat suunnittelutiede ja toimintatutkimus. Ehdotettujen ratkaisujen toteuttamiskelpoisuus on todennettu soveltamalla niitä laajasti käytäntöön. Väitöskirjan avaintulokset muodostuvat metodeista linkitetyn ontologiapilven luomiseen ja ylläpitoon sekä siitä miten pilven ontologioita voidaan hyödyntää linkitetyn datan julkaisussa ja parantamaan semanttista tiedonhakua. Keskeisimpänä mielenkiinnon kohteena on data, joka on kuvailtu käyttäen perinteisiä tesauruksia, jotka on sittemmin muutettu ontologioiksi ja mitä hyötyjä näin voidaan saavuttaa. Semanttisen haun menetelmät hyödyntävät dokumentin laajennusta perustuen ontologioista saatuihin käsitteiden välisiin suhteisiin ja saavutettu parannus tiedonhaun näkökulmasta osoitetaan. Keskeisimmät aihealueet liittyvät kulttuuriperintöön, mutta väitöskirja sisältää myös tapaustutkimuksen, jossa esiteltyjä menetelmiä sovelletaan lakitietoon. Tässä väitöskirjassa kehitettyjä tutkimustuloksia on otettu laajasti käyttöön suomalaisissa kirjastoissa, arkistoissa, museoissa ja julkishallinnossa Kansalliskirjaston ylläpitämän kansallisen sanasto- ja ontologiapalvelu Finton kautta.Description
Hyvönen, Eero, Prof., Aalto University, Department of Computer Science, FinlandThesis advisor
linked data, semantic web, ontologies, document expansion, semantic portals, SKOS, linkitetty data, semanttinen web, ontologiat, haunlaajennos, semanttiset portaalit
