Representing, Using, and Maintaining Military Historical Linked Data on the Semantic Web
Journal Title
Journal ISSN
Volume Title
School of Science |
Doctoral thesis (article-based)
| Defence date: 2020-05-15
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Degree programme
90 + app. 124
Aalto University publication series DOCTORAL DISSERTATIONS, 71/2020
The Second World War is the largest global tragedy in human history. It is extensively documented in historical sources, but this information is scattered in various organizations and countries, written in multiple languages, and represented in heterogeneous formats. Semantic Web technologies provide solutions for combining heterogeneous distributed historical information. By combining information from distributed sources it is possible to get a deeper understanding about the history than by studying the sources individually. This thesis explores the use of Semantic Web technologies for representing and modeling heterogeneous military historical information as Linked Data, with a focus on depicting the history of Finland in the Second World War. Harmonization and integration of military historical data from distributed sources are studied, while also investigating how to search, browse, analyze, and visualize the resulting Linked Data on web-based user interfaces. Maintenance of the highly interlinked set of graphs exposes new challenges and a solution to tackle them is presented. These topics are studied in the context of building the WarSampo information system. Linked Data and the event-based CIDOC Conceptual Reference Model are used together in WarSampo to achieve the interoperability of heterogeneous military historical datasets. Events are used as the glue which combines together information from various source datasets. The event-based modeling enables depicting the national military history narrative as data, which can be further enriched with the events of individual military units and soldiers. This idea is demonstrated in the WarSampo semantic portal, which consists of nine different perspectives on the data integrated from distributed sources. Each perspective provides a customized user interface for a certain part of the WarSampo knowledge graph, like war events, persons, wartime photographs, and places. The knowledge graph is published as open data and is a part of the global Linked Open Data Cloud. The WarSampo portal at is a popular service for citizens to study the wars, and to find out what happened to their relatives. It has been used by more than 660 000 end users, equivalent to more than 10% of the population of Finland. The proposed methods and data models are useful beyond the geographical and temporal scopes of this research. The aspiration behind the WarSampo project is that by making military historical data more accessible, our understanding about the reality of the war will improve, which also promotes peace in the future.Toinen maailmansota on ihmiskunnan historian suurin globaali tragedia. Se on kattavasti dokumentoitu historiallisissa lähteissä, mutta tämä tieto on hajallaan monissa eri maissa ja niiden sisällä useissa erillisissä organisaatioissa, kirjoitettuna useilla kielillä ja vaihtelevissa formaateissa. Semanttisen webin teknologiat mahdollistavat epäyhtenäisen historiallisen tiedon yhdistämisen useista erillisistä lähteistä. Tiedon yhdistäminen useista lähteistä auttaa ymmärtämään historiaa syvällisemmin kuin tarkastelemalla yksittäisiä lähteitä. Tämä väitöskirja tutkii semanttisen webin teknologioiden käyttöä sotahistorian esittämiseen ja mallintamiseen linkitettynä datana. Keskiössä on Suomen historian esittäminen toisen maailmansodan ajalta sekä sotahistoriallisen tiedon harmonisointi ja yhdistäminen erillisistä lähteistä. Tutkimuksessa selvitetään, miten syntyvää linkitettyä dataa voidaan hakea, selata, analysoida ja visualisoida web-pohjaisissa käyttöliittymissä ja miten voimakkaasti yhteenlinkittyneitä linkitetyn datan graafeja voidaan ylläpitää. Tätä tutkimusta on tehty osana Sotasampo-tietojärjestelmän kehitystä. Sotasammossa hyödynnetään Linkitettyä Dataa ja tapahtumapohjaista CIDOC Conceptual Reference Model -tietomallia epäyhtenäisten sotahistoriallisten aineistojen yhteentoimivuuden saavuttamiseksi. Tapahtumat toimivat liimana, joka yhdistää tietoa useista lähdeaineistoista. Tapahtumapohjainen mallintaminen mahdollistaa kansallisen sotahistoriallisen narratiivin esittämisen datana, jota voidaan rikastaa yksittäisiin joukko-osastoihin ja henkilöihin liittyvillä tapahtumilla. Tätä ideaa demonstroidaan Sotasampo-portaalissa, joka sisältää yhdeksän erilaista perspektiiviä eri lähteistä yhdistettyyn tietämysgraafiin. Jokainen perspektiivi tarjoaa käyttöliittymän, joka on räätälöity tiettyyn osaan Sotasammon tietämysgraafista, kuten sodanajan tapahtumiin, henkilöihin, sodanajan valokuviin, tai paikkoihin. Sotasammon tietämysgraafi on julkaistu avoimena datana ja se muodostaa osan globaalista linkitetyn avoimen datan LOD Cloud -datapilvestä. Avoin Sotasampo-portaali on suosittu palvelu kansalaisille sota-aineistojen tutkimiseen ja sukulaistensa sotataipaleen selvittämiseen. Sillä on ollut yli 660 000 käyttäjää, joka vastaa yli kymmenesosaa suomalaisista. Esitetyt menetelmät ja tietomallit ovat käyttökelpoisia myös tätä tutkimusta laajemmalla maantieteellisellä ja ajallisella rajauksella. Sotasampo-projektin taustalla on ajatus siitä, että sotahistoriallisen tiedon tuominen helpommin saataville lisää ymmärrystä sodasta ja osaltaan edistää rauhaa tulevaisuudessa.Description
The public defense on 15th May 2020 at 12:00 will be organized via remote technology.
Zoom Quick Guide:
Electronic online display version of the doctoral thesis is available by email by request from
Supervising professor
Hyvönen, Eero, Prof., Aalto University, Department of Computer Science, Finland and University of Helsinki, FinlandThesis advisor
Mäkelä, Eetu, Prof., Aalto University, Department of Computer Science, Finland and University of Helsinki, FinlandTuominen, Jouni, Dr., Aalto University, Department of Computer Science, Finland and University of Helsinki, Finland
semantic web, linked data, interoperability, semantic reconciliation, semantic disambiguation, information systems, military history, digital humanities, semanttinen web, linkitetty data, yhteentoimivuus, semanttinen yhteensovittaminen, semanttinen yksikäsitteistäminen, tietojärjestelmät, sotahistoria, digitaaliset ihmistieteet
Other note
- [Publication 1]: Mikko Koho, Esko Ikkala, Petri Leskinen, Minna Tamper, Jouni Tuominen, and Eero Hyvonen. WarSampo Knowledge Graph: Finland in the Second World War as Linked Open Data. Submitted to Semantic Web – Interoperability, Usability, Applicability: Special Issue on Semantic Web for Cultural Heritage, October 2019. Preprint version is available at:
[Publication 2]: Petri Leskinen, Mikko Koho, Erkki Heino, Minna Tamper, Esko Ikkala, Jouni Tuominen, Eetu Makela, and Eero Hyvonen. Modeling and Using an Actor Ontology of Second World War Military Units and Personnel. In The Semantic Web – ISWC 2017: 16th International Semantic Web Conference, Vienna, Austria, October 21–25, 2017, Proceedings, Part II, Claudia d’Amato, Miriam Fernandez, Valentina Tamma, Freddy Lecue, Philippe Cudre-Mauroux, Juan Sequeda, Christoph Lange, and Jeff Heflin (editors), Information Systems and Applications, incl. Internet/Web, and HCI, volume 10588, pages 280–296, ISBN 9783319682037, Springer, Cham, October 2017.
DOI: 10.1007/978-3-319-68204-4_27 View at publisher
[Publication 3]: Mikko Koho, Lia Gasbarra, Jouni Tuominen, Heikki Rantala, Ilkka Jokipii, and Eero Hyvonen. AMMO Ontology of Finnish Historical Occupations. In Proceedings of the First International Workshop on Open Data and Ontologies for Cultural Heritage (ODOCH 2019), Rome, Italy, June 3, 2019, Antonella Poggi (editor), CEUR Workshop Proceedings, volume 2375, pages 91–96, ISSN 16130073, online:, June 2019.
Full text in Acris/Aaltodoc:
[Publication 4]: Eero Hyvonen, Erkki Heino, Petri Leskinen, Esko Ikkala, Mikko Koho, Minna Tamper, Jouni Tuominen, and Eetu Makela. WarSampo Data Service and Semantic Portal for Publishing Linked Open Data about the Second World War History. In The Semantic Web: Latest Advances and New Domains: 13th International Conference, ESWC 2016, Heraklion, Crete, Greece, May 29 – June 2, 2016, Proceedings, Harald Sack, Eva Blomqvist, Mathieu d’Aquin, Chiara Ghidini, Simone Paolo Ponzetto, and Christoph Lange (editors), Lecture Notes in Computer Science, volume 9678, pages 758–773, ISBN 9783319341286, Springer, Cham, May–June 2016.
DOI: 10.1007/978-3-319-34129-3_46 View at publisher
[Publication 5]: Esko Ikkala, Mikko Koho, Erkki Heino, Petri Leskinen, Eero Hyvonen, and Tomi Ahoranta. Prosopographical Views to Finnish WW2 Casualties Through Cemeteries and Linked Open Data. In Proceedings of the Workshop on Humanities in the Semantic Web (WHiSe II), Vienna, Austria,October 22, 2017, Alessandro Adamou, Enrico Daga, and Leif Isaksen (editors), CEUR Workshop Proceedings, volume 2014, pages 45–56, ISSN 16130073, online:, October 2017.
Full text in Acris/Aaltodoc:
- [Publication 6]: Mikko Koho, Esko Ikkala, and Eero Hyvonen. Reassembling the Lives of Finnish Prisoners of the Second World War on the Semantic Web. Accepted for publication in Proceedings of the Third Conference on Biographical Data in the Digital Age (BD 2019), Varna, Bulgaria, CEUR Workshop Proceedings, 9 pages, in press, September 2019.
[Publication 7]: Mikko Koho, Erkki Heino, and Eero Hyvonen. SPARQL Faceter—Client-side Faceted Search Based on SPARQL. In Joint Proceedings of the 4th International Workshop on Linked Media and the 3rd Developers Hackshop co-located with the 13th Extended Semantic Web Conference ESWC 2016, Heraklion, Crete, Greece, May 30, 2016, Raphael Troncy, Ruben Verborgh, Lyndon Nixon, Thomas Kurz, Kai Schlegel, and Miel Vander Sande (editors), CEUR Workshop Proceedings, volume 1615, ISSN 16130073, online:, May 2016.
Full text in Acris/Aaltodoc:
[Publication 8]: Mikko Koho, Eero Hyvonen, Erkki Heino, Jouni Tuominen, Petri Leskinen, and Eetu Makela. Linked Death — Representing, Publishing, and Using SecondWorldWar Death Records as Linked Open Data. In The Semantic Web: ESWC 2017 Satellite Events: ESWC 2017 Satellite Events, Portorož, Slovenia, May 28 – June 1, 2017, Revised Selected Papers, Eva Blomqvist, Katja Hose, Heiko Paulheim, Agnieszka Ławrynowicz, Fabio Ciravegna, and Olaf Hartig (editors), Lecture Notes in Computer Science, volume 10577, pages 369–383, ISBN 9783319704067, Springer, Cham, May–June 2017.
Full text in Acris/Aaltodoc: 10.1007/978-3-319-70407-4_45 View at publisher
[Publication 9]: Mikko Koho, Esko Ikkala, Erkki Heino, and Eero Hyvonen. Maintaining a Linked Data Cloud and Data Service for Second World War History. In Digital Heritage. Progress in Cultural Heritage: Documentation, Preservation, and Protection: 7th International Conference, EuroMed 2018, Nicosia, Cyprus, October 29–November 3, 2018, Proceedings, Part I, Marinos Ioannides, Eleanor Fink, Rafaella Brumana, Petros Patias, Anastasios Doulamis, Joao Martins, and Manolis Wallace (editors), Information Systems and Applications, incl. Internet/Web, and HCI, volume 11196, pages 138–149, ISBN 9783030017613, Springer, Cham, October–November 2018.
DOI: 10.1007/978-3-030-01762-0 View at publisher