Modeling and Using Biographical Linked Data for Prosopographical Data Analysis

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Doctoral thesis (article-based) | Defence date: 2024-10-11

Date

2024

Major/Subject

Mcode

Degree programme

Language

en

Pages

91 + app. 163

Series

Aalto University publication series DOCTORAL THESES, 183/2024

Abstract

Biographical data is used for identifying people, groups, and organizations and for conveying information about them. Biographical data describes life stories of people with the aim of getting a better understanding of their personality, actions, and interperson relations. The underlying texts can also be used for data analysis and distant reading once the documents are provided in a machine-readable format. Prosopographical analysis delves into the life stories of individuals within a defined group to identify shared characteristics and patterns. This dissertation presents and utilizes a comprehensive framework for managing and analyzing biographical data in Digital Humanities research. It includes data models, methods, and applications that enrich biographical content with links and reasoning to enhance the findability, accessibility, interoperability, and re-usability following the FAIR principles. Furthermore, the framework includes versatile tools for both individual biographical research and prosopographical research on groups of people. Linked Data together with event-based data model schemas are used in the published datasets to achieve the interoperability of heterogeneous data regarding historical people. Events are used as the glue combining information from various sources. The event-based modeling enables depicting historical narratives as data, which can be further enriched with the events of individual people and organizations. The research included in this dissertation follows the principles of the design science and action research. The research has been carried out in multiple research projects concentrating on biographical data: WarSampo (2015–), BiographySampo (2018–2021), Norssi High School Alumni (2017), AcademySampo (2019–2021), LetterSampo (2020–2022), and ParliamentSampo (2021–). The data publications and services, online portals, and published articles with analysis are represented as the results of the work accomplished for this thesis. Besides, this thesis tackles the practices of creating, modeling, and publishing Linked Data, as well as analyzing this biographical and prosopographical data by the means of network and data analysis.

Biografisia tietoja käytetään ihmisten, ryhmien ja organisaatioiden tunnistamiseen sekä välittämään tietoja heistä. Biografinen tieto voi kuvata ihmisten elämäntarinoita, joita hyödyntämällä saadaan selkeä käsitys heidän persoonallisuudestaan, toiminnasta sekä yhteyksistä toisiin ihmisiin. Koneluettavassa muodossa julkaistua tietoa voidaan analysoida sekä käyttää etälukemiseen (distant reading). Prosopografinen analyysi tutkii yksittäisten henkilöiden muodostamia ryhmiä ja pyrkii tunnistamaan ryhmien yhteisiä piirteitä ja malleja. Tässä väitöskirjassa perehdytään digitaalisen humanistisen tutkimuksen menetelmiin ja hyödynnetään niitä elämäkertadatan hallinnointiin ja analysointiin. Tutkimus sisältää tietomalleja, menetelmiä ja sovelluksia, jotka rikastuttavat elämäkerta-aineistoa linkityksellä ja päättelyllä parantaen näin datan löydettävyyttä (findability), saavutettavuutta (accessibility), yhteentoimivuutta (interoperability) ja uudelleen käytettävyyttä (re-usability) FAIR-periaatteiden mukaisesti. Lisäksi esitellään uusia menetelmiä sekä yksittäisten elämäkertojen tutkimiseen että prosopografiseen analyysiin henkilöryhmistä. Julkaistuissa aineistoissa heterogeenisten historiallisiin henkilöihin liittyvien tietojen yhteentoimivuus on saavutettu hyödyntämällä linkitettyä dataa yhdessä tapahtumapohjaisten tietomallien kanssa. Tapahtumia käytetään "liimana" yhdistämään tietoa eri lähteistä. Tapahtumapohjainen mallinnus mahdollistaa historiallisten narratiivien esittämisen datana, jota voidaan edelleen rikastuttaa yksittäisten henkilöiden ja henkilöryhmien metadatalla. Tässä väitöskirjassa esitelty tutkimus noudattaa suunnittelutieteen (design science) ja toimintatutkimuksen (action science) periaatteita. Tutkimustyö on toteutettu useissa elämäkertadataan keskittyvissä projekteissa kuten Sotasampo (2015–), Biografiasampo (2018–2021), Norssit semantisessa webissä (2017), Akatemiasampo (2019–2021), LetterSampo (2020–2022) sekä Parlamenttisampo (2021–). Tutkimuksen tuloksina esitetään näiden järjestelmien perustana olevia datajulkaisuja ja -palveluita, portaaleja sekä näiden avulla laadittuja data-analyysejä ja visualisointeja. Lisäksi väitöskirjassa käsitellään linkitetyn datan luomis-, mallinnus- ja julkaisuprosesseja sekä biografisen ja prosopografisen datan analysointia data- ja verkostoanalyysin keinoin.

Description

Supervising professor

Hyvönen, Eero, Prof., Aalto University, Department of Computer Science, Finland

Thesis advisor

Tuominen, Jouni, Dr., University of Helsinki & Aalto University, Finland

Keywords

biographical data, data analysis, digital humanities, linked open data, network analysis, prosopography, semantic web, biografinen data, data-analyysi, digitaaliset ihmistieteet, linkitetty avoin data, prosopografia, semanttinen web, verkostoanalyysi

Other note

Parts

  • [Publication 1]: Petri Leskinen, Mikko Koho, Erkki Heino, Minna Tamper, Esko Ikkala, Jouni Tuominen, Eetu Mäkelä, and Eero Hyvönen. Modeling and Using an Actor Ontology of Second World War Military Units and Personnel. In The Semantic Web – ISWC 2017: 16th International Semantic Web Conference, Vienna, Austria, October 21–25, 2017, Proceedings, Part II, Claudia d’Amato, Miriam Fernandez, Valentina Tamma, Freddy Lecue, Philippe Cudré-Mauroux, Juan Sequeda, Christoph Lange, and Jeff Heflin (editors), Information Systems and Applications, incl. Internet/Web, and HCI, volume 10588, pages 280–296, ISBN 9783319682037, Springer, Cham, October 2017, online https://link.springer.com/chapter/10.1007/978-3-319-68204-4_27.
    DOI: 10.5281/zenodo.3431121, http://www.ldf.fi/dataset/warsa View at publisher
  • [Publication 2]: Petri Leskinen, Jouni Tuominen, Erkki Heino, and Eero Hyvönen. An Ontology and Data Infrastructure for Publishing and Using Biographical Linked Data. In Proceedings of the Workshop on Humanities in the Semantic Web (WHiSe II), Alessandro Adamou, Enrico Daga, Leif Isaksen (editors), CEUR Workshop Proceedings, pages 15-26, Vienna, Austria, October, 2017, online https://ceur-ws.org/Vol-2014/paper-02.pdf. https://urn.fi/URN:NBN:fi:aalto-201812105959
  • [Publication 3]: Petri Leskinen, Goki Miyakita, Mikko Koho, and Eero Hyvönen. Combining Faceted Search with Data-analytic Visualizations on Top of a SPARQL Endpoint. In Proceedings of VOILA 2018, Monterey, California. CEUR Workshop Proceedings, Vol. 2187, Valentina Ivanova, Patrick Lambrix, Steffen Lohmann, Catia Pesquita (editors), Monterey, CA, USA, August 2018, online https://ceur-ws.org/Vol-2187/paper5.pdf. https://urn.fi/URN:NBN:fi:aalto-201811095629
  • [Publication 4]: Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen, and Kirsi Keravuori. BiographySampo List of Publications – Publishing and Enriching Biographies on the Semantic Web for Digital Humanities Research. In The Semantic Web: 16th International Conference, ESWC 2019, Portorož, Slovenia, June 2–6, 2019, Proceedings, Pascal Hitzler, Miriam Fernández, Krzysztof Janowicz, Amrapali Zaveri, Alasdair J. G. Gray, Vanessa Lopez, Armin Haller, and Karl Hammar (editors), Lecture Notes in Computer Science, volume 11503, pages 574–589, Springer-Verlag, June 2019.
    DOI: 10.1007/978-3-030-21348-0_37 View at publisher
  • [Publication 5]: Minna Tamper, Petri Leskinen, Eero Hyvönen, Risto Valjus, and Kirsi Keravuori. Analyzing Biography Collections Historiographically as Linked Data: Case National Biography of Finland. Semantic Web Journal: Special Issue on Semantic Web for Cultural Heritage, Mehwish Alam, Victor de Boer, Enrico Daga, Marieke van Erp, Eero Hyvönen and Albert Meroño-Peñuela (editors), Volume 14, 2, pages 385–419, IOS Press, December 2022, ISSN 1570-0844 (P),
  • [Publication 6]: Petri Leskinen and Eero Hyvönen. Linked Open Data Service about Historical Finnish Academic People in 1640–1899. In DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, Riga, Latvia, Sanita Reinsone, Inguna Skadin. a, Anda Bakl¯ane, J¯anis Daugavietis (editors), pages 284–292, CEUR Workshop Proceedings, vol. 2612. October 2020. online https://ceur-ws.org/Vol-2612/short14.pdf. https://urn.fi/URN:NBN:fi:aalto-202106097286
  • [Publication 7]: Petri Leskinen and Eero Hyvönen. Reconciling and Using Historical Person Registers as Linked Open Data in the AcademySampo Portal and Data Service. ISWC2021, Andreas Hotho, Eva Blomqvist, Stefan Dietze, Achille Fokoue, Ying Ding, Payam Barnaghi, Armin Haller, Mauro Dragoni, Harith Alani (editors), pages 714—730, Springer, October 2021. online https://link.springer.com/chapter/10.1007/978-3-030-88361-4_42. (editors), Volume 14, 2, pages 385–419, IOS Press, December 2022, ISSN 1570-0844 (P),
    DOI: 10.1007/978-3-030-88361-4_42 View at publisher
  • [Publication 8]: Petri Leskinen, Javier Ureña-Carrion, Jouni Tuominen, Mikko Kivelä, and Eero Hyvönen. Knowledge Graphs and Petri Leskinen, Eero Hyvönen, and Jouni Tuominen. Members of Parliament in Finland Knowledge Graph and its Linked Open Data Service. Further with Knowledge Graphs. Proceedings of the 17th International Conference on Semantic Systems, 6-9 September 2021, Amsterdam, The Netherlands., Data Services for Studying Historical Epistolary Data in Network Science on the Semantic Web. Submitted for review, Semantic Web Journal. online https://www.semantic-web-journal.net/system/files/swj3424.pdf
  • [Publication 9]: Mehwish Alam, Paul Groth, Victor de Boer, Tassilo Pellegrini, Harshvardhan J. Pandit, Elena Montiel, Víctor Rodríguez Doncel, Barbara McGillivray, Albert Meroño-Peñuela (editors), IOS Press, pages 255–269, DOI 10.3233/SSW210049, online https://ebooks.iospress.nl/volumearticle/57420.
    DOI: 10.3233/SSW210049 View at publisher

Citation