Temporal bipartite graph neural networks for cardiovascular risk prediction from Finnish registry data

Loading...
Thumbnail Image

URL

Journal Title

Journal ISSN

Volume Title

School of Science | Master's thesis

Department

Mcode

Language

en

Pages

52

Series

Abstract

Cardiovascular diseases remain the leading cause of death worldwide, with myocardial infarction (MI) representing one of the most critical outcomes to predict. Traditional risk prediction models often fail to account for the complexity and heterogeneity of healthcare delivery, particularly how physician behavior and continuity of care influence long-term patient outcomes. This thesis investigates whether modeling the temporal evolution of patient-physician interactions can improve long-term cardiovascular risk prediction compared to static approaches. We propose a novel temporal bipartite graph neural network (GNN) that incorporates edge-sequence encodings to model the evolution of patient-physician interactions over time. The architecture combines edge-aware message passing with temporal sequence modeling in a bipartite graph, enabling simultaneous representation of patient trajectories and physician-specific care behaviors at population scale. We evaluate our approach using Finnish registry data from the PRIMUS project, training on patient-physician interactions from 2014–2018 and predicting MI events from 2019–2022. The temporal bipartite GNN achieved an AUROC of 0.8324, representing a modest improvement of 0.0077 over a static BiGCN baseline (0.8247), with similar small gains in accuracy, precision, and recall. While these results demonstrate the feasibility of integrating temporal physician-level information into population-scale prediction models, the improvements were incremental rather than substantial. The findings suggest that while temporal pre-scription information provides additional predictive signal, its impact is limited in this setting, especially given the added model complexity. Strong static predictors such as coronary artery disease and prior MI flags may have saturated much of the predictive capacity, leaving limited room for temporal interaction patterns to contribute. This work provides a foundation for future research in temporal bipartite graph modeling for healthcare prediction tasks.

Hjärt och kärlsjukdomar förblir den främsta dödsorsaken världen över, där hjärtinfarkt utgör ett av de mest kritiska utfallen att förutsäga. Traditionella riskförutsägelsemodeller misslyckas ofta med att ta hänsyn till den komplexa dynamiken som elektroniska hälsoregister erbjuder. Denna avhandling undersöker huruvida modellering av den temporala utvecklingen av patienters läkarbesök kan förbättra långsiktig kardiovaskulär riskförutsägelse Vi föreslår ett nytt temporalt bipartit grafiskt neuralt nätverk som genererar vektorrepresentationer av tidsmarkerade läkarbesök. Dessa vektorrepresentationer används sedan av vårt grafiskt neurala nätverk för att modellera utvecklingen av läkarbesök över tid. Arkitekturen kombinerar nod- och länkattribut i en bipartit graf, vilket möjliggör samtidig representation av patientresultat och läkarspecifika vårdmönster på populationsnivå. Vi utvärderar vår metod på finländska elektroniska hälsoregister från PRIMUS-projektet. Modellen är tränad på läkarbesök från 2014–2018 och förutsäger hjärtinfarkter från 2019–2022. Vår modell uppnådde en AUROC på 0,8324 vilket representerar en blygsam förbättring på 0,0077 jämfört med en statisk BiGCN-inspirerad basmodell (0,8247). Vi såg liknande små förbättringar i noggrannhet, precision och återkallelse. Dessa resultat demonstrerar möjligheterna när det kommer till att modellera läkarbesök på populationsnivå i förutsägelsemodeller. Trots det måste vi erkänna att förbättringarna är små när vi jämför med den statiska basmodellen. Även om den temporala läkarbesöksinformationen har ett potentiellt värde när det kommer till förutsägelse av hjärtinfarkter, är dess påverkan begränsad i denna miljö. Starka statiska prediktorer såsom kranskärlssjukdom och tidigare hjärtinfarkter kan ha mättat mycket av modellens prediktiva förmåga. Detta lämnar begränsat med utrymme för temporala interaktionsmönster att bidra till riskförutsägelsen. Detta arbete sätter grund för framtida forskning inom temporala grafmodeller för förutsägelsemodeller inom vården.

Description

Supervisor

Kaski, Samuel

Thesis advisor

Loría, Jorge

Other note

Citation