Evaluation of health data quality - Completeness and accuracy in the Finnish Cancer Registry
Loading...
URL
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu |
Master's thesis
Unless otherwise stated, all rights belong to the author. You may download, display and print this publication for Your own personal use. Commercial use is prohibited.
Authors
Date
2023-01-24
Department
Major/Subject
Information Networks
Mcode
SCI24
Degree programme
Master’s Programme in Information Networks
Language
en
Pages
71 + 7
Series
Abstract
The healthcare industry produces and collects more data than ever. As the amount of data increases, the quality of data becomes a major issue. Health data provides valuable benefits for healthcare systems, and it can be utilized to improve health outcomes for all society. However, this data is only useful when it is of sufficient quality for its purpose of use. The aim of this thesis is to evaluate data quality in Finland’s extensive health data network with a particular focus on data quality in the Finnish Cancer Registry (FCR). This thesis is a register-based study assessing completeness and accuracy of data in the FCR in 2015 – 2019 for lung cancer and multiple myeloma. Completeness is assessed using the independent case ascertainment method with comparison of FCR data to other independent health data sources. Accuracy is measured by calculating the proportion of morphologically verified cases (MV%), cases registered with death certificate only (DCO%) and missing information on cancer stage. Completeness for lung cancer was 94.8% and for multiple myeloma 71.1%. Completeness was lower than expected based on earlier studies, which was mainly explained by the inclusion of more data sources in this study to identify missing cases. The inclusion of outpatient primary health care data, which has not been used in earlier studies, specifically impacted the results of this study. The results suggest that prior estimations on the completeness of data in the FCR are likely to have been too high. Decreasing number of clinical cancer notifications completed by healthcare professionals is also likely to affect completeness of data in the FCR, especially for multiple myeloma. Lower level of completeness for multiple myeloma compared to lung cancer confirms that problems with registration of haematological malignancies identified in many prior studies still exist. MV% was 82.6% for lung cancer and 71.8% for multiple myeloma, which is close to the expected level of accuracy in the FCR. DCO%, which was 2.5% for lung cancer and 1.6% for multiple myeloma, showed slight improvement of accuracy.Terveysala tuottaa ja hyödyntää enemmän dataa kuin koskaan ennen. Samalla kun datan määrä kasvaa, myös datan laadun merkitys korostuu. Terveysdatan hyödyntäminen tarjoaa merkittäviä mahdollisuuksia terveydenhuoltojärjestelmälle ja ihmisten hyvinvoinnin edistämiselle. Data on kuitenkin hyödyllistä ainoastaan silloin, kun sen laatu vastaa sen käyttötarkoituksen asettamia vaatimuksia. Tämän diplomityön tavoitteena on arvioida datan laatua suomalaisessa terveysdataverkostossa keskittyen erityisesti datan laatuun Suomen Syöpärekisterissä. Tämä diplomityö on rekisteripohjainen tutkimus, jossa tutkitaan datan kattavuutta ja tarkkuutta Suomen Syöpärekisterissä keuhkosyövän ja myelooman osalta vuosina 2015–2019. Kattavuusarvio perustuu rekisteröityjen syöpätapausten ja muista terveysdatalähteistä tunnistettujen syöpätapausten vertailuun, minkä kautta arvioitiin Syöpärekisteristä puuttuvien tapausten määrä. Datan tarkkuutta arvioitiin laskemalla solu- tai kudosnäytteestä varmennettujen syöpätapausten osuus (MV%), ainoastaan kuolintodistukseen perustuvien tapausten osuus (DCO%) sekä niiden tapausten osuus, joissa levinneisyystieto puuttuu. Keuhkosyövän kattavuus oli 94.8 % ja myelooman 71.1 %. Kattavuus oli matalampi kuin aiemmissa tutkimuksissa, mikä selittyy pääasiassa sillä, että aiempaa useampia datalähteitä käytettiin puuttuvien syöpätapausten tunnistamiseen. Erityisesti perusterveydenhuollon avohoidon datan hyödyntäminen, jota ei ole käytetty aiemmissa tutkimuksissa, näyttäisi vaikuttavan merkittävästi kattavuusarvioon. Tulosten perusteella vaikuttaa siltä, että aiemmat kattavuusarviot ovat olleet liian korkeita. Kliinisten syöpäilmoitusten väheneminen näyttää myös vaikuttavan kattavuuden madaltumiseen erityisesti myelooman osalta. Myelooman matalampi kattavuus verrattuna keuhkosyöpään on linjassa aiempien tutkimusten kanssa ja osoittaa, että hematologisten syöpien rekisteröinnissä on yhä puutteita. Keuhko-syövän MV% oli 82.6 % ja myelooman 71.8 %, jotka vastasivat aiempia tarkkuusarvioita. Keuhkosyövän DCO% oli 2.5 % ja myelooman 1.6 %, jotka osoittavat datan tarkkuuden parantuneen hieman.Description
Supervisor
Viitanen, JohannaThesis advisor
Leinonen, MaaritKeywords
data quality, health data, cancer registration, register-based study