Evaluation of health data quality - Completeness and accuracy in the Finnish Cancer Registry

dc.contributorAalto-yliopistofi
dc.contributorAalto Universityen
dc.contributor.advisorLeinonen, Maarit
dc.contributor.authorGranelund, Ina
dc.contributor.schoolPerustieteiden korkeakoulufi
dc.contributor.supervisorViitanen, Johanna
dc.date.accessioned2023-01-29T18:13:42Z
dc.date.available2023-01-29T18:13:42Z
dc.date.issued2023-01-24
dc.description.abstractThe healthcare industry produces and collects more data than ever. As the amount of data increases, the quality of data becomes a major issue. Health data provides valuable benefits for healthcare systems, and it can be utilized to improve health outcomes for all society. However, this data is only useful when it is of sufficient quality for its purpose of use. The aim of this thesis is to evaluate data quality in Finland’s extensive health data network with a particular focus on data quality in the Finnish Cancer Registry (FCR). This thesis is a register-based study assessing completeness and accuracy of data in the FCR in 2015 – 2019 for lung cancer and multiple myeloma. Completeness is assessed using the independent case ascertainment method with comparison of FCR data to other independent health data sources. Accuracy is measured by calculating the proportion of morphologically verified cases (MV%), cases registered with death certificate only (DCO%) and missing information on cancer stage. Completeness for lung cancer was 94.8% and for multiple myeloma 71.1%. Completeness was lower than expected based on earlier studies, which was mainly explained by the inclusion of more data sources in this study to identify missing cases. The inclusion of outpatient primary health care data, which has not been used in earlier studies, specifically impacted the results of this study. The results suggest that prior estimations on the completeness of data in the FCR are likely to have been too high. Decreasing number of clinical cancer notifications completed by healthcare professionals is also likely to affect completeness of data in the FCR, especially for multiple myeloma. Lower level of completeness for multiple myeloma compared to lung cancer confirms that problems with registration of haematological malignancies identified in many prior studies still exist. MV% was 82.6% for lung cancer and 71.8% for multiple myeloma, which is close to the expected level of accuracy in the FCR. DCO%, which was 2.5% for lung cancer and 1.6% for multiple myeloma, showed slight improvement of accuracy.en
dc.description.abstractTerveysala tuottaa ja hyödyntää enemmän dataa kuin koskaan ennen. Samalla kun datan määrä kasvaa, myös datan laadun merkitys korostuu. Terveysdatan hyödyntäminen tarjoaa merkittäviä mahdollisuuksia terveydenhuoltojärjestelmälle ja ihmisten hyvinvoinnin edistämiselle. Data on kuitenkin hyödyllistä ainoastaan silloin, kun sen laatu vastaa sen käyttötarkoituksen asettamia vaatimuksia. Tämän diplomityön tavoitteena on arvioida datan laatua suomalaisessa terveysdataverkostossa keskittyen erityisesti datan laatuun Suomen Syöpärekisterissä. Tämä diplomityö on rekisteripohjainen tutkimus, jossa tutkitaan datan kattavuutta ja tarkkuutta Suomen Syöpärekisterissä keuhkosyövän ja myelooman osalta vuosina 2015–2019. Kattavuusarvio perustuu rekisteröityjen syöpätapausten ja muista terveysdatalähteistä tunnistettujen syöpätapausten vertailuun, minkä kautta arvioitiin Syöpärekisteristä puuttuvien tapausten määrä. Datan tarkkuutta arvioitiin laskemalla solu- tai kudosnäytteestä varmennettujen syöpätapausten osuus (MV%), ainoastaan kuolintodistukseen perustuvien tapausten osuus (DCO%) sekä niiden tapausten osuus, joissa levinneisyystieto puuttuu. Keuhkosyövän kattavuus oli 94.8 % ja myelooman 71.1 %. Kattavuus oli matalampi kuin aiemmissa tutkimuksissa, mikä selittyy pääasiassa sillä, että aiempaa useampia datalähteitä käytettiin puuttuvien syöpätapausten tunnistamiseen. Erityisesti perusterveydenhuollon avohoidon datan hyödyntäminen, jota ei ole käytetty aiemmissa tutkimuksissa, näyttäisi vaikuttavan merkittävästi kattavuusarvioon. Tulosten perusteella vaikuttaa siltä, että aiemmat kattavuusarviot ovat olleet liian korkeita. Kliinisten syöpäilmoitusten väheneminen näyttää myös vaikuttavan kattavuuden madaltumiseen erityisesti myelooman osalta. Myelooman matalampi kattavuus verrattuna keuhkosyöpään on linjassa aiempien tutkimusten kanssa ja osoittaa, että hematologisten syöpien rekisteröinnissä on yhä puutteita. Keuhko-syövän MV% oli 82.6 % ja myelooman 71.8 %, jotka vastasivat aiempia tarkkuusarvioita. Keuhkosyövän DCO% oli 2.5 % ja myelooman 1.6 %, jotka osoittavat datan tarkkuuden parantuneen hieman.fi
dc.format.extent71 + 7
dc.format.mimetypeapplication/pdfen
dc.identifier.urihttps://aaltodoc.aalto.fi/handle/123456789/119443
dc.identifier.urnURN:NBN:fi:aalto-202301291793
dc.language.isoenen
dc.programmeMaster’s Programme in Information Networksfi
dc.programme.majorInformation Networksfi
dc.programme.mcodeSCI24fi
dc.subject.keyworddata qualityen
dc.subject.keywordhealth dataen
dc.subject.keywordcancer registrationen
dc.subject.keywordregister-based studyen
dc.titleEvaluation of health data quality - Completeness and accuracy in the Finnish Cancer Registryen
dc.titleTerveysdatan laatu Suomessa – datan kattavuus ja tarkkuus Suomen Syöpärekisterissäfi
dc.typeG2 Pro gradu, diplomityöfi
dc.type.ontasotMaster's thesisen
dc.type.ontasotDiplomityöfi
local.aalto.electroniconlyyes
local.aalto.openaccessyes

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
master_Granelund_Ina_2023.pdf
Size:
886.62 KB
Format:
Adobe Portable Document Format