Gesundheitswesen 2019; 81(08/09): 629-635
DOI: 10.1055/s-0043-124669
Originalarbeit
© Georg Thieme Verlag KG Stuttgart · New York

Anreicherung eines GKV-Datensatzes mit amtlichen Todesursachen über einen Abgleich mit dem Epidemiologischen Krebsregister Nordrhein-Westfalen: Machbarkeitsstudie und Methodenvergleich

Enrichment of Claims Data with Official Causes of Death Using a Record Linkage with the Epidemiological Cancer Registry of North Rhine-Westphalia: Feasibility Study and Comparison of Procedures
Ingo Langner
1   Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen
,
Volker Krieg
2   Registerstelle, Landeskrebsregister Nordrhein-Westfalen, Münster
,
Oliver Heidinger
3   Epidemiological Cancer Registry Northrhine-Westphalia, Management Board, Münster
,
Hans Werner Hense
4   Institut für Epidemiologie und Sozialmedizin, Münster
,
Hajo Zeeb
5   Abt. Prävention und Evaluation, Leibniz-Institut für Präventionsforschung und Epidemiologie, Bremen
› Author Affiliations
Further Information

Publication History

Publication Date:
01 February 2018 (online)

Zusammenfassung

Ziel der Studie Für die Evaluation von Krebsvorsorgeprogrammen stellen Daten der Gesetzlichen Krankenversicherung (GKV) eine wichtige Datenquelle dar, die jedoch nicht die benötigten Daten zum genauen Sterbedatum und zur Todesursache enthält. Diese Studie sollte prüfen, ob eine diesbezügliche Anreicherung individueller GKV-Daten über einen Abgleich mit einer geeigneten externen Datenquelle erfolgen kann.

Methodik In der pharmako-epidemiologischen Forschungsdatenbank GePaRD identifizierten wir eine Versichertenstichprobe von 25 528 Frauen, die laut den Angaben in GePaRD im Zeitraum 2006–2013 verstorben waren und ihren Wohnsitz in Nordrhein-Westfalen (NRW) hatten. Datum und Ursache des Todes aller Einwohner von NRW seit 2005 liegen im Epidemiologischen Krebsregister von NRW vor. In Kooperation mit 2 gesetzlichen Krankenkassen wurde mit einem probabilistischen bzw. deterministischen Abgleichverfahren versucht, jeder Verstorbenen der Stichprobe einen Todesfall aus NRW und damit eine Todesursache zuzuordnen.

Ergebnisse Für 94,72% der Verstorbenen der Versichertenstichprobe konnte probabilistisch und für 93,36% deterministisch ein Todesfall aus NRW zugeordnet werden.

Schlussfolgerung Das probabilistische und das deterministische Verfahren erreichten vergleichbar hohe Trefferquoten. Nicht erfolgte Zuordnungen sind vermutlich größtenteils auf Fehler bei der Erfassung der Personendaten zurückzuführen. Aufgrund des geringeren technischen Aufwands erscheint das deterministische Verfahren als die Methode der Wahl für die Anreicherung von GKV-Daten mit amtlichen Todesursachen aus geeigneten externen Datenquellen.

Abstract

Background Claims data of the statutory health insurance (SHI) are an important data source for the evaluation of cancer prevention programs. However, this source does not contain relevant information on cause of death. This study examined whether individual claims data can be enriched with data on the required cause of death using record linkage procedures with suitable external data sources.

Methods In the German pharmacoepidemiologic research database (GePaRD) we identified a sample of 25,528 deceased female residents of North Rhine Westphalia (NRW) who, according to GePaRD information, died between 2006 and 2013. Date and cause of all deaths among inhabitants of NRW since 2005 were available in the epidemiological cancer registry of NRW. In cooperation with 2 SHI companies, we tried to match each individual of the sample with a case of death in NRW and the corresponding cause of death using a probabilistic and, alternatively, a deterministic linkage procedure.

Results Of the study sample, 94.72% were successfully matched by the probabilistic and 93.36% by the deterministic method.

Conclusions The probabilistic and the deterministic record linkage approach produced comparably high matching rates. Cases without matches are probably due to errors occurring at the stage of personal data entry. Given the lower technical efforts, the deterministic approach appears to be the method of choice for the enrichment of claims data with cause of death information from suitable external data sources in Germany.