Zusammenfassung
Hintergrund:
Die personenidentifizierenden Daten aller neu an Krebs Erkrankten werden im Epidemiologischen
Krebsregister NRW (EKR NRW) ausschließlich in verschlüsselter Form gespeichert. Abgleiche
mit Kohorten aus Sekundärdatenbeständen müssen daher anhand eines Record Linkage auf
der Basis von Kryptogrammen der Personendaten (sog. Kontrollnummern) durchgeführt
werden. In dieser Pilotstudie wurden Daten aus einem Disease-Management-Programm für
Patienten mit Diabetes mellitus Typ 2 (DMP-DM2) mit dem Datenbestand des EKR NRW abgeglichen,
um die Machbarkeit und Effizienz eines Abgleichs mit verschlüsselten Daten zu erproben.
Methode:
Personendaten des DMP-Datensatzes wurden in einem 2-stufigen Verfahren vor Übermittlung
an das EKR NRW verschlüsselt und anschließend mittels probabilistischem Record Linkage
(RL) mit den EKR-Daten abgeglichen. Eingeschlossen wurden 27 450 bei der AOK NordWest
versicherte Teilnehmer des DMP-DM2 im Alter von 40 bis 79 Jahren mit Wohnsitz im Regierungsbezirk
Münster, die sich von Juni 2003 bis Juli 2008 erstmals in das DMP eingeschrieben haben.
Ergebnisse:
Der elektronische Abgleich hat ca. 24 Stunden Rechnerlaufzeit beansprucht. Etwa 2%
der abzugleichenden Datensätze konnten nach den Regeln des probabilistischen RL nicht
automatisch zugeordnet werden und mussten manuell nachbearbeitet werden. Nach Ausschluss
von bereits vor DMP-Beginn an Krebs erkrankten Personen, Mehrfachtumoren und unzureichenden
Daten verblieben 26 742 Personen (47,3% Männer, 52,7% Frauen) in der Kohorte. Bei
1 364 Mitgliedern der Kohorte (759 Männer, 605 Frauen) wurde nach Einschreibung in
das DMP-DM2 ein bösartiger Tumor diagnostiziert.
Diskussion:
Die DMP-DM2 Daten konnten mit geringem personellen und finanziellen Aufwand verschlüsselt
und durch das RL-Verfahren des EKR NRW mit den Krebsregisterdaten zusammengeführt
werden, sodass sie für die epidemiologische Auswertung zur Verfügung standen. Die
Erfahrungen der Pilotstudie zeigen, dass das bereits hohe Datenschutzniveau ohne Effizienzverluste
durch Modifizierungen im Datenfluss und bei der genutzten Software für künftige Abgleiche
noch gesteigert werden kann.
Abstract
Background:
The Cancer Registry of North-Rhine-Westphalia stores exclusively encrypted personal
identifiers of registered cancer patients. Therefore, comparisons with secondary data
sets can only be performed by record linkage procedures that are based on encrypted
personal identifiers. We report on a pilot study which linked encrypted personal data
from the disease management program for patients with diabetes mellitus type 2 (DMP-DM2)
with the database of the EKR NRW in order to test the feasibility and efficiency of
these record linkage procedures.
Methods:
Personal identifying variables of the DMP records were encrypted in a 2-stage process
before being sent electronically to the EKR NRW where they were subsequently submitted
to a probabilistic record linkage with the registry data. The study included 27 450
participants who were insured at the AOK NordWest, residents of the district Münster
and who were aged 40–79 years at the time of first enrolment to the DMP-DM2 between
June 2003–July 2008.
Results:
The electronic processing time of the semi-automatic record linkage procedure took
about 24 h. Approximately 2% of the records had to be reviewed manually. After exclusion
of prevalent cancer cases, multiple primaries and inadequate data, 26 742 participants
(47.3% men; 52.7% women) remained in the data set. About 1 364 cohort members (759
men, 605 women) were diagnosed with cancer after submission to the disease management
program.
Discussion:
The DMP-DM2 records were encrypted and linked to cancer registry data with a moderate
personnel and financial input and high efficiency. Linked records were instantly usable
for epidemiological analyses. Experiences of the pilot study suggest that future linkage
studies can further advance the level of data protection, without losses in efficiency,
by moderately complex software modifications and amendments of the data flow.
Schlüsselwörter Krebsregister - Disease-Management-Programm - probabilistisches Record Linkage - Datenverschlüsselung
- Sekundärdaten
Key words cancer registry - disease management program - probabilistic record linkage - data
encryption - secondary data