Zeitschrift für Palliativmedizin 2014; 15 - V115
DOI: 10.1055/s-0034-1374178

Verknüpfung von Routinedaten der Gesetzlichen Krankenversicherung mit Daten eines Krankenhausinformationssystems: Evaluation eines probabilistischen Linkage-Ansatzes

C Ohlmeier 1, F Hoffmann 2, K Giersiepen 2, H Rothgang 2, R Mikolajczyk 3, HJ Appelrath 4, A Elsässer 5, E Garbe 1
  • 1Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Klinische Epidemiologie, Bremen, Deutschland
  • 2Zentrum für Sozialpolitik, Bremen, Deutschland
  • 3Helmholtz Zentrum für Infektionsforschung, Braunschweig, Deutschland
  • 4OFFIS-Institut für Informatik, Oldenburg, Deutschland
  • 5Klinik für Kardiologie im Klinikum Oldenburg, Oldenburg, Deutschland

Fragestellung: Abrechnungsdaten werden im europäischen und außereuropäischen Ausland zur Beantwortung epidemiologischer Fragestellungen bzw. in der Versorgungsforschung häufig mit anderen Datenquellen verknüpft. In Deutschland gestaltet sich eine direkte Verknüpfung von Routinedaten der Gesetzlichen Krankenversicherung (GKV) aufgrund hoher datenschutzrechtlicher Hürden als schwierig. Ziel der Studie war die Evaluation eines indirekten probabilistischen Ansatzes zur Verknüpfung von GKV-Routinedaten mit Daten eines Krankenhausinformationssystems (KIS).

Methodik: Die Studienpopulation umfasste Daten von zwei GKVen sowie Daten eines KIS aus den Jahren 2004 bis 2010. In beiden Datenquellen bestand die Studienpopulation aus Krankenhausaufenthalten eines bestimmten Krankenhauses, im Rahmen derer eine Herzinsuffizienz kodiert wurde. Eine Verknüpfung von Krankenhausaufenthalten beider Datenquellen erfolgte bei Übereinstimmung des Aufnahme- und Entlassungsdatums sowie einem definierten Anteil von übereinstimmenden Diagnosen (in voller Kodiertiefe). Mithilfe der direkten personenbezogenen Verknüpfung beider Datenquellen (Goldstandard) wurde der Algorithmus anhand gängiger Teststatistiken evaluiert.

Ergebnisse: Insgesamt erfüllten 4.968 Personen die Ein-und Ausschlusskriterien der Studienpopulation. Das probabilistische Linkage erzielte bei einer 30%-igen Übereinstimmung der Diagnosen eine Sensitivität von 85,0%, welche bei 100%-iger Übereinstimmung bis auf 41,3% absank. Die Spezifität lag bei allen untersuchten Grenzwerten nahe 100%.

Schlussfolgerung: Um GKV-Routinedaten bei epidemiologischen Fragestellungen bzw. Fragestellungen der Versorgungsforschung mit weiteren relevanten Daten anzureichern, kann bei hohen datenschutzrechtlichen Hürden ein probabilistisches Linkage eine wertvolle Alternative zu einem direkten Linkage-Verfahren darstellen.