Gesundheitswesen 2015; 77(02): e8-e14
DOI: 10.1055/s-0034-1395644
Originalarbeit
© Georg Thieme Verlag KG Stuttgart · New York

Verknüpfung von Routinedaten der Gesetzlichen Krankenversicherung mit Daten eines Krankenhausinformationssystems: Machbar, aber auch „nützlich“?

Linkage of Statutory Health Insurance Data with those of a Hospital Information System: Feasible, but also “Useful”?
C. Ohlmeier
1   Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS GmbH
,
F. Hoffmann
2   Zentrum für Sozialpolitik, Universität Bremen
7   Wissenschaftsschwerpunkt Gesundheitswissenschaften der Universität Bremen
,
K. Giersiepen
2   Zentrum für Sozialpolitik, Universität Bremen
7   Wissenschaftsschwerpunkt Gesundheitswissenschaften der Universität Bremen
,
H. Rothgang
2   Zentrum für Sozialpolitik, Universität Bremen
7   Wissenschaftsschwerpunkt Gesundheitswissenschaften der Universität Bremen
,
R. Mikolajczyk
3   Helmholtz-Zentrum für Infektionsforschung
4   Medizinische Hochschule Hannover
,
H.-J. Appelrat
5   Department für Informatik, Universität Oldenburg
,
A. Elsässer
6   Klinik für Kardiologie im Klinikum Oldenburg
,
E. Garbe
2   Zentrum für Sozialpolitik, Universität Bremen
7   Wissenschaftsschwerpunkt Gesundheitswissenschaften der Universität Bremen
› Author Affiliations
Further Information

Publication History

Publication Date:
26 January 2015 (online)

Zusammenfassung

Ziel: Abrechnungsdaten werden im Ausland zur Beantwortung versorgungsepidemiologischer Fragestellungen häufig mit anderen Datenquellen verknüpft. In Deutschland gestaltet sich eine direkte Verknüpfung von Routinedaten der Gesetzlichen Krankenversicherung (GKV) mit anderen Datenquellen aufgrund hoher datenschutzrechtlicher Hürden als schwierig. Ziel der aktuellen Analyse war die Evaluation eines indirekten Ansatzes zur Verknüpfung von GKV-Routinedaten mit Daten eines Krankenhausinformationssystems (KIS).

Methodik: Die Grundlage der Analyse bildeten Daten von 2 Krankenkassen sowie Daten eines KIS aus den Jahren 2004–2010. In beiden Datenquellen beschränkte sich die Studienpopulation auf Krankenhausaufenthalte von Patienten in einem bestimmten Krankenhaus, bei denen eine Herzinsuffizienz kodiert wurde. Eine Verknüpfung von Krankenhausaufenthalten beider Datenquellen erfolgte bei Übereinstimmung des Aufnahme- und Entlassungsdatums sowie einem definierten Anteil von übereinstimmenden Diagnosen bezogen auf die Diagnosen im KIS (in voller Kodiertiefe). Mithilfe der direkten personenbezogenen Verknüpfung beider Datenquellen (Goldstandard) wurde der Algorithmus anhand gängiger Teststatistiken evaluiert. Weiterhin wurde ermittelt, wie häufig für dieses Patientenkollektiv zusätzliche klinische Angaben aus dem KIS vorlagen.

Ergebnisse: Der Datensatz umfasste 3 731 Hospitalisierungen aus dem KIS und 8 172 Hospitalisierungen aus den GKV-Routinedaten. Das Linkage erzielte bei einer Übereinstimmung der Diagnosen von mindestens 30%, eine Sensitivität von 86,7%, welche bei 100%-iger Übereinstimmung bis auf 41,7% absank. Die Spezifität lag bei allen untersuchten Grenzwerten nahe 100%. Anthropometrische Maße sowie Befundinformationen waren in den Daten des KIS selten vorhanden, wohingegen Informationen zum Gesundheitszustand und Laborparametern vergleichsweise vollständig vorlagen.

Schlussfolgerung: Im Bereich der Verknüpfung von GKV-Routinedaten mit ergänzenden Datenquellen können indirekte Linkage-Verfahren im Vergleich zu den in Bezug auf Vorbereitung und Umsetzung aufwendigen direkten Ansätzen eine wertvolle Alternative darstellen. Der vorgestellte Ansatz bezog sich auf einen relativ kleinen Datensatz sowie ein eingegrenztes Patientenkollektiv. Bei einer Replikation auf bundesweiten Daten ohne entsprechende Einschränkungen bedürfte der Algorithmus einer Ausweitung. Zudem erscheint der weiterhin große Linkage-Aufwand vor dem Hintergrund von vergleichsweise vielen fehlenden Werten in interessierenden Merkmalen im KIS fraglich.

Abstract

Aim: Administrative data are increasingly being linked with other data sources for research purposes in the field of epidemiology and health services research abroad. In Germany, the direct linkage of routine data of statutory health insurance (SHI) providers with other data sources is complicated due to strict data protection requirements. The aim of this analysis was to evaluate an indirect linkage of SHI routine data with data of a hospital information system (HIS).

Methods: The dataset comprised data from 2004 to 2010 from 2 sickness funds and one HIS. In both data sources, hospitalisations were restricted to admissions into one hospital with at least one diagnosis of heart failure. The 2 data sources were linked, in cases of the agreement of the admission and discharge dates, as well as the agreement of at least a certain percentage of diagnoses in HIS data when compared to SHI data (full coding depth). Based on the direct linkage using the pseudonymised insurance number as gold standard, the proposed linkage approach was evaluated by means of test statistics. Furthermore, the completeness of relevant information of the HIS was described.

Results: The dataset contained 3 731 hospitalisations from the HIS and 8 172 hospitalisations from the SHI routine data. The sensitivity of the linkage approach was 86.7% in the case of an agreement of at least 30% of the diagnoses and decreased to 41.7% in the case of 100% agreement in the diagnoses. The specificity was almost 100% at all studied cut-offs of agreement. Anthropometric measures and diagnostic information were available only for a small fraction of cases in the data of the HIS, whereas information on the health status and on laboratory information was comparatively complete.

Conclusion: For the linkage of SHI routine data with complementary data sources, indirect linkage methods can be a valuable alternative in comparison to direct linkage, which is time-consuming with regard to planning and application. Since the proposed approach was used in a relatively small sample and a restricted patient population, a replication using nation-wide data without respective restrictions would require an extension of the algorithm. Furthermore, the large administrative effort seems questionable considering the comparatively high amount of missing values in interesting information in the HIS.

 
  • Literatur

  • 1 Schubert I, Koster I, Kupper-Nybelen J et al. Versorgungsforschung mit GKV-Routinedaten: Nutzungsmöglichkeiten versichertenbezogener Krankenkassendaten für Fragestellungen der Versorgungsforschung. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz 2008; 51: 1095-1105
  • 2 Jutte DP, Roos LL, Brownell MD. Administrative record linkage as a tool for public health research. Annu Rev Public Health 2011; 32: 91-108
  • 3 Ohlmeier C, Frick J, Pruetz F et al. Nutzungsmöglichkeiten von Routinedaten der Gesetzlichen Krankenversicherung in der Gesundheitsberichterstattung des Bundes. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz 2014; 57: 464472
  • 4 Müller R, Braun B. Vom Quer- zum Längsschnitt mit GKV-Daten, GEK-Schriftenreihe zur Gesundheitsanalyse/51. Sankt-Augustin: Asgard-Verlag. 2006
  • 5 Haas P. Medizinische Informationssysteme und Elektronische Krankenakten. Berlin: Springer; 2005
  • 6 Eberlein-Gonska M, Petzold T, Helass G et al. The incidence and determinants of decubitus ulcers in hospital care: an analysis of routine quality management data at a university hospital. Dtsch Arztebl Int 2013; 110: 550-556
  • 7 Güldner S, Langada V, Popp S et al. Patients with syncope in a German emergency department: description of patients and processes. Dtsch Arztebl Int 2012; 109: 58-65
  • 8 Nachtnebel M, Greutelaers B, Falkenhorst G et al. Lessons from a one–year hospital-based surveillance of acute respiratory infections in Berlin – comparing case definitions to monitor influenza. BMC Public Health 2012; 12: 245
  • 9 Neumann T, Biermann J, Wasem J et al. Herzinsuffizienz: Häufigster Grund für Krankenhausaufenthalte: Medizinische und ökonomische Aspekte. Dtsch Arztebl 2009; 106: 269-275
  • 10 McMurray JJ, Pfeffer MA. Heart failure. Lancet 2005; 365: 1877-1889
  • 11 Roger VL, Go AS, Lloyd-Jones DM et al. Executive summary: heart disease and stroke statistics – 2012 update: a report from the American Heart Association. Circulation 2012; 125: 188-197
  • 12 Bui AL, Horwich TB, Fonarow GC. Epidemiology and risk profile of heart failure. Nat Rev Cardiol 2011; 8: 30-41
  • 13 Zarrinkoub R, Wettermark B, Wandell P et al. The epidemiology of heart failure, based on data for 2.1 million inhabitants in Sweden. Eur J Heart Fail 2013; 15: 995-1002
  • 14 Herzog TN, Scheuren FJ, Winkler WE. Data quality and record linkage techniques. New York: Springer; 2007
  • 15 March S, Rauch A, Thomas D et al. Datenschutzrechtliche Vorgehensweise bei der Verknüpfung von Primär- und Sekundärdaten in einer Kohortenstudie: die lidA-Studie. Gesundheitswesen 2012; 74: e122-e129
  • 16 March S, Iskenius M, Hardt J et al. Methodische Überlegungen für das Datenlinkage von Primär- und Sekundärdaten im Rahmen arbeitsepidemiologischer Studien. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz 2013; 56: 571-578
  • 17 Blakely T, Salmond C. Probabilistic record linkage and a method to calculate the positive predictive value. Int J Epidemiology 2002; 31: 1246-1252
  • 18 Kajüter H, Batzler WU, Krieg V et al. Abgleich von Sekundärdaten mit einem epidemiologischen Krebsregister auf der Basis verschlüsselter Personendaten – Ergebnisse einer Pilotstudie in Nordrhein-Westfalen. Gesundheitswesen 2012; 74: e84-e89
  • 19 Küpper-Nybelen J, Ihle P, Deetjen W et al. Empfehlung rehabilitativer Maßnahmen im Rahmen der Pflegebegutachtung und Umsetzung in der ambulanten Versorgung. Z Gerontol Geriatr 2006; 39: 100-108
  • 20 Schütze B. Nutzung medizinischer Routinedaten außerhalb der Patientenversorgung – Königsweg Pseudonymisierung. Dtsch Med Wochenschr 2012; 137: 844-850
  • 21 Curtis JP, Sokol SI, Wang Y et al. The association of left ventricular ejection fraction, mortality, and cause of death in stable outpatients with heart failure. J Am Coll Cardiol 2003; 42: 736-742
  • 22 Köpcke F, Trinczek B, Majeed RW et al. Evaluation of data completeness in the electronic health record for the purpose of patient recruitment into clinical trials: a retrospective analysis of element presence. BMC Med Inform Decis Mak 2013; 13: 37