Subscribe to RSS

DOI: 10.1055/a-2599-9607
Editorial
Authors
Liebe Kolleginnen und Kollegen,
Liebe Leserinnen und Leser,
nach gut einem Jahr freuen wir uns, Ihnen nun das nächste AGENS-Supplement zu Methoden und Ergebnissen der Sekundärdatenanalyse vorlegen zu können, freundlicherweise wie immer unterstützt durch die Gesamtschriftleitung des Gesundheitswesens und die Mitarbeiter:innen des Thieme-Verlags. Vielen Dank.
Das Heft zeichnet sich wie inzwischen gewohnt durch eine Kompilation mehrerer methodischer Artikel aus, die die Vielzahl wissenschaftlich nutzbarer Datenquellen und spezifischer Methoden widerspiegelt. Aber auch die Reflexion über aktuelle wissenschaftspolitische Entwicklungen gehört zum Themenkanon dieser Supplementreihe, ebenso wie Berichte aus der Sekundärdaten-‚Szene‘, wie der Rückblick auf den AGENS Methodenworkshop 2024 in Hannover.
Ihle et al. stellen ergänzend in einem Kurzbericht die Ergebnisse einer Onlinebefragung potentieller Nutzer:innen des FDZ Gesundheit dar. Der Fokus lag hierbei auf den in der virtuellen Analyseumgebung vom FDZ bereitgestellten Softwaretools SQL, R und Python. Im Bericht wird diese Softwareauswahl vor dem Hintergrund der Nutzer:innenkenntnisse kritisch diskutiert, und es werden daraus Schlussfolgerungen und Handlungsempfehlungen formuliert
Die ersten beiden Beiträge befassen sich mit der Validität von vertragsärztlichen Abrechnungsdaten der privaten Krankenversicherungen und knüpfen damit an Artikel aus den vorangegangenen Supplements an. Gothe et al. beschreiben zunächst die Grundlagen und Voraussetzungen für die wissenschaftliche Nutzung dieser Daten. In der Darlegung von Gemeinsamkeiten und Unterschieden zwischen GKV- und PKV-Daten sowie den besonderen Merkmalen von PKV-Daten wird erkennbar, warum diese bislang einem wissenschaftlichen Zugang weitgehend verschlossen blieben, was auch durch spezifische datenschutzrechtliche ‚Bewehrungen‘ dieser Daten erklärt wird. Eine Nutzung wie bei GKV-Daten inzwischen seit vielen Jahren üblich ist jedoch grundsätzlich möglich und erstrebenswert, wie die Autor:innen ausführen.
Anschließend adressieren Stallmann et al. konkret Datenentstehung, Datenfluss und Herausforderungen beim wissenschaftlichen Arbeiten mit diesen Daten. Um die PKV-Daten in der Forschung zu verwenden, ist es essenziell, die Logik des PKV-Systems bzgl. Einreichung von Rechnungen zu deren Erstattung für den Bereich der ambulant-ärztlichen Versorgung inklusive Arzneimittel zu verstehen. Ein exemplarisches Datenflussmodell für die genannten Sektoren illustriert Abläufe und Besonderheiten im PKV-System. Damit wird ein grundlegendes Verständnis für diese Daten ermöglicht. Mit diesen beiden Artikeln wird schrittweise der Blick auf die Inanspruchnahme medizinischer Leistungen der rund 12% privat krankenversicherten Bürger:innen eröffnet. Der dritte Teil dieser Artikelserie wird im nächsten AGENS Supplement erscheinen.
Der Beitrag von Tuncer et al. thematisiert die Entwicklung und interne Validierung von Falldefinitionen für Nierenerkrankungen bei Personen mit Diabetes in GKV-Routinedaten. Die Autor:innen stellen Algorithmen zur Identifikation von chronischer Niereninsuffizienz und Nierenersatztherapie vor, die über Diagnose- und Leistungsangaben validiert werden. Schwierig erweist sich allerdings – wie schon für andere Krankheiten dargelegt - die Prävalenzschätzung von Niereninsuffizienz, wenn nur ein kurzer Beobachtungszeitraum vorliegt, weil diese Begleiterkrankung im Anfangsstadium nicht zwingend neben der Grunderkrankung Diabetes dokumentiert wird.
Heinze et al. beschreiben einen Ansatz zur Evaluation des deutschen Mammographie-Screening-Programms über ein Datenlinkage von GKV-Routinedaten mit Informationen zur Todesursache aus regionalen epidemiologischen Krebsregistern. Ein weiteres Ziel war die Untersuchung, in welchem Ausmaß die Identifikation von laut GKV-Daten verstorbenen Versicherten in Krebsregistern und dort ergänzend vorgehaltenen Angaben zur Todesursache gelingt. Da Todesursacheninformation jedoch nicht für alle Verstorbenen hinzugefügt werden konnten, bleiben weiterhin Routinedaten-basierte Algorithmen zur Todesursachenanreicherung mit Routinedaten notwendig.
Merzenich et al. berichten aus einem Innofonds-Projekt zu Spätfolgen nach einer Krebserkrankung im Kindes- und Jugendalter. Ebenso wie im vorhergehenden Artikel wird hierin das Datenlinkage zweier Datenquellen beschrieben. Dabei werden GKV-Routinedaten genutzt, um ehemalige im Deutschen Kinderkrebsregister (DKKR) registrierte Patient:innen auf das mögliche erhöhte Risiko für Spätfolgen zu untersuchen. In diesem Artikel wird das Linkageverfahren beschrieben und die Repräsentativität der entstandenen Positive-Match-Kohorte analysiert. Es zeigten sich keine relevanten Unterschiede zwischen Match- und Non-Match-Gruppe, was die Belastbarkeit der entstandenen Überlebenden-Kohorte belegt und den Linkage-Ansatz als attraktiv für vergleichbare Linkage-Studien erscheinen lässt. Im nächsten Supplement wird das Linkage-Verfahren in größerer Detailliertheit beschrieben.
Goldhahn et al. stellen eine weitere Datenlinkage-Studie vor, die Angaben aus dem Notfallregister AKTIN mit GKV-Daten verknüpft, um den Verbleib und das Follow-up der Notfallpatient:innen zu untersuchen. Es stellt sich heraus, dass sich stationäre Aufnahmen im direkten Anschluss an Notaufnahmebesuche sowie ambulante Behandlungen in Notaufnahmen in GKV-Routinedaten sinnvoll abbilden lassen. Die Verlinkung erfolgt auf der Basis indirekter stochastischer Verfahren, da ein direkter Schlüssel wie die Krankenversichertennummer in der Notfalldokumentation nicht vollständig vorliegt. Die Notwendigkeit einer eindeutigen Schlüsselvariablen in Linkage-Studien lässt sich damit als Grundpetitum für vergleichbare Studien ableiten.
Hauswaldt et al. beschäftigen sich mit verglichen mit den vertragsärztlichen Abrechnungsdaten sehr viel detaillierteren hausärztlichen Behandlungsdaten und den Möglichkeiten zur Anonymisierung sensibler Feldinhalte, um diese Behandlungsdaten der wissenschaftlichen Nutzung zuführen zu können. Mehrere Ansätze zur Anonymisierung wurden exemplarisch geprüft, jedoch gelang eine Anonymisierung nicht vollständig. Besonders Freitextfelder wie Dauerbemerkungen, aktuelle Diagnose, Medikament und Befund erschweren die faktische Anonymisierung. Sorgfältige Vorabauswahl der benötigen Variablen und Datensparsamkeit sowie privacy by design im Verarbeitungsprozess sind daher von entscheidender Bedeutung.
Das Supplement schließt mit dem Plädoyer von Schmitt et al. zugunsten einer kooperativen Forschungsdatenplattform der Gesetzlichen und Privaten Krankenversicherung und des Netzwerks Universitätsmedizin (NUM). Darin sollen perspektivisch Daten aus der klinischen Routineversorgung der 36 deutschen Universitätskliniken, aus klinischen Kohorten und klinisch-epidemiologischen Studien zusammenfließen. Nach Ansicht der Autor:innen könnte diese Datenbasis In strategischer Partnerschaft mit gesetzlichen Krankenkassen und privaten Krankenversicherungen perspektivisch für unterschiedliche Forschungsfragen auf der Basis des an allen NUM-Standorten implementierten „Broad Consent“ genutzt werden.
Wir wünschen Ihnen nun eine anregende Lektüre dieser vielfältigen Artikel, idealerweise mit konkreten Implikationen für Ihre eigene wissenschaftliche Arbeit mit Sekundärdaten. Schließen möchten wir mit der Ermunterung schließen, eigene wissenschaftliche Arbeiten mit methodischem Schwerpunkt für die Einreichung bei diesem Supplement in Erwägung zu ziehen.
Enno Swart, Jelena Epping, Holger Gothe und Peter Ihle
Publication History
Article published online:
12 November 2025
© 2025. The Author(s). This is an open access article published by Thieme under the terms of the Creative Commons Attribution-NonDerivative-NonCommercial-License, permitting copying and reproduction so long as the original work is given appropriate credit. Contents may not be used for commercial purposes, or adapted, remixed, transformed or built upon. (https://creativecommons.org/licenses/by-nc-nd/4.0/).
Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany
