Pneumologie 2004; 58(3): 147-154
DOI: 10.1055/s-2004-818376
Originalarbeit
© Georg Thieme Verlag Stuttgart · New York

Evaluation der Qualität von Spirometrien mittels Scores

Evaluation of the Quality of Spirometries by a Scoring SystemO.  Hagemeyer1 , D.  Koppisch1 , H.  Otten1
  • 1Hauptverband der gewerblichen Berufsgenossenschaften
Further Information

Dr. med. Olaf Hagemeyer

Hauptverband der gewerblichen Berufsgenossenschaften

Alte Heerstr. 111

53754 Sankt Augustin

Email: olaf.hagemeyer@hvbg.de

Publication History

Eingang: 12. Juni 2003

Nach Revision angenommen: 21. September 2003

Publication Date:
09 March 2004 (online)

Table of Contents #

Zusammenfassung

Zielsetzung: Entwicklung eines geeigneten Scores zur Evaluation der Qualität von Lungenfunktionsmessungen auf Basis aktueller Empfehlungen. Material und Methode: Retrospektive Auswertung randomisiert ausgewählter Messprotokolle von Spirometrien. Die Beurteilungskriterien wurden aus Empfehlungen zur Lungenfunktionsmessung gewonnen. Zum Vergleich erfolgte eine Übersetzung von Einzelergebnissen in einen Score, der zuvor anhand intraindividueller Verläufe von Lungenfunktionsparametern in einer Gruppe ehemaliger Uranerzbergleute validiert werden konnte. Ergebnisse: 417 Messprotokolle von 93 Ärzten unterschiedlicher Fachrichtungen wurden ausgewertet. Von 111 dokumentierten Kalibrierungen war in 10 Fällen diese am Tag der Messung durchgeführt worden. 147 Lungenfunktionskurven wurden als „gut” eingestuft. Nur auf 25 Messprotokollen war die Durchführung von drei oder mehr Messmanövern dokumentiert. Die Reproduzierbarkeit von Messungen ist daher eingeschränkt. Unter Verwendung des Scores ergab sich über alle Ärzte ein gemittelter Wert von 0,58, was einem mittleren Qualitätsniveau entspricht. Schlussfolgerungen: Die Studie generiert und validiert erstmals einen Score, mit dem die Qualität von Spirometrien retrospektiv evaluiert werden kann. Die Anwendung des Scores hat eine inkonsistente Umsetzung von Empfehlungen zur Lungenfunktionsmessung ergeben. In Übereinstimmung mit Ergebnissen internationaler Studien kann auch in Deutschland ein Qualitätsdefizit festgestellt werden.

#

Abstract

Background: The measurement of quality will gain in importance in the future. Suitable instruments for the measurement of the quality of lung function tests have not yet been developed. In order to evaluate the quality of lung function measurements, a score is introduced, based on current guideline recommendations for lung function test. Materials and methods: Records of spirometries were selected at random and evaluated retrospectively. The evaluation criteria were deduced from guideline recommendations. The evaluation criteria were used to calculate a score in order to compare the quality of single records. The individual time course of lung function parameters in a group of former uranium ore miners was used to validate the score. Results: 417 spirometry records from 93 physicians of different specialisation were evaluated. From 111 documented calibrations only 10 were accomplished on the same day on which the measurement was made. 147 lung function curves were classified as “good”. Only in 25 records the execution of three or more measuring manoeuvres had been documented. The mean score over all physicians was 0.58, which corresponds to a middle quality level. Conclusions: The study generates and validates for the first time a score with which the quality of spirometries can be evaluated. The scoring system retrospectively analyses lung function records and it can therefore be used in the framework of quality management. The application of the score showed an inconsistent application of guideline recommendations. In agreement with studies from other countries a lack of quality was also found in Germany.

#

Einleitung

Die Messung der Lungenfunktion mittels der Spirometrie gilt als einfach und sensitiv, daher hat sie als Screeninguntersuchung weite Verbreitung gefunden. Diese Methode zur Messung der Lungenfunktion wird aufgrund zunehmender Prävalenz obstruktiver Atemwegserkrankungen zukünftig weiter an Bedeutung gewinnen [1].

Um aussagefähige Spirometrien zu erhalten, wurden seit Anfang der 90er-Jahre von den wissenschaftlichen Fachgremien Empfehlungen zur Durchführung von Lungenfunktionsmessungen unter Qualitätsaspekten publiziert. In Deutschland erarbeiteten 1994 die Deutsche Atemwegsliga und der Hauptverband der gewerblichen Berufsgenossenschaften Empfehlungen [2] [7]. Eine Leitlinie zur Lungenfunktionsmessung mit dem Bearbeitungsstand März 2002 stellt die Deutsche Gesellschaft für Arbeitsmedizin und Umweltmedizin auf ihrer Homepage vor [3]. Leitlinien sind systematisch entwickelte Darstellungen und Empfehlungen, deren Anwendung rechtlich jedoch der ärztlichen Entscheidungsfreiheit unterliegt. Die Bedeutung von Leitlinien resultiert daraus, dass die Handlungsanleitungen auf dem aktuellen Wissensstand des Fachgebietes basieren.

Alle Empfehlungen zur Lungenfunktionsmessung wurden von Experten entwickelt und repräsentieren das Stadium S1 nach der Empfehlung der Arbeitsgemeinschaft der medizinischen Fachgesellschaften (AMWF). Ob und in welchem Umfang Empfehlungen zur Lungenfunktionsmessung in der praktischen ärztlichen Tätigkeit umgesetzt werden, ist bislang nur vereinzelt untersucht worden. In diesen wenigen Studien aus dem Ausland musste übereinstimmend eine ungenügende Berücksichtigung von Qualitätskriterien festgestellt werden. Den Untersuchungen lagen unterschiedliche Studienansätze zugrunde, wobei neben alleinigen Befragungen [5] [14] [15] auch Messungen an Testpersonen durchgeführt wurden [4] [8]. Eine Interventionsstudie konnte darüber hinaus den positiven Effekt von Trainingsmaßnahmen belegen [6].

Die Qualität von Lungenfunktionsmessungen wurde nach unserer Kenntnis erst einmal anhand einer Beurteilung von Messprotokollen evaluiert [16]. Stoller u. Mitarb. (1997) haben Messungen ausgewertet, die durch speziell trainiertes Personal bei lungenfunktionsanalytisch erfahrenen Probanden gewonnen worden waren und denen die spätere Qualitätsevaluation bekannt war. Die Qualität in der alltäglichen Praxisroutine angefertigter Spirogramme wurde bislang nicht untersucht.

Eine denkbare Ursache für das Fehlen entsprechender Evaluationen könnte die Komplexität der Beschreibung von „Qualität eines Spirogrammes” sein. Da Fehler bei der Durchführung einer Spirometrie auf verschiedenen Stufen des Handlungsprozesses auftreten können, kann die aufgezeichnete Messkurve auch unterschiedliche Fehler aufweisen, was die Gesamtbeurteilung erschwert.

Als mathematische Hilfsmittel zur Beschreibung derartig komplexer „Qualität” eignen sich Scores, die verschiedene Beurteilungskriterien berücksichtigen und in Form eines zusammenfassenden Zahlenwertes beschreiben können [10]. Aussagekräftig sind Scores allerdings nur dann, wenn sie hinreichend validiert worden sind.

Im Folgenden werden die Ergebnisse einer Studie vorgestellt, welche die Umsetzung von Empfehlungen zur Lungenfunktionsmessung anhand von Messprotokollen auswertet und unter Verwendung eines Scores eine Aussage über die Qualität von Lungenfunktionsmessungen macht.

#

Material und Methode

#

Studienansatz

Es handelt sich um eine retrospektive Studie, bei der in der alltäglichen Praxis angefertigte Lungenfunktionsmessungen mit Qualitätskriterien bewertet wurden. Die Erfüllung einzelner Qualitätskriterien wurde in einem zuvor validierten Score erfasst. Die Summe der erreichten Scorepunkte ermöglicht eine Aussage über die Qualität der Lungenfunktionsmessung.

#

Probanden

Aktuelle Lungenfunktionsmessprotokolle und die für die Auswertung erforderlichen Ergebnisse früherer Messungen konnten aus einem Kollektiv ehemaliger Bergleute des DDR-Uranerzbergbaus erhalten werden. Für diese Bergleute besteht seit 1992 die Möglichkeit, an regelmäßigen Untersuchungen zur Krankheitsfrüherkennung teilzunehmen [13]. Die Ergebnisse der Untersuchungen werden auf vorgegebenen Untersuchungsbogen durch den Arzt schriftlich fixiert und in anonymisierter Form zentral für wissenschaftliche Zwecke erfasst.

Die medizinischen Untersuchungen beinhalten immer eine Spirometrie. In den Untersuchungsbogen werden die Werte der inspiratorischen Vitalkapazität (IVC), der 1-Sekunden-Kapazität (FEV1) und des prozentualen Verhältnisses der beiden Messwerte (FEV1 % IVC) notiert. Zusätzlich werden auch die anamnestischen Angaben zu früheren Erkrankungen, aktuellen Beschwerden, die Befunde der körperlichen Untersuchung, Ergebnisse von Laboruntersuchungen und die Befunde einer Röntgenuntersuchung des Thorax kodiert. Frühere sowie aktuelle Erkrankungen des Probanden klassifiziert der Arzt nach ICD-9.

Originalaufzeichnungen von diagnostischen Untersuchungen wie z. B. der Lungenfunktionsmessung oder auch die angefertigten Röntgenbilder verbleiben dagegen beim untersuchenden Arzt und werden nicht zentral erfasst.

#

Ärzte

Mit den Untersuchungen beauftragt sind Ärzte verschiedener Fachrichtungen (Pneumologen, Arbeitsmediziner, Internisten/Betriebsärzte), die an unterschiedlichen Institutionen arbeiten (Ärzte an Instituten, Krankenhäusern, im öffentlichen Gesundheitsdienst und bei überbetrieblichen arbeitsmedizinischen Diensten sowie niedergelassene Ärzte).

#

Lungenfunktionsprotokolle

Für diese Studie wurden von Ärzten ergänzend zu den Untersuchungsbogen Kopien der Aufzeichnungen der Lungenfunktionsmessprotokolle erbeten. Von jedem Arzt wurden zwischen drei und fünf Messkurven erbeten. Die Auswahl der Lungenfunktionsmessprotokolle erfolgte dabei randomisiert. Einschlusskriterium war, dass die Untersuchung in den letzten sechs Monaten vor Beginn dieser Studie im Mai 2002 erfolgt war.

Insgesamt wurden 485 Messprotokolle von 103 Ärzten erbeten.

#

Qualitätskriterien

Zur Beurteilung der Messqualität der Spirometrien wurden Kriterien aus drei Empfehlungen [2] [3] [7] zur Lungenfunktionsmessung hergeleitet. Die Kriterien sind in Tab. [1] dargestellt. Die Benutzung dieser Empfehlungen erfolgte vor dem Hintergrund, dass die Anforderungen an eine gute Lungenfunktionsmessung in den drei Empfehlungen unterschiedlich beschrieben werden.

Tab. 1 Ableitung der Qualitätskriterien zur Beurteilung der Lungenfunktionsmessungen aus verschiedenen Leitlinien.
„Dokumentierter” Messwert: Messwert, der bei der nachgehenden Untersuchung an die zentral erfassenden Stellen mitgeteilt wurde
HVBG
(1994)
DAL
(1994)
DGAUM
(2002)
Score-Parameter
Messparameter:
IVC, FVC, FEV1, PEF, MEF72 - 25
+++
berücksichtigt werden die Maximalwerte +++dokumentierter Messwert IVC ist der Maximalwert von VC
dokumentierter Messwert der IVC > dokumentierter Messwert FEV1
Ausdruck von drei Messkurven +++Anzahl der Messkurven > = 3
Darstellung der „Hüllkurve” wird nicht empfohlen
Referenzwertformel muss erkennbar sein +++
(volumetrische) Kalibrierung ++Zeitpunkt der Kalibrierung in den letzten 7 Tagen vor Messzeitpunkt
Kurvenform +++Kurvenform ist gut
Beginn des Messmanövers +rückextrapoliertes Volumen < 5 % FEV1 oder 0,15 L oder Zeit < 120 ms
Messwertabweichung muss erkennbar sein
(VC, FEV1 < 5 %)
+Messwertabweichung
VC < 5 %
(nicht berücksichtigt)
Messwertabweichung
FEV1 < 5 %
(nicht berücksichtigt)
Messwertabweichung muss erkennbar sein
(FVC, FEV1 < 0,2 L)
+Messwertabweichung
FEV1 < 0,2 L
+Messwertabweichung
VC < 0,2 L
Ende des Atemmanövers +Dauer des Atemmanövers mindestens 6 s oder bis Plateau
Alter keine Abweichung bei Altersangabe
Größe keine Abweichung bei Größenangabe
Gewicht keine Abweichung bei Gewichtsangabe
Obstruktion aufgrund der Messdokumentation (Kurve, Messwerte) ist Aussage über Atemwegsobstruktion möglich
Beurteilung des Messung Messung enthält keine groben Auffälligkeiten, weshalb sie für eine wissenschaftliche Auswertung geeignet wäre
HVBG: Hauptverband der gewerblichen Berufsgenossenschaften; DAL: Deutsche Atemwegsliga; DGAUM: Deutsche Gesellschaft für Arbeitsmedizin und Umweltmedizin

Alle Protokolle von Lungenfunktionsmessungen wurden dann im Hinblick auf die Umsetzung dieser Kriterien durch einen lungenfunktionsanalytisch erfahrenen Arzt beurteilt und die Umsetzung der einzelnen Kriterien dokumentiert.

Beurteilt wurde auch, ob anhand der Spirogramme eine Aussage über das Vorliegen einer obstruktiven Ventilationsstörung gemacht werden konnte und wie groß die Aussagefähigkeit der Messkurven war. Diesbezüglich wurde insbesondere auf Artefakte, Hinweise auf Husten, die Darstellung eines erkennbaren Peaks bei der Ausatmung sowie auf einen schnellen Beginn der Einatmungs- und auf eine hinreichend lange Ausatmungsphase geachtet. Ergänzend wurden das auf den Messprotokollen verzeichnete Alter, die Größe und das Gewicht erfasst (Tab. [1]).

#

Score

Um die Qualität von Lungenfunktionsmessungen anschaulich darstellen zu können, wurde ein Score gebildet. Hierzu wurde für die Umsetzung eines jeden Qualitätskriteriums jeweils ein Punkt vergeben, die Summe der Punkte addiert und die Gesamtpunktzahl durch die Zahl der beurteilbaren Kriterien dividiert.

Da das Ziel die Beurteilung der Messqualität von Ärzten war, wurde aus den Scores aller Messungen eines Arztes der durchschnittlich erreichte Wert bestimmt.

#

Validierung des Scores

Zur Generierung eines Scores gehört der Nachweis seiner Validität. Diese ist dann anzunehmen, wenn mittels einer statistischen Analyse die Korrelation zwischen dem Score und der Zielgröße „gute Lungenfunktionsmessung” belegt werden kann [10] [18]. Als gute Lungenfunktionsmessung wird eine Messung definiert, wenn sie einen guten Maßstab für die ventilatorische Leistungsfähigkeit des Probanden darstellt.

Als Maßstab für die ventilatorische Leistungsfähigkeit standen die Messwerte von IVC und FEV1 zur Verfügung. Die Messwerte waren einerseits aus den Spirogrammen ersichtlich, andererseits waren aber auch schon aus vorherigen Untersuchungen Messwerte von IVC und FEV1 zentral erfasst. Unter der Annahme, dass bei einem lungengesunden Probanden lediglich ein geringer jährlicher Abfall der 1-Sekunden-Kapazität von etwa 30 bis 50 ml im Rahmen des physiologischen Alterungsprozesses zu erwarten ist, sollten bei validen Lungenfunktionsmessungen auch im zeitlichen Verlauf nur geringe Schwankungen der Messwerte zu erkennen sein [3].

Es bot sich daher an, die schon vorhandenen Messwerte miteinander zu vergleichen und die größten Werte zu bestimmen. Diese maximal gemessenen Werte von IVC und FEV1 dienten als Referenzwert. Die Differenz zwischen den Referenzwerten und den Werten auf den übersandten spirometrischen Messprotokollen ergab dann den gesuchten „Qualitätsindikator”. Der Wert wurde als „D-max” bezeichnet.

Eine gute Lungenfunktionsmessung entspricht damit einem kleinen Wert von D-max.

Zum Ausschluss krankheitsbedingter Schwankungen der Messwerte von IVC und FEV1 wurden für die Validierung des Scores anhand der nach ICD-9 verschlüsselten Diagnosen alle Probanden ausgeschlossen, bei denen jemals eine Atemwegs- oder Lungenerkrankung diagnostiziert worden war (keine ICD-9: 160 - 165, 460 - 519). Die Berechnung von D-max wurde nur bei Probanden durchgeführt, bei denen mindestens drei Lungenfunktionsmessungen zentral gespeichert waren. Weiterhin wurden in die Validierung nur Messungen einbezogen, bei denen mindestens fünf Scorekriterien beurteilt werden konnten. Dadurch wurden Messungen von der Validierung ausgeschlossen, für die der Score aufgrund schlechter Dokumentation des Messvorganges nicht zuverlässig berechnet werden konnte.

Die Summe der Scorepunkte wurde mit D-max korreliert.

#

Statistische Analyse

Die Korrelation von D-max und Score wurde mittels Pearson-Test auf Signifikanz getestet.

#

Ethik

Die Vorschriften des Datenschutzes sind bei der Durchführung der Studie eingehalten worden.

Die Untersuchung wurde durch den Hauptverband der gewerblichen Berufsgenossenschaften finanziert.

#

Ergebnisse

#

Beachtung von Qualitätskriterien

Ausgewertet wurden 417 spirometrische Messkurven von 93 Ärzten, das bedeutet, dass 90 % der angeschriebenen Ärzte Messkurven übersandt haben. Wegen unterschiedlicher Kurvendarstellung (Fluss-Volumen- oder Volumen-Zeit-Kurven) und unterschiedlicher Dokumentation von weiteren Parametern (Kalibrierungsdatum, Nennung der Referenzwertformel, von Alter, Größe und Gewicht) konnten nicht immer alle Qualitätskriterien Berücksichtigung finden. In 9 Fällen lag keine dokumentierte grafische Aufzeichnung der Messkurve vor, hier waren die Messungen lediglich in Form von Zahlenwerten dokumentiert.

Bei Betrachtung der einzelnen Qualitätskriterien fällt insbesondere auf, dass nur bei 25 Messungen wenigstens drei Messmanöver dokumentiert wurden. Aussagen über die Reproduzierbarkeit waren daher nur in wenigen Fällen möglich (Tab. [2]).

Tab. 2 Grad der Erfüllung des Kriteriums. „Dokumentierter” Messwert: Messwert, der bei der nachgehenden Untersuchung an die zentral erfassende Stelle mitgeteilt wurde.
ScoreparameterAnzahl ausgewerteter MessungenErfüllung
(n = Anzahl; Prozent
Angaben beziehen sich auf alle auswertbaren Kurven)
Anwendung von ATS-Kriterien Anwendung ist auf dem Ausdruck erkennbar:
1 Punkt
417 4 (1,0 %)
Messparameter:
IVC, FVC, FEV1, PEF, MEF72 - 25
nicht ausgewertet
berücksichtigt werden die Maximalwerte dokumentierte Messwerte, IVC ist der Maximalwert von VC:
1 Punkt
417270 (64,7 %)
dokumentierter Messwert der IVC > dokumentierter Messwert FEV1:
1 Punkt
417407 (97,6 %)
Ausdruck von drei Messkurven Anzahl der Messkurven > = 3 : 1 Punkt417 25 (6,0 %)
Darstellung der „Hüllkurve” nicht ausgewertet
Referenzwertformel muss erkennbar sein 417239 (58,7 %)
(volumetrische) Kalibrierung Zeitpunkt der Kalibrierung in den letzten 7 Tagen vor Messzeitpunkt:
1 Punkt
113 30 (26,5 %)
Kurvenform Kurvenform ist gut
1 Punkt
408 1) 147 (36,0)
Beginn des Messmanövers rückextrapoliertes Volumen < 5 % FEV1 oder 0,15 L oder Zeit < 120 ms:
1 Punkt
261187 (71,6 %)
Messwertabweichung muss erkennbar sein (VC, FEV1 < 5 %) Messwertabweichung
VC < 5 %
(nicht berücksichtigt)
54 35 (64,8 %)
Messwertabweichung
FEV1 < 5 %
(nicht berücksichtigt)
Messwertabweichung muss erkennbar sein (FVC, FEV1 < 0,2 L) Messwertabweichung
FEV1 < 0,2 L:
1 Punkt
23 14 (61,9 %)
Messwertabweichung
VC < 0,2 L:
1 Punkt
23 10 (43,5 %)
Ende des Atemmanövers Dauer des Atemmanövers mindestens 6 Sek. oder bis Plateau:
1 Punkt
253119 (47 %)
Alter keine Abweichung bei Altersangabe:
1 Punkt
325321 (98,8 %)
Größe keine Abweichung bei Größenangabe:
1 Punkt
318306 (96,2 %)
Gewicht keine Abweichung bei Gewichtsangabe:
1 Punkt
161152 (94,4 %)
Obstruktion aufgrund der Messdokumentation (Kurve + Messwerte) ist Aussage über Atemwegsobstruktion möglich:
1 Punkt
417268 (64,4 %)
Beurteilung der Messung Messung enthält keine groben Auffälligkeiten, weshalb sie für eine wissenschaftliche Auswertung geeignet wäre:
1 Punkt
417 38 (9,1 %)
1) In den übrigen Fällen (n = 9) lag keine dokumentierte analoge Aufzeichnung der Lungenfunktionsmesskurve vor
HVBG: Hauptverband der gewerblichen Berufsgenossenschaften
DAL: Deutsche Atemwegsliga
DGAUM: Deutsche Gesellschaft für Arbeitsmedizin und Umweltmedizin

Zu selten wurde auch eine am Messtag durchgeführte Kalibrierung dokumentiert (2,5 %). Bei 111 Fällen ausgewerteten Messungen erfolgte die Kalibrierung am gleichen Tag in 10 Fällen und innerhalb eines Monats vor der Messung in 30 Fällen. Der maximale Abstand zum Messdatum betrug 465 Tage.

Die Kurvenform wurde retrospektiv nur in 147 Fällen als „gut” bewertet.

Die Umsetzung aller in den Empfehlungen geforderten Qualitätskriterien konnte bei Benutzung der Empfehlungen der Deutschen Atemwegsliga bei 25 von 417 Lungenfunktionsmessungen, bei Benutzung der Empfehlungen des HVBG bei 17 Messungen und bei Benutzung der Leitlinie der DGAUM bei einer Messung bestätigt werden.

Wesentliche Folge der Nichtbeachtung von Qualitätskriterien ist eine nur sehr begrenzte Validität der Messungen. Hieraus resultiert eine erhebliche Schwankungsbreite von Lungenfunktionsmesswerten im zeitlichen Verlauf bei Lungengesunden (Abb. [1]).

Zoom Image

Abb. 1 Ergebnisse von Lungenfunktionsmessungen bei 5 Probanden (a - e) im zeitlichen Verlauf. Aufgetragen wurden die einzelnen Messwerte von IVC und FEV1 sowie die zugehörigen mittleren VC und FEV1-Sollwerte (Ordinate: Mess- und Sollwerte in Litern, Abszisse: Zeit).

#

Score

Abb. [2] zeigt die Häufigkeitsverteilung des Scores bei den Ärzten, welche Messprotokolle zur Auswertung zur Verfügung gestellt haben. Über alle Ärzte gemittelt errechnet sich ein Score von 0,52 (Standardabweichung: 0,10). Der maximal erreichbare Wert wäre 1,0.

Zoom Image

Abb. 2 Häufigkeitsverteilung des Scores.

Die Auswertung des Scores zeigt somit einen mittleren Wert, was mit der Beurteilung der Umsetzung einzelner Qualitätskriterien übereinstimmt.

#

Validierung des Scores

Zur Validierung des Scores konnten unter den im Methodikteil beschriebenen Voraussetzungen lediglich 18 Einzelmessungen von Lungengesunden herangezogen werden. Die Berechnung der Korrelation zwischen dem Score und D-max ergab einen Wert von - 0,629 (p = 0,01) (Abb. [3]). Hohe Punktzahlen im Score korrelieren somit statistisch signifikant mit einer hohen Reproduzierbarkeit von Messergebnissen im zeitlichen Verlauf.

Zoom Image

Abb. 3 Korrelation zwischen Score und D-max.

#

Diskussion

Die Verbesserung der Effizienz medizinischer Leistungen setzt die Bestimmung der „Qualität” medizinischer Leistungen voraus [18]. Scores sind zwar vornehmlich aus der prognostischen Bewertung von klinischen Befunden bekannt [11] [12], sie können aber auch im Rahmen der Qualitätssicherung eingesetzt werden, wenn deskriptive Daten zusammengefasst und verglichen werden sollen [10].

Stoller u. Mitarb. 1997 haben Scores zur Beurteilung der Qualität von Lungenfunktionsmesskurven eingesetzt [16]. Diese Arbeitsgruppe hatte Scores aus Leitlinien hergleitet. In dieser prospektiven Studie waren den beteiligten Untersuchern die spätere Qualitätsevaluation vor der Durchführung der Messungen bekannt. Die Untersucher waren darüber hinaus speziell geschult worden. Bei den Probanden handelte es sich um Emphysempatienten mit gesichertem α1-Antitrypsinmangel, bei denen gute Erfahrung mit der Lungenfunktionsanalyse unterstellt werden kann. Im Gegensatz zu dieser Arbeitsgruppe wurden von uns Spirogramme retrospektiv ausgewertet, wobei den Untersuchern zum Zeitpunkt der Durchführung der Untersuchung die spätere Verwendung der Messprotokolle im Rahmen einer Evaluation nicht bekannt war. Das hier vorgelegte zweischrittige Studiendesign (Score-Generierung, Score-Anwendung) beschreibt daher die Qualität der Lungenfunktionsmessung in der alltäglichen Routine und nicht unter besonders gestalteten Studienbedingungen.

Zur Generierung von Scores sind zwei Ansätze möglich: Einerseits können die Kriterien durch Experten ausgewählt und hinsichtlich ihrer Bedeutung gewichtet werden, andererseits kann eine multivariate Analyse zu Erkennung der einzelnen Scorebestandteile und ihrer Gewichtung erfolgen. Bei beiden Ansätzen kann auf eine Validierung des entwickelten Scores mit einem möglichst unabhängigen Datensatz nicht verzichtet werden [9].

In unserem Fall lag Expertenwissen in Form verschiedener Empfehlungen zur Durchführung von Lungenfunktionsmessungen vor [2] [3] [7], woraus die einzelnen Qualitätskriterien abgleitet werden konnten. Ergänzend wurden weitere Faktoren berücksichtigt, die indirekt einen Hinweis auf die Struktur- und Prozessqualität bei der Durchführung der Lungenfunktionsmessung geben. Interessant erschien z. B. die Frage, ob die Größe aktuell vor der Lungenfunktionsmessung gemessen oder der Proband nur nach seiner Größe gefragt wird, da die korrekte Berücksichtigung von Alter und Größe für die Berechnung der Sollwerte von Bedeutung ist. In einem geringen Prozentsatz mussten bei diesen Daten Unterschiede zwischen den Befunden der körperlichen Untersuchung und den für die Berechnung der Lungenfunktionsreferenzwerte festgestellt werden, was den Rückschluss auf eine nicht optimale Prozessqualität in den entsprechenden Untersuchungszentren zulässt.

Probleme bereitete die Definition des Zielparameters „gute Lungenfunktionsmessung”. Während vielfach Scores eine Aussage über einen eindeutig definierten Zielparameter ermöglichen (z. B.: Mortalität unter Behandlung], ist die Definition einer „guten” Lungenfunktionsmessung vergleichsweise schwierig. Die Anwendung von Referenzwertformeln und der Vergleich zwischen Sollwerten und Messwerten kommen wegen individuell hochnormaler Lungenfunktionsmesswerte nicht in Betracht. In unserem Fall konnte stattdessen auf mehrere Lungenfunktionsmessungen aus vergangenen Jahren zurückgegriffen werden, weshalb sich ein intraindividueller Vergleich der Messdaten anbot. Aus dem Vergleich zwischen den maximal gemessenen Werten von IVC und FEV1 und den Messwerten aus dem aktuell vorliegenden Spirogramm konnte der Zielparameter „D-max” gewonnen werden.

Dieses Vorgehen impliziert als Fehler die mit dem physiologischen Alterungsprozess erklärbare Reduktion der Volumina von bis zu 50 ml pro Jahr. Bei unseren Auswertungen waren die Messschwankungen aber so groß, dass die physiologische Volumenreduktion demgegenüber nicht ins Gewicht fiel.

Als wesentliches Ergebnis der Studie konnte ein Score auf Grundlage der Leitlinien generiert werden. Die Validität des Scores wurde statistisch nachgewiesen.

Die Auswertung des Scores, aber auch von einzelnen Qualitätskriterien, zeigt, dass Verbesserungsmöglichkeiten der Messqualität gegeben sind. Diese betreffen insbesondere die Zahl durchgeführter und dokumentierter Messmanöver, aus der eine fehlende Kenntnis über die tatsächlichen Maximalwerte der gemessenen Parameter resultiert. Die im zeitlichen Verlauf deutlichen Schwankungen der Lungenfunktionsmesswerte werden hierdurch erklärt (Abb. [1]). Unbefriedigend ist auch die sehr geringe Zahl von nur 10 Messungen, die mit Lungenfunktionsmessgeräten durchgeführt wurden, die auch am gleichen Tag geeicht worden waren.

Untersuchungen zur Qualität von Lungenfunktionsmessungen liegen aus Deutschland bisher nicht vor. Ausländische Studien wurden nur vereinzelt durchgeführt [4] [5] [6] [8] [14] [15] [16] [17]. Diese Studien basieren auf unterschiedlichen methodische Ansätzen (u. a. Messung von Testpersonen, Befragungen der Ärzte). Trotz unterschiedlicher Vorgehensweise mussten in allen uns bekannten Studien jedoch übereinstimmend Qualitätsdefizite festgestellt werden (Tab. [3]).

Tab. 3 Übersicht über Studien, in denen die Qualität von Lungenfunktionsmessungen evaluiert worden ist
QuelleMethodeErgebnisAnmerkung
Mushtaq u. Mitarb. 1995 - Messung von 3 Probanden in 22 Lungenfunktionslaboratorien
- ergänzender Fragebogen
- Berechnung von Referenzwerten aus vorgegebenen Daten in allen 22 Laboratorien
- signifikante Unterschiede der Messergebnisse der drei Probanden (p < 0,05)
- signifikante Unterschiede bei der Berechnung der Referenzwerte (p < 0,05)
- Unterschiede in der Durchführung der Messung
Dowson u. Mitarb. 1998 - Messung der gleichen 3 Probanden in 22 Lungenfunktionslaboratorien
- Berechnung von Referenzwerten aus vorgegebenen Daten in allen 22 Laboratorien
- bessere Messung von FEV1 und VC
- weiterhin signifikante Messwertunterschiede
- erneute Evaluation der 22 Laboratorien nach Beratung und Training der Untersucher
- wegen des unzufriedenstellenden Ergebnisses geben die Autoren Empfehlung zum regelmäßigen Audit
Stoller u. Mitarb. 1997 - 1129 Patienten mit α1-Antitrypsinmangel
- 37 Untersuchungszentren
- Spirometrie vor und nach Bronchodilatation
- Untersucher und Probanden waren über Teilnahme an Evaluation informiert
- Training für Untersucher
- ATS-Kriterien wurde eingehalten
- Reproduzierbarkeit von FEV1 95 %
- 48 % der Zentren konnten in 90 % der Fälle reproduzierbare Messkurven darstellen
- Hauptproblem: Erreichen des Kriteriums für Testende
- die Studie wurde unter besonders günstigen Umständen durchgeführt
- die Studie belegt die gute Reproduzierbarkeit auch spirometrischer Messungen
- keine Aussage über Langzeitverlauf der Lungenfunktion möglich
Schuldheisz u. Mitarb. 1998 - Einsatz eines Fragebogens
- 200 zufällig ausgewählte Mitglieder der American Thoracic Society
- Rücklauf: 102 Antworten
- eine „signifikante” Minderheit weicht von den quantitativen Kriterien der Akzeptabilität von Lungenfunktionsmesskurven ab
Dowson u. Mitarb. 1999 - Telefoninterview
- 95 Praxen
- 224 Allgemeinärzte
- nur 2 (von 10) Untersuchern waren trainiert worden
- von 3 Untersuchern wusste keiner, wie ihr Pneumotachograph zu kalibrieren ist
- Autoren schließen auf eine geringe Validität der Spirometrien
Eaton u. Mitarb. 1999 - randomisierte prospektive Studie
- 30 hausärztliche Praxen
- Gruppe 1: Arzt und Assistentin wurden trainiert;
- Gruppe 2: kein Training
- Auswertung von Spirometrien nach ATS-Kriterien
- Akzeptabilität und Reproduzierbarkeit signifikant besser in trainierter Gruppe (p < 0,0001)
- Trainingseffekt wurde belegt
- insgesamt aber noch Mängel in der Umsetzung der ATS-Kriterien, insbesondere Testende-Kriterien
Valentini u. Mitarb. 2001 - 734 Lungenfunktionsmessungen
- Auswertung anhand von Qualitätskriterien
- zu niedrige Messung von FEV1 in 64,2 % und von FVC in 85,8 %
- 12,3 % der Spirometrien wurden von den Untersuchern fälschlich auffällig bezeichnet
Piirilä u. Mitarb. 2002 - Fragebogen
- Umsetzung in Score
- n = 637 Bogen; davon 203 vollständig ausgefüllt
- mittlerer Score = 67 (maximal: 100)
- Hauptprobleme: Vorbereitung des Patienten, Durchführung der Messung, Erkennen einer auswertbaren Messung, Kontrolle von Akzeptabilität und Reproduzierbarkeit
- Autoren stellen eine Qualitätssteigerung im Vergleich zu einer 10 Jahre früheren Studie fest
- sie empfehlen regelmäßiges Training für Arzte und Assistenzpersonal

Der Vorteil eines Scores liegt in der Möglichkeit einer Vergleichbarkeit mit zukünftigen Untersuchungen. Aufgrund der Literatur wurde ein ähnlicher Evaluationsansatz unter Verwendung eines Scores von Piirilä u. Mitarb. (2002) gewählt [14]. Abweichend stützt sich diese Arbeitsgruppe aber auf eine Befragung der Ärzte und zieht andere Parameter mit in den Score ein. Lungenfunktionsmessprotokolle beurteilen sie in der hier präsentierten Weise im Sinne einer Ergebnisqualität nicht, vielmehr beurteilen sie Struktur- und Prozessqualität. Daher ist auch das Ergebnis nicht vergleichbar.

Insgesamt wird somit ein Ansatz für eine Evaluation von Lungenfunktionsmesskurven vorgestellt. Es kann aufgrund dieser erstmaligen Evaluation zur Qualität von spirometrischen Lungenfunktionsmessungen ein Handlungsbedarf zur Verbesserung der Qualität abgeleitet werden. Vordringlich scheint dabei eine intensivierte Sensibilisierung der Ärzte. Unzureichende Qualität bedeutet, dass Erkrankungen falsch oder zu spät diagnostiziert werden. Hieraus resultieren nicht erforderliche Behandlungsmaßnahmen mit uneffektiver Nutzung der Ressourcen des Gesundheitssystems und vermeidbare psychische Belastungen der vermeintlichen Patienten. Auch zukünftig sind daher Beurteilungen der Lungenfunktionsqualität erforderlich. Hierzu erscheint die Anwendung des Scores auch in prospektiven Untersuchungen sinnvoll.

#

Literatur

  • 1 Chan-Yeung M. Spirometry and tests of bronchial hyperresponsiveness in population studies.  Int J Tuberc Lung Dis. 2000;  4 633-638
  • 2 Deutsche Atemwegsliga . Durchführung von Lungenfunktionsprüfungen in der Praxis.  Pneumologie. 1994;  48 292-295
  • 3 Deutsche Gesellschaft für Arbeits- und Umweltmedizin .Leitlinie: Lungenfunktionsprüfungen in der Arbeitsmedizin. www.dgaum.de. 2002
  • 4 Dowson L J, Mushtaq M, Watts T. et al . A re-audit of pulmonary function laboratories in the West Midlands.  Respir Med. 1998;  92 1155-1162
  • 5 Dowson L J, Yeung A, Allen M B. General practice spirometry in North Staffordshire.  Monaldi Arch Chest Dis. 1999;  54 186-188
  • 6 Eaton T, Withy S, Garrett J E. et al . Spirometry in primary care practice: the importance of quality assurance and the impact of spirometry workshops.  Chest. 1999;  116 416-423
  • 7 Hauptverband der gewerblichen Berufsgenossenschaften .Anhang 1: Leitfaden für die LUNGENFUNKTIONSPRÜFUNG bei arbeitsmedizinischen Vorsorgeuntersuchungen nach Berufsgenossenschaftlichen Grundsätzen. In: Hauptverband der gewerblichen Berufsgenossenschaften (Hrsg.): Berufsgenossenschaftliche Grundsätze für spezielle arbeitsmedizinische Untersuchungen. Stuttgart: Gentner Verlag 1994: 639-651
  • 8 Mushtaq M, Hayton R, Watts T. et al . An audit of pulmonary function laboratories in the West Midlands.  Respir Med. 1995;  89 263-270
  • 9 Ohmann C. Preoperative prediction of peri- and postoperative complications: criteria for statistical evaluation of predictive systems.  Theor Surg. 1991;  6 3-18
  • 10 Ohmann C. Qualitätssicherung aus theoretischer Sicht.  Chirurg. 1995;  66 657-664
  • 11 Ohmann C, Groß-Weege W. Scoring-Systeme auf der chirurgischen Intensivstation.  I. Chirurg. 1992;  63 1021-1028
  • 12 Ohmann C, Groß-Weege W. Scoring-Systeme auf der chirurgischen Intensivstation.  II. Chirurg. 1993;  64 21-27
  • 13 Otten H, Perlebach E, Piekarski C. et al . Die Betreuung der ehemaligen Arbeitnehmer im Uranerzbergbau Wismut.  Berufsgenossenschaft. 1999 [Mai];  285-290
  • 14 Piirila P, Pietinalho A, Loponen M. et al . The quality of spirometric examinations in Finland: results from a national questionnaire survey.  Clin Physiol Func Im. 2002;  22 233-239
  • 15 Schuldheisz S, Phillips B A, Berry D T. Pulmonary function testing: detection of invalid performance.  J Ky Med Assoc. 1998;  96 183-185
  • 16 Stoller J K, Buist S, Burrows B. et al . Quality control of spirometric testing in the registry for patients with severe α-1-antitrypsin defiency.  Chest. 1997;  111 899-909
  • 17 Valenti E, Manzari G, De Angelis V. et al . Quality control of spirometric tests used in health surveillance for occupational exposure risk in the province of Viterbo.  Med Lav. 2001;  92 5-11
  • 18 Zorn U, Ollenschläger G. Qualitätsbestimmung in der medizinischen Versorgung - ein universelles Entwicklungsinstrument für Qualitätsindikatoren.  Zschr ärztl Fortbild Qualsicherung. 1999;  93 123-128

Dr. med. Olaf Hagemeyer

Hauptverband der gewerblichen Berufsgenossenschaften

Alte Heerstr. 111

53754 Sankt Augustin

Email: olaf.hagemeyer@hvbg.de

#

Literatur

  • 1 Chan-Yeung M. Spirometry and tests of bronchial hyperresponsiveness in population studies.  Int J Tuberc Lung Dis. 2000;  4 633-638
  • 2 Deutsche Atemwegsliga . Durchführung von Lungenfunktionsprüfungen in der Praxis.  Pneumologie. 1994;  48 292-295
  • 3 Deutsche Gesellschaft für Arbeits- und Umweltmedizin .Leitlinie: Lungenfunktionsprüfungen in der Arbeitsmedizin. www.dgaum.de. 2002
  • 4 Dowson L J, Mushtaq M, Watts T. et al . A re-audit of pulmonary function laboratories in the West Midlands.  Respir Med. 1998;  92 1155-1162
  • 5 Dowson L J, Yeung A, Allen M B. General practice spirometry in North Staffordshire.  Monaldi Arch Chest Dis. 1999;  54 186-188
  • 6 Eaton T, Withy S, Garrett J E. et al . Spirometry in primary care practice: the importance of quality assurance and the impact of spirometry workshops.  Chest. 1999;  116 416-423
  • 7 Hauptverband der gewerblichen Berufsgenossenschaften .Anhang 1: Leitfaden für die LUNGENFUNKTIONSPRÜFUNG bei arbeitsmedizinischen Vorsorgeuntersuchungen nach Berufsgenossenschaftlichen Grundsätzen. In: Hauptverband der gewerblichen Berufsgenossenschaften (Hrsg.): Berufsgenossenschaftliche Grundsätze für spezielle arbeitsmedizinische Untersuchungen. Stuttgart: Gentner Verlag 1994: 639-651
  • 8 Mushtaq M, Hayton R, Watts T. et al . An audit of pulmonary function laboratories in the West Midlands.  Respir Med. 1995;  89 263-270
  • 9 Ohmann C. Preoperative prediction of peri- and postoperative complications: criteria for statistical evaluation of predictive systems.  Theor Surg. 1991;  6 3-18
  • 10 Ohmann C. Qualitätssicherung aus theoretischer Sicht.  Chirurg. 1995;  66 657-664
  • 11 Ohmann C, Groß-Weege W. Scoring-Systeme auf der chirurgischen Intensivstation.  I. Chirurg. 1992;  63 1021-1028
  • 12 Ohmann C, Groß-Weege W. Scoring-Systeme auf der chirurgischen Intensivstation.  II. Chirurg. 1993;  64 21-27
  • 13 Otten H, Perlebach E, Piekarski C. et al . Die Betreuung der ehemaligen Arbeitnehmer im Uranerzbergbau Wismut.  Berufsgenossenschaft. 1999 [Mai];  285-290
  • 14 Piirila P, Pietinalho A, Loponen M. et al . The quality of spirometric examinations in Finland: results from a national questionnaire survey.  Clin Physiol Func Im. 2002;  22 233-239
  • 15 Schuldheisz S, Phillips B A, Berry D T. Pulmonary function testing: detection of invalid performance.  J Ky Med Assoc. 1998;  96 183-185
  • 16 Stoller J K, Buist S, Burrows B. et al . Quality control of spirometric testing in the registry for patients with severe α-1-antitrypsin defiency.  Chest. 1997;  111 899-909
  • 17 Valenti E, Manzari G, De Angelis V. et al . Quality control of spirometric tests used in health surveillance for occupational exposure risk in the province of Viterbo.  Med Lav. 2001;  92 5-11
  • 18 Zorn U, Ollenschläger G. Qualitätsbestimmung in der medizinischen Versorgung - ein universelles Entwicklungsinstrument für Qualitätsindikatoren.  Zschr ärztl Fortbild Qualsicherung. 1999;  93 123-128

Dr. med. Olaf Hagemeyer

Hauptverband der gewerblichen Berufsgenossenschaften

Alte Heerstr. 111

53754 Sankt Augustin

Email: olaf.hagemeyer@hvbg.de

Zoom Image

Abb. 1 Ergebnisse von Lungenfunktionsmessungen bei 5 Probanden (a - e) im zeitlichen Verlauf. Aufgetragen wurden die einzelnen Messwerte von IVC und FEV1 sowie die zugehörigen mittleren VC und FEV1-Sollwerte (Ordinate: Mess- und Sollwerte in Litern, Abszisse: Zeit).

Zoom Image

Abb. 2 Häufigkeitsverteilung des Scores.

Zoom Image

Abb. 3 Korrelation zwischen Score und D-max.