Einleitung
Einleitung
Die Positronen-Emissions-Tomographie mit dem Zuckerstoffwechselmarker Fluordesoxyglukose
(FDG-PET) erlaubt gegenüber den morphologischen Schnittbildverfahren wie Computertomographie
(CT) oder Kernspintomographie (KST) eine funktionelle Charakterisierung von Gewebe.
In der onkologischen Diagnostik ermöglicht diese In-vivo-Abbildung des Glukose-Metabolismus
die Dignitätsbeurteilung und Ausbreitungsdiagnostik bei Malignomen mit erhöhter Glykolyse
[1 ]. Beim Bronchialkarzinom wird die FDG-PET-Untersuchung unter den Fragestellungen
Dignitätsbeurteilung, N- und M-Staging, Restaging und Rezidivdiagnostik eingesetzt
[2 ].
Da die Einführung einer neuen bildgebenden Modalität der kritischen Bewertung bedarf,
insbesondere angesichts der Finanzsituation im Gesundheitssystem, wurden bereits durch
zwei interdisziplinäre Konsensuskonferenzen Empfehlungen zu den Indikationsbereichen
der FDG-PET erarbeitet und publiziert [3 ]
[4 ].
Seit der letzten Bearbeitung 1997 wurden zahlreiche Studien zur Anwendung der FDG-PET
bei onkologischen Fragestellungen veröffentlicht. Für die aktuelle Überarbeitung der
Empfehlungen wurden organbezogene Arbeitsgruppen mit Experten aus den zugehörigen
Fachgebieten gebildet. Die vorliegende Arbeit stellt die Metaanalyse der Primärliteratur
zur diagnostischen Genauigkeit der FDG-PET bei Lungenveränderungen und Bronchialkarzinomen
dar, die von der Arbeitsgruppe „Lunge” betrachtet wurden.
Material und Methoden
Material und Methoden
Einteilung in Indikationsbereiche
Bei der Abklärung des Verdachtes auf Bronchialkarzinom ergeben sich mehrere Fragestellungen
[5 ]
[6 ], unter denen FDG-PET eingesetzt werden kann (Tab. [1 ]). Für diese Indikationen sollte die vorhandene Literatur zusammengetragen werden.
Tab. 1 Mögliche Indikationen der FDG-PET-Untersuchung bei Lungentumoren
Dignitätsklärung pulmonaler Raumforderungen
Lymphknoten-Staging des nicht-kleinzelligen Bronchialkarzinoms
Fernmetastasen-Staging des Bronchialkarzinoms
Rezidivdiagnostik des Bronchialkarzinoms
Bestrahlungsplanung/Therapiemonitoring/Restaging
Prognoseabschätzung
Literaturrecherche
Als Grundlage für die weitere Analyse wurden ausschließlich Originalarbeiten in deutsch-
oder englischsprachigen Zeitschriften mit „peer review” aus dem Zeitraum 1985 - 1999
herangezogen. Dazu diente eine MEDLINE-Recherche nach dem folgenden Abfrage-Algorithmus:
(lung neoplasms OR bronchogenic carcinoma OR NSCLC OR lung cancer OR mediastinal OR
intrathoracic OR thoracic OR pleural OR mesothelioma OR pulmonary) AND (positron emission
tomography OR PET OR FDG OR fluorodeoxyglucose) AND (sensitivity OR specificity OR
accuracy OR predictive) AND (PY > 1984 AND PY < 2000).
Fallberichte, technische Mitteilungen, methodisch inakzeptabel durchgeführte Studien,
nicht themenbezogene Literatur und Übersichtsarbeiten ohne eigene Primärdaten wurden
von der weiteren Analyse ausgeschlossen. Bei mehreren Publikationen einer Arbeitsgruppe
über das gleiche Patientenkollektiv wurde die Arbeit mit dem umfangreichsten Patientenkollektiv
in die Analyse einbezogen.
Die Originalarbeiten wurden an alle Mitglieder der Arbeitsgruppe zwecks weiterer Auswahl
und kritischer Prüfung der Güte der Arbeit verschickt. Die Literaturverweise der gefundenen
Arbeiten wurden auf eventuell entgangene Referenzen geprüft.
Die Güte der Arbeiten wurde in einer vierstufigen Skala [7 ] für jeden Indikationsbereich beurteilt und im Konsens eingestuft. Die Experten der
Arbeitsgruppe aus den verschiedenen Disziplinen achteten bei der Analyse der Primärliteratur
insbesondere auf adäquate, dem technischen Stand entsprechende, reproduzierbar beschriebene
Methodik und Auswertung der Studien. Insbesondere wurden an SPECT-Systemen und Koinzidenz-Gammakameras
durchgeführte Untersuchungen nicht als methodisch ausreichend betrachtet. Nur Arbeiten
mit Bewertungen aus den beiden höchstwertigen Kategorien wurden analysiert.
Primärdatenanalyse
Aus den in den Originalarbeiten publizierten Angaben wurden die Vierfeldertafeln mit
den Anzahlen richtig positiver (RP), falsch negativer (FN), richtig negativer (RN)
und falsch positiver (FP) Fälle rekonstruiert. Sofern für Subkollektive unterschiedliche
Daten berichtet waren, wurden mehrere Vierfeldertafeln erstellt (z. B. für qualitative
und quantitative Auswertung der PET-Untersuchung). In einigen Arbeiten fanden sich
widersprüchliche Angaben, die zu Inkonsistenzen bei den Vierfeldertafeln führten und
damit den Ausschluss der Arbeit von der weiteren Analyse zur Folge hatten.
Da in einigen älteren Arbeiten Karzinoide als benigne Tumore kategorisiert sind, es
sich jedoch nach WHO-Kriterien um einen malignen Tumor handelt [8 ], wurden die Vierfeldertafeln entsprechend der in den Publikationen zu findenden
Angaben über das Speicherverhalten des FDG in den untersuchten Karzinoiden korrigiert.
Waren in Publikationen Karzinoide bei Patienten erwähnt, jedoch nicht das Speicherverhalten
beschrieben, wurde die Arbeit wegen der nicht zu korrigierenden Vierfeldertafel von
der weiteren Analyse ausgeschlossen. Dieses Vorgehen war erforderlich wegen der bekannten
geringen Anreicherung von FDG in Karzinoiden [9 ], und weil sowohl Ausschluss als auch unkorrigierte Verwendung bei der Analyse zu
systematischen Fehlern zugunsten der FDG-PET-Diagnostik geführt hätten.
Nach Nullkorrektur wurden für die einzelnen Vierfeldertafeln die statistischen Testparameter
folgendermaßen berechnet: Sensitivität: RP/(RP+FN), Spezifität: RN/(RN+FP), diagnostische
Genauigkeit: (RP+RN)/(RP+FN+RN+FP), negativer prädiktiver Wert: RN/(RN+FN), positiver
prädiktiver Wert: RP/ (RP+FP). Kumulative statistische Testparameter wurden entsprechend
aus summierten Vierfeldertafeln berechnet. Konfidenz-Intervalle für Proportionen wurden
als Poisson- oder normalverteilte Näherung der Binomialverteilung angegeben, z. B.
95 %-Konfidenzintervall (Sensitivität): Sensitivität ± 1,96 × Quadratwurzel (Sensitivität
× (1-Sensitivität)/[Richtig Positive]).
Methodik der Meta-Analyse
„Summary receiver operating characteristic”-Kurven (sROC-Kurven) wurden nach der logistic-transform-Methode
von Littenberg und Moses [10 ] berechnet. Wie bei konventionellen ROC-Kurven zeigt eine graphisch mit ihrer Schulter
näher in der linken oberen Ecke liegende sROC-Kurve eine höhere diagnostische Aussagekraft
an. Der Vergleich verschiedener diagnostischer Verfahren erfolgte über die Steigungen
der sROC-Kurven [11 ].
Zusammenstellung der Arbeiten zum M-Staging
Zielgrößen waren die Häufigkeiten unerwarteter extrathorakaler Metastasen sowie einer
Änderung des therapeutischen Vorgehens durch die FDG-PET-Untersuchung. Ferner sollte
die Testgenauigkeit der Metastasenerfassung analysiert werden. Dazu wurden gegebenenfalls
mehrere Vierfeldertafeln aus einer Arbeit gewonnen, z. B. für die Metastasendarstellung
insgesamt sowie organbezogen wie etwa für Nebennieren-Metastasen.
Ergebnisse
Ergebnisse
173 Arbeiten wurden durch die MEDLINE-Abfrage gefunden. Es handelte sich um 143 themenbezogene
Literaturstellen. Bei erster Sichtung erwies sich der Ausschluss von 47 Arbeiten als
erforderlich (29 Übersichtsarbeiten, 8 Fallberichte, 9 technische Mitteilungen oder
methodisch unzureichende Arbeiten, 1 nicht englisch oder deutsch verfasst). 96 Originalarbeiten
wurden zur zweiten Sichtung verschickt. Nach Bewertung durch die Experten der verschiedenen
Fachgebiete verblieben für die verschiedenen Indikationsgebiete zur Analyse akzeptierte
und auswertbare Originalarbeiten in folgendem Umfang: Dignitätsbeurteilung: 18; N-Staging:
20; M-Staging: 13; Rezidiv: 4; Bestrahlungsplanung/Therapiemonitoring/ Restaging:
6; Prognose: 9.
Dignitätsbeurteilung pulmonaler Raumforderungen
Für die Analyse der Aussagekraft bei der Beurteilung der Dignität von Lungenveränderungen
wurden 18 Originalarbeiten aus 1993 - 1999 zur Analyse akzeptiert und waren auswertbar
[12 ]
[13 ]
[14 ]
[15 ]
[16 ]
[17 ]
[18 ]
[19 ]
[20 ]
[21 ]
[22 ]
[23 ]
[24 ]
[25 ]
[26 ]
[27 ]
[28 ]
[29 ]. Die Vierfeldertafeln von drei Arbeiten wurden auf die Malignität von Karzinoiden
korrigiert [14 ]
[16 ]
[17 ]. Eine Arbeit war nicht verwertbar wegen der nicht zu korrigierenden Vierfeldertafel
[30 ].
Das mittlere Alter der Studienpatienten lag bei 62 Jahren, der Anteil männlicher Patienten
bei 72 %. Die mittlere Prävalenz von Malignomen betrug 68 %. Die Ergebnisse der einzelnen
Studien enthält Tab. [2 ]. Über die Angaben in den Publikationen konnten für einzelne Studien mehrere Vierfeldertafeln
rekonstruiert werden, z. B. für quantitative und qualitative Auswertung oder für das
Gesamtkollektiv mit allen Formen pulmonaler Raumforderungen sowie für Subkollektive
mit solitären pulmonalen Herden.
Falsch positive Befunde waren am häufigsten bedingt durch Entzündungen, granulomatöse
Erkankungen und Infektionen (wie Tuberkulose, Histoplasmose, Silikose), seltener durch
gutartige Tumoren (Chondrohamartome, Schwannome, Fibrome) mit im Einzelfall gesteigertem
Glukosemetabolismus. Weitaus seltener beobachtete man falsch negative Befunde bei
gut differenzierten Tumoren (meist Adeno-Karzinome), Karzinoiden, Bronchiolo-Alveolarzell-Karzinomen.
Ferner ist die Sensitivität reduziert bei kleinen Herden im Bereich des Auflösungsvermögens
(ca. 7 mm), Hyperglykämie sowie basal in der Lunge gelegenen, stark atemverschieblichen
Herden.
In Tab. [3 ] sind die Ergebnisse der durchgeführten Auswertungen für Lungenherde zusammengestellt.
Insgesamt fanden sich keine signifikanten Unterschiede in der Aussagekraft der FDG-PET-Untersuchung
zwischen den Arbeiten mit weniger bzw. mindestens 35 Fällen, zwischen retrospektiven
und prospektiven Studien sowie für solitäre pulmonale Rundherde. Man kann einen Unterschied
der sROC-Steigung zwischen der qualitativen, d. h. rein visuellen, Bewertung und der
quantitativen Auswertung der FDG-PET-Untersuchung beobachten (Abb. [1 ], Tab. [3 ]). Dieser Unterschied spiegelt sich in der Verschiebung der sROC-Kurve der quantitativen
Auswertung in Richtung höherer Spezifität wider.
Aus 15 Arbeiten mit mindestens 35 Fällen (insgesamt 1144 Fälle) berechneten sich folgende
kumulative statistische Testparameter: Sensitivität: 96 ± 1 % (95 %-Konfidenzintervall
[95 %KI]: 94 - 97 %), Spezifität: 80 ± 2 % (95 %KI: 76 - 85 %), diagnostische Genauigkeit
(Acc): 91 ± 1 % (95 %KI: 89 - 93 %), positiver prädiktiver Wert (PPV): 91 ± 1 % (95
%KI: 89 - 93 %), negativer prädiktiver Wert (NPV): 90 ± 2 % (95 %KI: 86 - 93 %).
Abb. 1 sROC-Kurven für qualitative und quantitative Auswertung der FDG-PET zur Dignitätsbeurteilung
von Lungenherden (FPR: Rate falsch-positiver Befunde, TPR: Rate richtigpositiver Befunde).
Tab. 2 Literaturdaten zur Dignitätsbeurteilung mit FDG-PET. Durch Nullkorrektur und Korrektur
auf Malignität von Karzinoiden können die hier beschriebenen Sensitivitäten und Spezifitäten
von den in den Originalarbeiten angegebenen Werten abweichen. (SPN: solitärer pulmonaler
Rundherd, MPN: multiple pulmonale Herde, MASS: pulmonale Masse.)
Erstautor
Jahr
Referenz
Fallzahl
Prävalenz
Studiendesign
Herdtypen
Auswertung
Sensitivität
Spezifität
Albes
1999
[12 ]
27
89 %
prospektiv
ALLE
qualitativ
98 %
63 %
Bury
1996
[13 ]
50
66 %
prospektiv
SPN
qualitativ
99 %
86 %
Dewan
1993
[14 ]
30
67 %
prospektiv
SPN
qualitativ
88 %
77 %
Dewan
1997
[15 ]
52
71 %
retrospektiv
SPN
qualitativ
93 %
84 %
Duhaylongsod
1995
[16 ]
47
66 %
prospektiv
SPN
quantitativ
98 %
79 %
Duhaylongsod
1995
[16 ]
87
68 %
prospektiv
SPN+MASS
quantitativ
96 %
81 %
Duhaylongsod
1995
[17 ]
53
64 %
prospektiv
SPN+MASS
quantitativ
99 %
78 %
Graeber
1999
[18 ]
96
69 %
retrospektiv
SPN+MASS
qualitativ
96 %
89 %
Guhlmann
1997
[19 ]
46
70 %
retrospektiv
ALLE
qualitativ
92 %
83 %
Gupta
1996
[20 ]
61
74 %
prospektiv
SPN
qualitativ
92 %
85 %
Gupta
1998
[21 ]
19
63 %
prospektiv
ALLE
quantitativ
96 %
94 %
Hagberg
1997
[22 ]
54
81 %
retrospektiv
SPN+MPN+MASS
qualitativ
90 %
68 %
Knight
1996
[23 ]
48
67 %
prospektiv
SPN+MASS
quantitativ
98 %
62 %
Lowe
1994
[24 ]
88
69 %
prospektiv
ALLE
qualitativ
96 %
88 %
Lowe
1997
[25 ]
197
61 %
retrospektiv
ALLE
quantitativ
95 %
76 %
Lowe
1998
[26 ]
59
51 %
prospektiv
SPN
qualitativ
95 %
68 %
Lowe
1998
[26 ]
89
67 %
prospektiv
SPN
quantitativ
91 %
88 %
Präuer
1998
[27 ]
54
57 %
prospektiv
SPN+MPN
qualitativ
89 %
81 %
Sazon
1996
[28 ]
107
77 %
prospektiv
ALLE
qualitativ
99 %
52 %
Scott
1994
[29 ]
62
76 %
retrospektiv
SPN+MASS
qualitativ
93 %
78 %
Scott
1994
[29 ]
62
76 %
retrospektiv
SPN+MASS
quantitativ
93 %
84 %
Tab. 3 Ergebnisse der Metaanalysen zur Dignitätsbeurteilung mit FDG-PET (Sens: Sensitivität,
Spez: Spezifität, Acc: Diagnostische Genauigkeit)
Analyse
Studien [Zahl]
Fallzahl
Sens
Spez
Acc
sROC-Steigung
alle Studien
18
1220
96 %
81 %
91 %
4,2
unter 35 Fälle pro Studie
3
76
96 %
83 %
92 %
4,7
mindestens 35 Fälle pro Studie
15
1144
96 %
80 %
91 %
4,1
propektive Studien
12
713
97 %
80 %
91 %
4,4
retrospektive Studien
6
507
95 %
81 %
90 %
4,7
quantitative Auswertung
7
555
96 %
80 %
90 %
4,7
qualitative Auswertung
13
786
96 %
79 %
91 %
3,8
solitäre pulmonale Rundherde
6
329
95 %
86 %
92 %
3,5
Lymphknoten-Staging des nicht-kleinzelligen Bronchialkarzinoms
20 Originalarbeiten wurden zur Analyse (Tab. [4 ]) akzeptiert [12 ]
[18 ]
[19 ]
[22 ]
[28 ]
[31 ]
[32 ]
[33 ]
[34 ]
[35 ]
[36 ]
[37 ]
[38 ]
[39 ]
[40 ]
[41 ]
[42 ]
[43 ]
[44 ]
[45 ], davon enthielten 19 Arbeiten gleichzeitig Daten über das N-Staging mittels CT.
Gegebenenfalls wurden mehrere Vierfeldertafeln aus verschiedenen Auswertungen in einer
Arbeit gewonnen. Es fanden sich in den Originalarbeiten Angaben über die alleinige
Analyse der FDG-PET oder der CT, zusätzlich Daten aus der Zusammenschau von FDG-PET
und CT sowie aus Fusionsbildern von FDG-PET und CT. Weiterhin konnte bei einigen Publikationen
zwischen Lymphknoten-orientierter und Patienten-orientierter Analyse unterschieden
werden. Ferner findet man Ergebnisse der FDG-PET bei Fehlen oder Vorliegen von Lymphknotenvergrößerungen
im CT. Neben der üblichen qualitativen Analyse geben einige Autoren Ergebnisse einer
quantitativen Auswertung an. Insgesamt konnten 63 Vierfeldertafeln rekonstruiert werden
und dienten zur Erzeugung der sROC-Kurven (Abb. [2 ]).
Die sROC-Kurven zeigen die Überlegenheit der FDG-PET-Untersuchung im Vergleich zur
CT-Untersuchung durch die nähere Lage der Kurvenschulter an der linken oberen Ecke.
Dies zeigt sich sowohl beim Vergleich aller Studien (Abb. [2a ]) als auch bei Subanalysen für Studien mit mehr als 35 Patienten (Abb. [2b ]), bei prospektiven Studien (Abb. [2c ]) und bei Studien mit substitutivem Design (Abb. [2d ]), bei denen ohne Kenntnis der CT-Untersuchung die FDG-PET-Untersuchung interpretiert
wurde. Die höhere Aussagekraft der FDG-PET-Untersuchung zeigt sich ebenso anhand des
Vergleiches der sROC-Steigungen, die stets signifikant höher sind als die entsprechenden
Werte für die CT-Untersuchung (Tab. [5 ]).
Die kumulativen Werte der statistischen Testparameter für die FDG-PET berechnen sich
aus allen 20 Arbeiten (insgesamt 1292 Fälle) folgendermaßen: Sensitivität: 88 ± 2
% (95 %KI: 85 - 91 %), Spezifität: 92 ± 1 % (95 %KI: 91 - 94 %), Acc: 91 ± 1 % (95
%KI: 89 - 93 %), PPV: 85 ± 2 % (95 %KI: 82 - 89 %), NPV: 94 ± 1 % (95 %KI: 92 - 96
%). Die entsprechenden Werte für die CT aus 19 Arbeiten mit 1268 Fällen waren: Sensitivität:
65 ± 3 % (95 %KI: 59 - 70 %), Spezifität: 76 ± 2 % (95 %KI: 73 - 80 %), Acc: 73 ±
2 % (95 %KI: 70 - 75 %), PPV: 58 ± 3 % (95 %KI: 52 - 64 %), NPV: 81 ± 2 % (95 %KI:
78 - 84 %).
Abb. 2 sROC-Kurven für das N-Staging mit CT und FDG-PET. Analysen für alle Studien (a, links
oben), für Studien mit mehr als 35 Patienten (b, rechts oben), für prospektive Studien
(c, links unten) und bei substitutivem Studiendesign (d, rechts unten). (FPR: Rate
falschpositiver Befunde, TPR: Rate richtigpositiver Befunde).
Tab. 4 Studien zum Lymphknoten-Staging mittels FDG-PET (n. b.: nicht berichtet)
Erstautor
Jahr
Referenz
Fallzahl
Herkunftsland
Studiendesign
Mittleres Alter in Jahren
Anteil Männer
Albes
1999
[12 ]
27
Deutschland
prospektiv
59
89 %
Berlangieri
1999
[31 ]
50
Australien
prospektiv
64
74 %
Bury
1997
[32 ]
66
Belgien
prospektiv
64
71 %
Chin
1995
[33 ]
30
USA
prospektiv
61
63 %
Graeber
1999
[18 ]
44
USA
retrospektiv
66
71 %
Guhlmann
1997
[19 ]
32
Deutschland
retrospektiv
57
89 %
Gupta
1999
[34 ]
44
USA
retrospektiv
n. b.
61 %
Hagberg
1997
[22 ]
18
USA
retrospektiv
63
91 %
Higashi
1998
[35 ]
22
Japan
prospektiv
66
61 %
Kernstine
1999
[36 ]
64
USA
prospektiv
65
64 %
Magnani
1999
[37 ]
28
Italien
prospektiv
63
93 %
Marom
1999
[38 ]
79
USA
prospektiv
63
58 %
Patz
1995
[39 ]
42
USA
prospektiv
57
62 %
Sazon
1996
[28 ]
32
USA
prospektiv
62
99 %
Scott
1996
[40 ]
27
USA
prospektiv
64
81 %
Steinert
1997
[41 ]
47
Schweiz
prospektiv
60
82 %
Tatsumi
1999
[42 ]
23
Japan
prospektiv
59
61 %
Valk
1995
[43 ]
76
USA
prospektiv
66
54 %
Vansteenkiste
1998
[44 ]
68
Belgien
prospektiv
64
n. b.
Wahl
1994
[45 ]
23
USA
prospektiv
64
74 %
Tab. 5 Ergebnisse der Metaanalysen zum N-Staging des Bronchialkarzinoms (Die nodal orientierte
Analyse vergleicht für einzelne Lymphknotenstationen PET bzw. CT mit dem pathologischen
Befund, während die patientenorientierte Analyse das mittels PET oder CT ermittelte
N-Stadium dem pathologischen N-Stadium gegenüberstellt. Die Analyse „N0/N+” ist patientenorientiert
und gruppiert in einerseits N0-Stadium und andererseits N1-, N2- oder N3-Stadium.
Sens: Sensitivität, Spez: Spezifität, Acc: diagnostische Genauigkeit, LK: Lymphknoten.)
Analyse
Studien (Zahl)
Lymphknoten/Fallzahl
Sens
Spez
Acc
sROC-Steigung
PET: alle Studien
20
1292
88 %
92 %
91 %
4,3
CT: alle Studien
19
1268
65 %
77 %
73 %
1,6
PET: prospektiv
16
1005
87 %
92 %
90 %
4,0
CT: prospektiv
15
981
66 %
80 %
76 %
1,7
PET: retrospektiv
4
287
90 %
95 %
93 %
5,5
CT: retrospektiv
4
574
60 %
64 %
62 %
0,8
PET: PET ohne Kenntnis der CT
13
913
87 %
94 %
92 %
4,3
PET: PET mit Kenntnis der CT
8
407
88 %
88 %
88 %
3,9
PET: nodal orientiert
9
1528
88 %
96 %
95 %
4,4
CT: nodal orientiert
9
1528
58 %
88 %
83 %
1,1
PET: patientenorientiert
13
529
88 %
92 %
90 %
4,3
CT: patientenorientiert
12
505
68 %
71 %
70 %
1,8
PET: patientenorientiert, > 35 Fälle
4
289
91 %
91 %
91 %
4,6
CT: patientenorientiert, > 35 Fälle
4
289
70 %
65 %
67 %
1,6
PET: N0/N+
8
318
89 %
88 %
89 %
4,1
CT: N0/N+
7
294
70 %
75 %
72 %
2,0
PET: N0/N+, ohne LK-Vergrößerung in CT
4
109
83 %
93 %
89 %
4,7
PET: N0/N+, bei LK-Vergrößerung in CT
4
96
95 %
81 %
92 %
4,4
Fernmetastasen-Staging des Bronchialkarzinoms
13 Originalarbeiten wurden zur Analyse des M-Stagings akzeptiert [18 ]
[32 ]
[34 ]
[38 ]
[43 ]
[46 ]
[47 ]
[48 ]
[49 ]
[50 ]
[51 ]
[52 ]
[53 ]. Anhand von 8 Arbeiten konnte die Häufigkeit unerwarteter Fernmetastasen und die
Häufigkeit der Änderung des therapeutischen Vorgehens ermittelt werden (Tab. [6 ]). Unerwartete Fernmetastasen wurden bei 68/581 Patienten (11,8 % der Fälle) gefunden.
Die FDG-PET-Untersuchung führte bei 124/695 Patienten (17,9 % der Fälle) zu einer
Änderung des geplanten therapeutischen Vorgehens, in einigen Fällen bedingt durch
richtig negative FDG-PET-Befunde bei zunächst vermuteten Metastasen.
Die kumulativen Testgenauigkeiten der FDG-PET-Untersuchung für die Metastasendetektion
ergab sich aus vier Studien [32 ]
[38 ]
[43 ]
[51 ] mit insgesamt 336 Patienten wie folgt: Sensitivität: 94 ± 2 % (95 %KI: 90 - 99 %),
Spezifität: 97 ± 1 % (95 %KI: 95 - 99 %), Acc: 96 ± 1 % (95 %KI: 94 - 98 %), PPV:
94 ± 2 % (95 %KI: 90 - 99 %), NPV: 97 ± 1 % (95 %KI: 95 - 99 %). Im Vergleich dazu
ergaben sich bei im Vergleich durchgeführten konventionellen Untersuchungen (drei
Studien mit 308 Fällen) stets niedrigere Genauigkeiten: Sensitivität: 73 ± 5 % (95
%KI: 63 - 83 %), Spezifität: 82 ± 3 % (95 %KI: 76 - 87 %), Acc: 79 ± 3 % (95 %KI:
74 - 84 %), PPV: 66 ± 6 % (95 %KI: 55 - 77 %), NPV: 86 ± 3 % (95 %KI: 81 - 91 %).
Bei den organbezogenen Analysen sticht die Abklärung der Nebenniere heraus. Bei der
Untersuchung mit FDG-PET in vier Studien an 263 Patienten [32 ]
[38 ]
[46 ]
[47 ] zeigt sich stets eine höhere Genauigkeit [Sensitivität: 96 ± 3 % (95 %KI: 90 - 100
%), Spezifität: 99 ± 1 % (95 %KI: 97 - 100 %), Acc: 98 ± 1 % (95 %KI: 97 - 100 %),
PPV: 96 ± 3 % (95 %KI: 90 - 100 %), NPV: 99 ± 1 % (95 %KI: 97 - 100 %)] als bei vergleichenden
Untersuchungen an 211 Patienten in zwei Studien mit der CT [Sensitivität: 74 ± 13
% (95 %KI: 49 - 98 %), Spezifität: 94 ± 2 % (95 %KI: 90 - 97 %), Acc: 92 ± 2 % (95
%KI: 88 - 96 %), PPV: 50 ± 14 % (95 %KI: 22 - 78 %), NPV: 98 ± 1 % (95 %KI: 95 - 99
%)].
Bei der Untersuchung des Gehirns zeigte sich in allen Studien eine niedrige Sensitivität
des FDG-PET im Nachweis von Hirnmetastasen [32 ]
[38 ]
[48 ]
[50 ].
Tab. 6 Literaturdaten zur Häufigkeit unerwarteter extrathorakaler Metastasen und zur Häufigkeit
der Änderung des therapeutischen Vorgehens aufgrund der FDG-PET (n. a.: nicht anwendbar)
Erstautor
Jahr
Referenz
Fallzahl
unerwartetes M1-Stadium
Änderung Prozedere
Bury
1997
[32 ]
109
7/69 (10 %)
14/109 (13 %)
Graeber
1999
[18 ]
66
6/64 (9 %)
6/66 (9 %)
Gupta
1999
[34 ]
103
6/98 (6 %)
11/103 (11 %)
Kutlu
1998
[49 ]
21
n. a.
13/21 (62 %)
Marom
1999
[38 ]
100
9/54 (17 %)
20/100 (20 %)
Saunders
1999
[52 ]
97
16/97 (16 %)
36/97 (37 %)
Valk
1995
[43 ]
99
11/99 (11 %)
11/99 (11 %)
Weder
1998
[53 ]
100
13/100 (13 %)
13/100 (13 %)
gesamt
695
68/581 (12 %)
124/695 (18 %)
Rezidivdiagnostik des Bronchialkarzinoms
Es wurden vier Originalarbeiten aus dem vorgegebenen Zeitraum zur weiteren Analyse
akzeptiert [17 ]
[54 ]
[55 ]
[56 ]. Bei 224 Fällen zeigten sich bei einer Prävalenz von Rezidiven in 57 % der Fälle
(Tab. [7 ]) folgende kumulativen Testparameter: Sensitivität: 99 ± 1 % (95 %KI: 97 - 100 %),
Spezifität: 89 ± 3 % (95 %KI: 83 - 96 %), Acc: 95 ± 2 % (95 %KI: 92 - 98 %), PPV:
92 ± 2 % (95 %KI: 88 - 97 %), NPV: 98 ± 1 % (95 %KI: 96 - 100 %).
Tab. 7 Literaturdaten zur Rezidivdiagnostik des Bronchialkarzinoms mit FDG-PET (Sens: Sensitivität,
Spez: Spezifität, Acc: Diagnostische Genauigkeit)
Erstautor
Jahr
Referenz
Fallzahl
Sens
Spez
Acc
Bury
1999
[54 ]
126
99 %
92 %
95 %
Duhaylongsod
1995
[17 ]
16
93 %
96 %
94 %
Inoue
1995
[55 ]
39
98 %
61 %
85 %
Patz
1994
[56 ]
43
96 %
94 %
96 %
gesamt
224
99 %
89 %
95 %
Therapiemonitoring/Restaging/Bestrahlungsplanung
Sechs Arbeiten wurden zur weiteren Analyse akzeptiert. Die Arbeiten zeigten die Anwendbarkeit
der FDG-PET bei klinisch bedeutsamen Fragestellungen, die sich bei der Therapie des
Bronchialkarzinoms ergeben, wie etwa die Bestrahlungsplanung [57 ]
[58 ], das Ansprechen des Primarius auf Chemotherapie und Bestrahlung [54 ]
[59 ]
[60 ] oder das Restaging des Lymphknoten-Befalls nach induktiven Behandlungen [61 ]. Wegen der heterogenen Studienkonzeptionen sind aus den überzeugenden Ergebnissen
der einzelnen Studien jedoch keine metaanalytischen Aussagen zu gewinnen.
Prognose
Neun Arbeiten zur prognostischen Bedeutung der FDG-PET waren zur weiteren Analyse
akzeptabel [16 ]
[52 ]
[57 ]
[58 ]
[60 ]
[61 ]
[62 ]
[63 ]
[64 ]. Mehrere Arbeiten finden eine Korrelation zwischen der über den „Standardized Uptake
Value” (SUV) gemessenen FDG-Aufnahme und Geschwindigkeit des Tumorwachstums und zeigen,
dass der SUV ein prognostischer Parameter ist.
Diskussion
Diskussion
Die Literaturauswahl über MEDLINE erfasste den größten Teil an relevanten Arbeiten.
Über Literaturverweise in den gefundenen Arbeiten wurden drei weitere akzeptable Originalarbeiten
gefunden. Die Konzentration auf die Sprachen Englisch und Deutsch führte zu keiner
Einschränkung, da lediglich eine französisch verfasste Arbeit mit später erweitert
publiziertem Patientenkollektiv gefunden wurde. Weitere Arbeiten sind seit dem Jahr
2000 hinzugekommen, welche die vorgestellten Ergebnisse stützen, aber wegen des vorgegebenen
Zeitraumes nicht berücksichtigt wurden.
In der vorliegenden Analyse wurden die Ergebnisse von Studien mit Koinzidenz-Gammakameras
nicht berücksichtigt, da durch Probleme mit verminderter Zählratenempfindlichkeit,
hohen Totzeiten sowie bei den meisten Systemen fehlender Schwächungs- und Streustrahlungskorrektur
[65 ] keine mit den dedizierten PET-Systemen vergleichbaren Abbildungseigenschaften mit
der Möglichkeit einer quantifizierenden Auswertung (z. B. SUV-Messung) vorliegen.
Die sich aktuell abzeichnenden messtechnischen Neuerungen auf diesem Gebiet werden
bei Vorliegen neuer Studienergebnisse einer Reevaluation bedürfen.
Die Analyse der Dignitätsbeurteilung von pulmonalen Herden erforderte bei der Rekonstruktion
der Vierfeldertafeln aus der Primärliteratur eine Korrektur auf die Malignität von
Karzinoiden. Die oben erwähnten Arbeiten haben entgegen der WHO-Klassifikation [8 ] pulmonale Karzinoide zu den gutartigen Tumoren gezählt. Durch die Korrektur vor
der weiteren Analyse werden wegen der zusätzlichen falsch negativen Befunde die Sensitivität,
Spezifität und Genauigkeit des FDG-PET niedriger. Auf eine Elimination dieser Studienergebnisse
für die Auswertung wurde bewusst verzichtet, um einen für das FDG-PET günstigen Bias
zu vermeiden.
Da die quantitative Analyse der FDG-PET (z. B. mittels SUV-Messung) bei pulmonalen
Herden die sROC-Kurve in Richtung höherer Spezifität verschiebt (Abb. [1 ]), ist diese Art der Auswertung zu bevorzugen.
Eine aktuell publizierte Metaanalyse der Dignitätsbeurteilung von Lungenherden [66 ], die zusätzlich die Literatur bis September 2000 umfasst und auch die FDG-Bildgebung
mit Gammakameras berücksichtigt, bestätigt die in der hier beschriebenen Metaanalyse
gefundenen Ergebnisse bei einer Sensitivität von 97 % und einer Spezifität von 78
%, wobei jedoch die falsche Bewertung der Karzinoide nicht berücksichtigt wurde.
Im Vergleich zum hohen positiven prädiktiven Wert der FDG-PET-Untersuchung von 91
% bei den solitären pulmonalen Rundherden muss die in der Literatur berichtete Prävalenz
maligner Herde gesehen werden, die bei Thorakotomien unter dieser Indikation gefunden
wird. Nach einer aktuellen deutschen Sammelstatistik liegt diese bei 51 % [67 ]. Aufgrund des hohen negativen prädiktiven Wertes der FDG-PET bei dieser Indikation
von 90 % liegt die Wahrscheinlichkeit, bei negativem FDG-PET-Befund einen übersehenen
malignen Herd nicht der potentiell kurativen Thorakotomie mit Resektion zuzuführen,
bei 10 % und rechtfertigt in Abhängigkeit vom Malignomrisiko und Operationsrisiko
des Patienten ein kontrolliertes Zuwarten.
Für das N-Staging des nicht-kleinzelligen Bronchialkarzinoms ist bereits eine weniger
umfangreiche Metaanalyse publiziert worden [11 ]. In der vorliegenden Arbeit erfolgte die statistische Analyse mit der gleichen Methodik,
wobei jedoch gegenüber der bereits publizierten Metaanalyse jede Arbeit nur jeweils
einmalig für die sROC-Kurven verwendet wurde, wie auch von der Methodik gefordert.
Einige bei Dwamena u. Mitarb. [11 ] akzeptierte Arbeiten wurden hier nicht berücksichtigt, da sie als technisch inadäquat
durchgeführt angesehen wurden, z. B. wegen gering auflösender PET-Scanner älterer
Bauart mit schlechter Sensitivität. Dadurch ist die in der vorliegenden Metaanalyse
ermittelte höhere Sensitivität des FDG-PET beim N-Staging zu erklären (hier 88 % gegenüber
79 %).
Wie eine der Subanalysen zeigt, sind auch bei negativem CT-Befund richtig positive
Lymphknotenmetastasen bei ca. 30 % der Patienten mittels FDG-PET zu finden (Tab. [5 ]). Ein bezüglich Lymphknoten unauffälliger CT-Befund lässt daher keinen unauffälligen
FDG-PET-Befund erwarten.
Die Metaanalyse des M-Staging zeigt, dass mittels FDG-PET extrathorakale Fernmetastasen
sehr gut darstellbar sind und mit 12 % bei einem vergleichsweise hohen Anteil von
Patienten gefunden werden. Die Kollektive der Studien schlossen Patienten mit kleinzelligen
Bronchialkarzinomen nicht aus, daher sind die Ergebnisse nicht nur auf nicht-kleinzellige
Bronchialkarzinome beschränkt.
Beim Bronchialkarzinom findet man bei einem großen Anteil der Patienten Nebennierenvergrößerungen,
die nicht durch Metastasen bedingt sind, was zu dem niedrigen PPV der CT-Untersuchung
von 50 % führt (Tab. [8 ]). Wegen der sehr hohen diagnostischen Genauigkeit des FDG-PET bei dieser Indikation
(Tab. [8 ]) kommt FDG-PET zur nicht-invasiven Abklärung von Nebennieren-Vergrößerungen in Frage.
Wegen der gegenüber der CT-Untersuchung und Kernspintomographie geringeren Sensitivität
beim Nachweis von Hirnmetastasen ist die FDG-PET-Untersuchung des Gehirns unter dieser
Indikation ohne klinischen Wert.
Die Rezidivdiagnostik mittels FDG-PET ist mit sehr hoher Genauigkeit möglich (Tab.
[7 ]). Gegenüber der morphologisch orientierten CT- und Kernspin-Diagnostik können durch
FDG-PET Rezidive besser von narbigen, therapiebedingten Veränderungen differenziert
werden. Es muss Gegenstand weiterer Evaluationen sein, ob durch den Einsatz der FDG-PET
eine Nachsorge beim Bronchialkarzinom zu längerem Überleben führt.
Die Analyse der Literatur zur Prognose zeigt, dass die Anreicherungsintensität des
FDG mit einer kürzeren Überlebenszeit korreliert, passend zu einem aggressiveren Tumorzellwachstum.
Diese Beobachtung sollte bei der Konzeption von Studien berücksichtigt werden, z.
B. zur Klärung der Bedeutung der adjuvanten Chemotherapie beim nichtkleinzelligen
Bronchialkarzinom in frühen Stadien.
Die Analyse der Indikationsbereiche Bestrahlungsplanung, Therapiemonitoring und Restaging
zeigt, dass durch die FDG-PET-Untersuchung im Einzelfall wichtige Zusatzinformationen
liefern kann. Empfehlungen zu einem allgemein verbindlichen Vorgehen lassen sich derzeit
jedoch nicht ableiten.
Die FDG-PET-Untersuchung ist wegen des hohen technischen und logistischen Aufwandes
bei Produktion und Distribution des kurzlebigen Radiopharmakons und wegen der speziellen
Messapparaturen mit vergleichsweise hohen Kosten verbunden. Eine FDG-PET-Untersuchung
kostet etwa ein Pack-year (1000 Euro). Da die Untersuchung in Ganzkörpertechnik mit
Abbildung von Hals, Thorax, Abdomen und Becken in einem Untersuchungsgang durchgeführt
wird, muss bei der Bewertung der Kosten-Effektivität beachtet werden, dass die Fragestellungen
Dignitätsbeurteilung, N- und M-Staging mittels einer einzigen Untersuchung behandelt
werden.
Tab. 8 Zusammenfassung der diagnostischen Testparameter (Sens: Sensitivität, Spez: Spezifität,
Acc: diagnostische Genauigkeit, PPV: positiver prädiktiver Wert, NPV: negativer prädiktiver
Wert)
Indikation
Studien (Zahl)
Fallzahl
Sens
Spez
Acc
PPV
NPV
Dignitätsbeurteilung
15
1144
96 %
80 %
91 %
91 %
90 %
N-Staging: PET
20
1292
88 %
92 %
91 %
85 %
94 %
N-Staging: CT
19
1268
65 %
77 %
72 %
58 %
81 %
M-Staging: PET
4
336
94 %
97 %
96 %
94 %
97 %
M-Staging: konventionell
3
308
73 %
82 %
79 %
66 %
86 %
Nebenniere: PET
4
263
96 %
99 %
98 %
96 %
99 %
Nebenniere: CT
2
211
74 %
94 %
92 %
50 %
98 %
Rezidiv
4
224
99 %
89 %
95 %
92 %
98 %
Zusammenfassung und Schlussfolgerung
Zusammenfassung und Schlussfolgerung
Für die wesentlichen Indikationen fasst Tab. [8 ] die diagnostischen Testparameter zusammen und stellt sie gegebenenfalls den konventionellen
Verfahren gegenüber. Es zeigt sich die Überlegenheit der Einzeluntersuchung FDG-PET
gegenüber den konventionellen Modalitäten bei mehreren Indikationen. Die Konsensus-Konferenz
Onko-PET kam zu der in Tab. [9 ] zusammengefassten Einstufung der Indikationen der FDG-PET-Untersuchung bei Lungentumoren.
Die Kategorisierung lehnt sich an die von der American Heart Association zur Bewertung
von Prozeduren verwendete Einstufung an [68 ]. Gegenüber den Ergebnissen der vorangegangenen Konsensus-Konferenzen [3 ]
[4 ] ist es beim Bronchialkarzinom als wissenschaftlich belegt anzusehen, dass N-Staging
und M-Staging 1a-Indikationen für FDG-PET sind.
FDG-PET ist das nicht-invasive Verfahren mit der höchsten diagnostischen Genauigkeit
bei der Dignitätsbeurteilung von Lungenherden, beim N-Staging des Bronchialkarzinoms,
zur Abklärung von vermuteten Nebennieren-Metastasen und zur Rezidivdiagnostik.
Danksagung
Danksagung
Für ihre Mithilfe bei der Sichtung der Primärliteratur danken wir den weiteren Mitgliedern
der Arbeitsgruppe „Lunge” der Dritten Konsensuskonferenz Onko-PET: Prof. M. Schwaiger
und Dr. W. A. Weber (Nuklearmedizinische Klinik, Technische Universität München),
Prof. R. P. Baum (Klinik für Nuklearmedizin, Zentralklinikum, Bad Berka), Prof. L.
Sunder-Plassmann und Dr. F. Liewald (Abteilung für Thorax- und Gefäßchirurgie, Chirurgische
Universitätsklinik, Ulm), Prof. V. Jacobi (Zentrum Radiologie, Universitätsklinik
Frankfurt/Main).
Den Herren Prof. Dr. S. N. Reske und Prof. Dr. J. Kotzerke (Nuklearmedizinische Abteilung,
Klinikum der Universität Ulm) sei gedankt für die Koordination der Arbeitsgruppen
der Konsensuskonferenz und die kurzfristige Versorgung mit Originalarbeiten.
Tab. 9 Bewertung der Aussagekraft der FDG-PET unter Indikationen bei Lungentumoren durch
die 3. Konsensuskonferenz Onko-PET (1a: klinischer Nutzen ist ohne Einschränkung erwiesen,
1b: klinischer Nutzen ist wahrscheinlich, 2: in Einzelfällen hilfreich, 3: aufgrund
unzureichender Daten noch nicht endgültig beurteilbar, 4: meistens ohne klinischen
Wert [aus grundsätzlichen Überlegungen oder bei gesicherter Datenlage])
Dignitätsklärung pulmonaler Raumforderungen
bei Patienten mit erhöhtem Operationsrisiko
1a
bei Patienten ohne erhöhtes Operationsrisiko
2
N-Staging des nicht-kleinzelligen Bronchialkarzinoms
1a
Extrathorakales M-Staging des Bronchialkarzinoms
1a
Gehirn
4
Rezidivdiagnostik von Bronchialkarzinomen
1a
Bestrahlungsplanung/Therapiemonitoring/Restaging
2