Abstract
Purpose: To investigate measurement accuracy in terms of precision and inter-rater variability
in the simultaneous volumetric assessment of lung, liver and lymph node metastasis
size change over time in comparison to RECIST 1.1.
Materials and Methods: Three independent readers evaluated multislice CT data from clinical follow-up studies
(chest/abdomen) in 50 patients with metastases. A total of 117 lung, 77 liver and
97 lymph node metastases were assessed manually (RECIST 1.1) and by volumetry with
semi-automated software. The quality of segmentation and need for manual adjustments
were recorded. Volumes were converted to effective diameters to allow comparison to
RECIST. For statistical assessment of precision and interobserver agreement, the Wilcoxon-signed
rank test and Bland-Altman plots were utilized.
Results: The quality of segmentation after manual correction was acceptable to excellent in
95 % of lesions and manual corrections were applied in 21 – 36 % of all lesions, most
predominantly in lymph nodes. Mean precision was 2.6 – 6.3 % (manual) with 0.2 – 1.5 %
(effective) relative measurement deviation (p <.001). Inter-reader median variation
coefficients ranged from 9.4 – 12.8 % (manual) and 2.9 – 8.2 % (volumetric) for different
lesion types (p < .001). The limits of agreement were ± 9.8 to ± 11.2 % for volumetric
assessment.
Conclusion: Superior precision and inter-rater variability of volumetric over manual measurement
of lesion change over time was demonstrated in a whole body setting.
Zusammenfassung
Ziel: Erforschung von Messgenauigkeit im Hinblick auf Präzision und Inter-Observer-Variabilität
der gleichzeitigen volumetrischen Untersuchung der Größenänderung im Follow-up von
Lungen-, Leber- und Lymphknotenmetastasen im Vergleich zu RECIST 1.1.
Material und Methoden: 3 unabhängige Radiologen untersuchten Multislice-CT-Daten von 50 Patienten mit Metastasen
aus klinischen Verlaufsuntersuchungen (Thorax/Abdomen). Insgesamt wurden 117 Lungen-,
77 Lebermetastasen und 97 Lymphknoten manuell (RECIST 1.1) und volumetrisch mit einer
halbautomatischen Software vermessen. Die Qualität der Segmentation und der Einsatz
manueller Nachverarbeitung wurden erfasst. Volumina wurden in Effektivdurchmesser
umgewandelt, um sie direkt mit RECIST vergleichen zu können. Zur statistischen Analyse
von Präzision und Inter-Observer-Variabilität wurden Wilcoxon-Vorzeichen-Rangtest
und Bland-Altman Diagramme verwendet.
Ergebnisse: Die Qualität der Segmentation nach manueller Korrektur wurde als akzeptabel bis hervorragend
in 95 % bewertet, manuelle Korrekturen in 21 – 36 % aller Läsionen vorgenommen, am
häufigsten an Lymphknoten. Mittlere Präzision war 2,3 – 6,3 % (manuell) und 0,2 – 1,5 %
(Effektivdurchmesser) relative Messwert-Abweichung (p < 0,001). Mediane Inter-Observer-Variabilität
lag im Bereich von 9,4 – 12,8 % (manuell) und 2,9 – 8,2 % (volumetrisch) in verschiedenen
Läsionskategorien (p < 0,001). Limits of Agreement waren ± 9,8 bis ± 11,2 % in der
volumetrischen Analyse.
Schlussfolgerung: Volumetrische Messung der Größenänderungen im Follow-up zeigte eine signifikante
Verbesserung von Präzision und Inter-Observer-Variabilität gegenüber manueller Messung
im untersuchten Ganzkörperparadigma.
Key words
computed tomography - volumetry - lung metastasis - liver metastasis - lymph node
metastasis