KI im klinischen Einsatz: Software erkennt Pathologien im Röntgenthorax auf Niveau zwischen Assistenz- und Facharzt

F Schweikhard; A Pusch; N Hosten

doi:10.1055/s-0041-1723254

Subscribe to RSS

Please copy the URL and add it into your RSS Feed Reader.

https://www.thieme-connect.de/rss/thieme/en/10.1055-s-00000066.xml

Share / Bookmark

Facebook X Linkedin Weibo

Rofo 2021; 193(S 01): 42
DOI: 10.1055/s-0041-1723254

Poster (Wissenschaft)

Thoraxradiologie

KI im klinischen Einsatz: Software erkennt Pathologien im Röntgenthorax auf Niveau zwischen Assistenz- und Facharzt

F Schweikhard

¹Universitätsmedizin Greifswald, Institut für Diagnostische Radiologie und Neuroradiologie, Greifswald

,

A Pusch

²Institut für Diagnostische Radiologie und Neuroradiologie, Greifswald

,

N Hosten

²Institut für Diagnostische Radiologie und Neuroradiologie, Greifswald

› Author Affiliations

› Further Information

Also available at

Congress Abstract
Full Text

Zielsetzung Ziel der Studie war es, die klinische Anwendbarkeit der Deep-Learning-Software zur automatisierten Erkennung von Thoraxpathologien zu evaluieren, beispielsweise zur Triage, als zusätzliche Sicherheitsmaßnahme oder sogar zur unabhängigen Befundung.

Material und Methoden Es wurden Röntgenaufnahmen in 2 Ebenen (pa/lateral) des Thorax von 500 aufeinanderfolgenden Untersuchungen (18 – 91 Jahre, Median 63 Jahre) von zwei unabhängigen Befundern ausgewertet. Zur Etablierung des Goldstandards erfolgte eine weitere Auswertung mit Zuhilfenahme klinischer Daten (alle) sowie, wenn verfügbar, CT-Bildgebung (7% der Fälle). Zudem wurden die Bilder mithilfe der Software (InferRead DR Chest, Infervision, Peking, China) analysiert, die für jede Pathologie Wahrscheinlichkeiten berechnete. Untersucht wurden 15 Krankheitsbilder, unter anderem auf Pneumonien, Atelektasen, Rundherde und Pneumothoraces.

Ergebnisse Mit dem Goldstandard wurden 224 Auffälligkeiten in der Patientenpopulation erkannt. Die Radiologen erzielten eine durchschnittl. Sensitivität von 84,1% bzw. 56,2% bei einer Spezifität von 96,8% und 98,6%. Die Software erreichte in der AUC der ROC-Analyse einen Durchschnitt von 0,84 (0,76 – 0,92), bei einer mittleren Sensitivität von 85,4% und Spezifität von 75% bei optimierten Cutoffs. Die besten Ergebnisse erzielte die Software bei der Erkennung von Pleuraergüssen (n = 66) mit einer AUC von 0,92 (0,885 – 0,955) bei 90,9% Sensitivität (Rad: 90,9% und 83,3%) und 86,4% Spezifität (Rad: 95,4% und 97,6%). Die ungenauesten Ergebnisse ergaben sich für die Erkennung von Frakturen mit einer AUC von 0,793 (0,707 – 0,88) bei einer Sensitivität von 69,7% (Rad: 87,9% und 36,4%) und Spezifität von 82,2% (Rad: 98,4% und 99,1%).

Schlussfolgerungen Die Software erzielte kontinuierlich über fast alle Pathologien hinweg Ergebnisse zwischen dem Erfahrungsstand eines erfahrenen Assistenten und eines langjährigen Facharztes. Aufgrund der noch relativ geringen Spezifität bietet sich zunächst ein Einsatz als Triage-Tool oder als zusätzliche Sicherheitsebene an.

Publication History

Article published online:
11 May 2021

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany