Rofo 2022; 194(S 01): S56-S57
DOI: 10.1055/s-0042-1757503
Abstract
Poster (Wissenschaft)
Bildverarbeitung/ IT/ Software

Leistungstest eines Deep-Learning-Algorithmus zur Erkennung von intrakraniellen Blutungen und erster Anwendungsversuch unter klinischen Bedingungen

P Gruschwitz
1   Institut für Diagnostische und Interventionelle Radiologie d, Diagnostische Radiologie, Würzburg
,
P J Grunz
2   Institut für diagnostische und interventionelle Radiologie, Uniklinikum Würzburg, Würzburg
,
J P Kuhl
2   Institut für diagnostische und interventionelle Radiologie, Uniklinikum Würzburg, Würzburg
,
A Kosmala
3   Klinik und Poliklinik für Nuklearmedizin, Uniklinikum Würzburg, Würzburg
,
A T Bley
2   Institut für diagnostische und interventionelle Radiologie, Uniklinikum Würzburg, Würzburg
,
B Petritsch
2   Institut für diagnostische und interventionelle Radiologie, Uniklinikum Würzburg, Würzburg
,
F J Heidenreich
2   Institut für diagnostische und interventionelle Radiologie, Uniklinikum Würzburg, Würzburg
› Author Affiliations
 
 

    Zielsetzung Evaluation der diagnostischen Qualität eines Deep-Learning-basierten Algorithmus unter Verwendung einer Dense-U-Net-Architektur zur Erkennung von intrakraniellen Blutungen (ICH) in nativen Computertomographie-(CT)-Untersuchungen des Schädels.

    Material und Methoden Retrospektiv wurde ein annähernd homogen verteiltes Kollektiv mit insgesamt 872 craniellen CT-Untersuchungen (362 mit vorliegender ICH) erstellt. Die Beurteilungen des Algorithmus wurden analysiert und mit dem nochmals kontrollierten radiologischen Befund (Konsensus 2 Befunder als Goldstandard) verglichen. Daneben wurde die Leistungsfähigkeit des Algorithmus im klinischen Ablauf getestet. Insgesamt 100 CT-Untersuchungen des Schädels (11 mit vorliegender ICH) wurden gleichzeitig durch den Deep-Learning-Algorithmus und einen Radiologen während der klinischen Routine befundet. Hierbei wurde die Zeit bis zum ersten von einem klinischen Kollegen einsehbaren, nicht supervidierten Ergebnis gemessen. Zuletzt untersuchten wir die diagnostische Gesamtleistung von Radiologen und dem Algorithmus in Kombination im Sinne einer Kontrollanwendung.

    Ergebnisse Im retrospektiven Datensatz erkannte der Deep-Learning-Algorithmus eine vorliegende ICH mit einer Sensitivität von 91,4%, einer Spezifität von 90,4% und einer Gesamtgenauigkeit von 91,0%. Im klinischen Ablauf war der Algorithmus im Vergleich zum vorläufigen Bericht des zugewiesenen Radiologen signifikant schneller (24 ± 2 s vs. 613 ± 658 s, p < 0,001). Bei Verwendung des Algorithmus als Kontrollanwendung zusätzlich zum Bericht des befundenden Radiologen wurde im Testkollektiv eine Sensitivität von 100 % erreicht.

    Schlußfolgerungen Diese Befundgenauigkeit und die kurze Bearbeitungszeit demonstrieren das immense Potenzial von Deep-Learning-Algorithmen für den Einsatz als Triage-Anwendung um auffällige Befunde schneller zu Sichten sowie kontrollierenden Überprüfung der radiologischen Befunde zur Steigerung der Befundgenauigkeit.


    Publication History

    Article published online:
    15 September 2022

    © 2022. Thieme. All rights reserved.

    Georg Thieme Verlag
    Rüdigerstraße 14, 70469 Stuttgart, Germany