Die Unterscheidung zwischen benignen und malignen
Hauttumoren ist nicht immer eindeutig. Gruppen von
Hautärzten können eine größere diagnostische Genauigkeit
erreichen, als einzelne, auch erfahrene Dermatologen. Das
belegen die Studien von Ralf H. J. M. Kurvers et al.
JAMA Dermatol 2015; 151: 1346–1353
Mithilfe von Schwarmintelligenz zum Ziel: Durch moderne Telekommunikations- und Informationstechnologien
können Daten schnell und hochauflösend an eine Vielzahl von Personen weitergeleitet
und z. B. auf Online-Plattformen bewertet und diskutiert werden. Auf diese Weise können
Hautkrebsdiagnosen treffsicherer gestellt werden, so die Autoren der Studie.(Symbolbild;
Alexander Fischer / Thieme Verlagsgruppe)
Die europäische Studiengruppe wendete
2 Methoden der kollektiven Intelligenz
an: Die Mehrheitsregel, bei der die diagnostische
Entscheidung zugunsten der
Mehrheit der Beurteilungen gefällt wird,
und die Quorumregel, bei der ein vorab
definierter Mindestanteil einer Bewertung
erreicht werden muss, um eine diagnostische
Entscheidung zu treffen.
In einer 1. Studie bewerteten 40 in der
Dermatoskopie erfahrene Hautärzte anlässlich
einer Internet-Konsensuskonferenz
online jeweils 108 Bilder von Hauttumoren.
In einem ersten Schritt mussten
sie zwischen melanozytären und nicht
melanozytären Herden unterscheiden,
melanozytäre Läsionen dann in maligne
und benigne differenzieren, indem sie 4
verschiedene diagnostische Algorithmen
anwendeten: die Musteranalyse, die
ABCD-
Regel, die Menzies-Methode und
die 7-Punkte-Checkliste.
An der 2. Studie nahmen 170 Experten
teil, darunter v. a. Hautärzte, aber auch Allgemeinmediziner,
Medizinstudenten und
andere medizinische Fachberufe, und bewerteten
165 Hautläsionen mittels einer
3-Punkte-Checkliste als maligne oder benigne.
82 von ihnen (darunter 60 Hautärzte)
hatten mindestens 110 Hautläsionen
bewertet und wurden für die weitere Analyse
herangezogen. Für alle fotografischen
Befunde beider Studien lag auch eine Histologie
vor, mit der die Diagnosen abgeglichen
wurden.
Die Quorummethode ist überlegen
Insgesamt nahmen 122 Gutachter 16 029
Bewertungen vor. Je größer die Gruppe in
der statistischen Auswertung gewählt
wurde, desto deutlicher verbesserte sich
die diagnostische Genauigkeit gegenüber
dem Mittel der Einzelgutachter, unabhängig
vom verwendeten Algorithmus. Sowohl
Mehrheits- als auch Quorumregel
führten bereits ab 3 Teilnehmern zu höheren
richtig-positiven und geringeren
falsch-positiven Resultaten als das Mittel
der Einzelbeurteilungen. So lag z. B. die
Rate der richtig-positiven Beurteilungen
in Studie 1 bei Verwendung der Musteranalyse
als diagnostischem Verfahren im
Mittel bei 0,83, die Falsch-positiv-Rate bei
0,17. Bei Entscheidung nach dem Mehrheitsprinzip
lagen die entsprechenden
Raten schon bei einer Gruppengröße von
3 bei 0,91 bzw. 0,14. Mit ansteigender
Gruppengröße wurden die Effekte zugunsten
der kollektiven Beurteilung noch
ausgeprägter.
Auch gegenüber der besten individuellen
Diagnostik ergab sich bei der Quorumregel
ein Vorteil. Je nach Festlegung des
Quorums, das erreicht werden musste,
um eine diagnostische Entscheidung zu
treffen, waren die Raten der richtig-positiven
Diagnosen höher und der falsch-positiven
niedriger, bei einigen Diagnosekriterien
war die Rate falsch-negativer Ergebnisse
bei mehr richtig-positiven Ergebnissen
zumindest vergleichbar niedrig
oder nur gering erhöht. Die Mehrheitsregel
führte nur teilweise zu besseren Ergebnissen
als die beste Einzeldiagnostik, ist dafür allerdings einfacher anwendbar – für das
Quorum muss vorab der Schwellenwert
bestimmt werden.
Methoden der kollektiven Intelligenz könnten ein interessanter Ansatz sein,
um die diagnostische Genauigkeit bei Hautkrebs zu verbessern und damit
auch die hautkrebsassoziierte Mortalität zu senken. Die Weiterentwicklung moderner
Telekommunikations- und Informationstechnologien
könnte das Verfahren attraktiver machen, es bleibt aber ein Mehr an diagnostischer
Beurteilung
als ein erheblicher Kostenfaktor.