B&G Bewegungstherapie und Gesundheitssport 2022; 38(03): 110-119
DOI: 10.1055/a-1820-0315
Wissenschaft

Diagnostische Güte des FAHW-12 – Exemplarische Darstellung einer Diagnosestudie

Diagnostic quality of the FAHW-12 – Diagnostic study example
Georg Wydra
1   Sportwissenschaftliches Institut der Universität des Saarlandes, Saarbrücken
› Author Affiliations

Zusammenfassung

Bei der Darstellung von Testverfahren für den Gesundheitssport und die Sporttherapie erfolgt weitestgehend eine Orientierung an den Haupt- und Nebengütekriterien: Objektivität, Reliabilität und Validität bzw. Normierbarkeit und Ökonomie. In der Medizin und auch in der Physiotherapie werden darüber hinaus auch Maßzahlen der diagnostischen Güte genannt. Es geht um die Frage, wie gut ein Testverfahren Personen mit bzw. ohne Auffälligkeiten oder Schwierigkeiten unterscheiden kann. Dies zu klären, ist die Aufgabe von Diagnosestudien. In der einschlägigen eher sozialwissenschaftlich orientierten Testliteratur werden Maße der diagnostischen Güte im Gegensatz zum medizinisch-therapeutischen Milieu kaum thematisiert.

Am Beispiel des FAHW-12, eines Screening-Tests zur Beurteilung des Wohlbefindens, wird aufgezeigt, welche Maße der diagnostischen Güte von Bedeutung sind und wie sie bestimmt werden können.

Am häufigsten werden die Sensitivität und Spezifität genannt. Diese Werte werden über sog. Vierfeldertafeln berechnet. Beide Werte bedingen sich gegenseitig negativ. Eine Erhöhung der Sensitivität geht immer zu Lasten der Spezifität und umgekehrt. Bei einer maximalen Sensitivität eines Tests werden fast alle Patienten als krank klassifiziert. Dann werden aber auch sehr viele Gesunden als krank eingestuft. Die Diagnose hat also eine sehr geringe Spezifität. Wird hingegen umgekehrt fast niemand als krank eingestuft, dann werden aber auch sehr viele Kranke als gesund eingestuft. Die Diagnose hat also eine sehr geringe Sensitivität. Diese gegenseitige Abhängigkeit von Sensitivität und Spezifität wird vor allem bei einer grafischen Darstellung deutlich.

Da bei der Beurteilung von Sensitivität und Spezifität jeweils nur Auffällige oder Unauffällige in den Blick genommen werden, werden auch andere komplexere Gütemaße, wie z. B. der RATZ-Index, beleuchtet.

Eine weitere wichtige Aufgabe von Diagnosestudien besteht darin, den sog. Trennpunkt zu bestimmen. Das ist der Testwert, der optimal Personen mit von solchen ohne Störung bzw. Krankheit differenziert. Eine Möglichkeit hierfür stellt der Youden-Index dar. Des Weiteren kann die ROC-Kurve zur Beantwortung dieser Frage herangezogen werden.

Spezielle Probleme ergeben sich, wenn die Referenzwerte, der sog. Goldstandard, nicht in dichotomer Form, sondern als Ordinal- oder Intervallskalen vorliegen. Dann müssen die Personen anhand definierter Cut-Off-Werte als auffällig bzw. unauffällig klassifiziert werden.

Abstract

The presentation of test procedures for health sports and sports therapy is largely based on the quality criteria of objectivity, reliability and validity or standardization and economy. Moreover, in medicine as well as in physiotherapy, metrics of diagnostic quality are important. The most important question is how well a test procedure can distinguish between people with and without abnormalities or difficulties. This is one of the main tasks of diagnostic studies. With reference to the relevant literature, which is more social science-oriented, measures of diagnostic quality are hardly discussed in contrast to the medical-therapeutic milieu.

This article uses the example of the FAHW-12 (a screening test to assess well-being) to show which measures of diagnostic accuracy are important and how they can be determined. In this context, the most frequently mentioned concepts are sensitivity and specificity. These values that are mutually dependent are calculated using the so-called four-field tables. An increase in sensitivity is always achieved at the expense of specificity and vice versa. With a maximum sensitivity test, almost all patients are classified as sick. In this case erroneously, many healthy people are also classified as sick. Thus, the diagnosis has a very low specificity. On the other hand, if almost nobody is classified as sick, then a large number of sick people are also classified as healthy. The diagnosis therefore has a very low sensitivity. This interdependence of sensitivity and specificity becomes particularly clear in a graphical representation. The assessment of sensitivity and specificity respectively only looks at those cases that are conspicuous or inconspicuous. By so-doing, other more complex quality measures, such as the RATZ index, are also examined. Another important task of diagnostic studies is to determine the so-called cut-off point. This is the test value that optimally differentiates between people without a disorder or disease. This can be carried out with Youden index`s which captures the performance of a dichotomous diagnostic test. The ROC curve (receiver operating characteristic curve) can also be used to solve the problem. However, special challenges arise when the reference values (the so-called gold standards), are not available in dichotomous form but as ordinal or interval scales. In this case, the persons must then be classified as conspicuous or inconspicuous using defined cut-off values.



Publication History

Received: 03 January 2022

Accepted after revision: 22 March 2022

Article published online:
14 June 2022

© 2022. Thieme. All rights reserved.

Georg Thieme Verlag
Rüdigerstraße 14, 70469 Stuttgart, Germany

 
  • Literatur

  • 1 Marx P, Lenhard W.. Diagnostische Merkmale von Screeningverfahren. In: Hasselhorn M, Schneider W, Hrsg. Frühprognose schulischer Kompetenzen. Göttingen: Hogrefe; 2010
  • 2 Oesch P, Hilfiker R, Keller S. et al. Assessments in der muskuloskelettalen Rehabilitation. Bern: Huber; 2007
  • 3 Pospeschill M.. Testtheorie, Testkonstruktion, Testevaluation. München: Reinhardt; 2010
  • 4 Bös K. Hrsg. Handbuch Motorische Tests. 3. überarbeitete und erweiterte Aufl. Göttingen: Hogrefe; 2017
  • 5 Wydra G.. FAHW-12 – ein Screeningtest zur Erfassung des Wohlbefindens. Bewegungstherapie und Gesundheitssport 2014; 30: 254
  • 6 Wydra G.. FAHW. Fragebogen zum allgemeinen habituellen Wohlbefinden. In: Schumacher J, Klaiberg A, Brähler E. Hrsg. Diagnostische Verfahren zu Lebensqualität und Wohlbefinden. Göttingen: Hogrefe; 2003: 102-107
  • 7 Wydra G.. Der Fragebogen zum allgemeinen habituellen Wohlbefinden (FAHW und FAHW-12). Testmanual. 6. erweiterte und überarbeitete Fassung. Saarbrücken: SWI; 2020. Im Internet: https://www.sportpaedagogik-sb.de/pdf/2020/FAHW 2020 pdf; Stand: 3112.2021
  • 8 Zerssen D. von. Die Beschwerdenliste. Weinheim: Beltz; 1976
  • 9 Becker P.. Der Trierer Persönlichkeitsfragebogen. Handanweisung. Göttingen: Hogrefe-Verlag; 1989
  • 10 Antonovsky A.. Health, Stress and Coping. New Perspectives on Mental and Physical Well-Being. San Francisco: Jossey-Bass; 1979
  • 11 Morfeld M, Kirchberger I, Bullinger M.. SF-36 – Fragebogen zum Gesundheitszustand. Göttingen: Hogrefe; 2011
  • 12 Kobasa SC.. Stressful Life Events, Peronality, and Health: An Inquiry Into Hardiness Electronic Version. Journal of Personality and Social Psychology 1979; 37: 1-11
  • 13 Israel S.. Körperliche Normbereiche in ihrem Bezug zur Gesundheitsstabilität. Theorie und Praxis der Körperkultur 1983; 32: 360-363
  • 14 Berufsverband Deutscher Internistinnen und Internisten e. V. Bluthochdruck: Grenzwerte für Systole und Diastole & Einteilung der Blutdruckwerte. Grenzwerte für Systole und Diastole. Im Internet: https://www.internisten-im-netz.de/krankheiten/bluthochdruck/einteilung-der-blutdruckwerte/ Stand: 31.12.2021
  • 15 Bortz J, Lienert GA.. Kurzgefasste Statistik für die klinische Forschung. Leitfaden für die verteilungsfreie Analyse kleiner Stichproben. 3. aktualisierte und bearb. Aufl. Heidelberg: Springer; 2008
  • 16 Gigerenzer G.. Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken. Berlin: Berliner Taschenbuch Verlag; 2002
  • 17 WHO. Principles and pratice of screening for disease. Geneva: WHO; 1968
  • 18 Schwarzer G, Türp JC, Antes G.. EbM-Splitter 9. Die Vierfeldertafel (in Diagnosestudien): Sensitivität und Spezifität. Deutsche Zahnärztliche Zeitschrift 2002; 57: 333-334
  • 19 Faller H.. Sensitivität, Spezifität, positiver und negativer Vorhersagewert. Die Rehabilitation 2005; 44: 44-49 DOI: 10.1055/s-2004-834624.
  • 20 Weiß C. Basiswissen medizinische Statistik. 4. neu bearb. Aufl. Heidelberg: Springer Medizin Verlag; 2008
  • 21 Abel U. Bewertung diagnostischer Tests. Stuttgart: Hippokrates Verlag; 1993
  • 22 Eng J.. ROC analysis: web-based calculator for ROC curves. Baltimore: Johns Hopkins University; Im Internet: http://www.jrocfit.org Stand: 30.12.2021
  • 23 Jacob W.. Kranksein und Gesundheit. In: Jacob W, Schipperges H, Hrsg. Kann man Gesundsein lernen?. Gentner, Stuttgart: 1981: 201-215
  • 24 Kromeyer-Hauschild K.. Perzentile für den Body-Mass-Index für das Kindes- und Jugendalter unter Heranziehung verschiedener deutscher Stichproben. Monatsschrift Kinderheilkunde 2001; 149: 807-818
  • 25 Schwarzer G, Türp JC, Antes G.. EbM-Splitter 10. Sensitivität und Spezifität: Auswirkung der Wahl des Trennpunktes. Deutsche Zahnärztliche Zeitschrift 2002; 57: 446-447