Zusammenfassung
In der Diagnostik und der Outcome-Messung werden in der Rehabilitation eine Vielzahl
von Fragebogen eingesetzt. In der Regel werden dabei – unabhängig vom aktuellen Gesundheitszustand
und vom Schweregrad – für jeden Rehabilitanden dieselben Informationen mittels identischer
Gruppen von Items erfasst, um die Vergleichbarkeit der diagnostischen Befunde gewährleisten
zu können. Hierbei erweist es sich als problematisch, dass a) in der Regel nur im
mittleren Belastungsspektrum eine hinreichend genaue und zuverlässige Diagnostik möglich
ist und b) Messinstrumente durch die Vorgabe von vielen und im Einzelfall uninformativen
Items eine unökonomische Datenerhebung erfordern. In diesem Beitrag wird gezeigt,
wie durch adaptives oder maßgeschneidertes Testen die Datenerhebung an der individuellen
Belastung des Patienten selbst orientiert werden kann. Hierdurch können im Idealfall
eine hohe Ökonomie und eine optimierte Messpräzision der Testung und patientenseitig
eine hohe Akzeptanz gewährleistet werden, da eine gute Passung zwischen Fähigkeit
der Patienten und erfragten Iteminhalten gegeben ist. Adaptive Testverfahren erfordern
jedoch eine aufwändige und sehr sorgfältige psychometrische Entwicklung der Erhebungsprozeduren,
damit trotz Vorgabe unterschiedlicher Items an die Patienten die diagnostischen Befunde
zwischen Patienten und Messzeitpunkten (z. B. Prä-Post-Vergleich) vergleichbar sind.
In diesem Beitrag wird gezeigt, welche Entwicklungsschritte eine fundierte adaptive
Testprozedur durchlaufen muss und wie der Einsatz auch in der medizinischen Rehabilitation
zum Gewinn für Anwender und Patient werden kann.
Abstract
For diagnostics and outcome measurement in clinical rehabilitation a multitude of
questionnaires is used. In order to gain comparability of the diagnostic findings,
generally, the same information is gathered of all patients, regardless of their state
of health or how severely ill they are, by using identical groups of items. In this
kind of assessment it is, however, problematic that (a) the assessment instrument
usually only allows for adequate and reliable diagnostics of patients who suffer from
injuries or illnesses of medium severity, and (b) that an uneconomic data collection
is required because of an extensive set of items which may in individual cases be
uninformative and unnecessary. This article shows how data assessment can be adjusted
to the individual handicaps of the patient by using adaptive or tailored testing.
Thus it can be ensured that the testing becomes more economical and results more precise.
Furthermore, a high acceptance by the patients participating in the data collection
can be achieved, as the test items submitted fit the ability of the patients adequately.
Yet, adaptive test systems require a complex and very careful psychometrical development
of the assessment procedure in such a way that in spite of presenting different items
to patients, diagnostic outcomes are comparable between patients and for different
points in time (e. g., pre-post comparison). This article shows the steps of development
that have to be accomplished in order to set up a psychometrically sound adaptive
test procedure. Moreover, it shows how its usage in the area of medical rehabilitation
can be profitable for handlers and patients.
Schlüsselwörter
outcome-messung - Item-Response-Theorie - Computer-adaptives Testen (CAT)
Key words
adaptive testing - item response theory - computer-adaptive testing (CAT)
Literatur
1
Andresen EM.
Criteria for assessing the tools of disability outcomes research.
Archives of Physical Medicine and Rehabilitation.
2000;
81
(S 02)
S15-S20
2 Keith RA, Granger CV, Hamilton BB, Sherwin FS. The Functional Independence Measure:
A new tool for rehabilitation. In: MG Eisenberg, RC Grzesiak Hrsg. Advances in clinical
rehabilitation. New York: Springer; 1987: 6-18
3
Mahoney FI, Barthel DW.
Functional Evaluation: The Barthel Index.
Maryland State Medical Journal.
1965;
21
61-65
4
Lübke N, Grassl A, Kundy M. et al .
Hamburger Einstufungsmanual zum Barthel-Index.
Geriatrie Journal.
2001;
(1–2)
41-46
5
Gauggel S, Böcker M, Zimmermann P. et al .
Item-response-Theorie und deren Anwendung in der Neurologie.
Nervenarzt.
2004;
75
1179-1186
6
Wirtz M, Böcker M.
Eigenschaften und Nutzen des Rasch-Modells in der klinischen Diagnostik.
Rehabilitation.
2007;
46
238-245
7
Choi SW, Reise SP, Pilkonis PA. et al .
Efficiency of static and computer adaptive short forms compared to full-length measures
of depressive symptoms.
Quality of Life Research.
2010;
19
125-136
8
Fries JF, Cella D, Rose M. et al .
Progress in assessing physical function in arthritis: PROMIS short forms and computerized
adaptive testing.
Journal of Rheumatology.
2009;
36
(9)
2061-2066
9 Bengel J, Wirtz M, Zwingmann C,. Hrsg Diagnostische Verfahren in der Rehabilitation.
Göttingen: Hogrefe; 2008
10
Tesio L.
Measuring behaviours and perceptions: Rasch analysis as a tool for rehabilitation
research.
Journal of Rehabilitation Medicine.
2003;
35
105-115
11 Wright BD, Stone M. Best test design. Chicago: MESA Press; 1979
12
McHorney CA.
Ten recommendations for advancing patient-centered outcomes measurement for older
persons.
Annals of Internal Medicine.
2003;
139
403-409
13
Ware JE, Gandek B, Sinclair SJ, Bjorner JB.
Item response theory and computerized adaptive testing: Implications for outcomes
measurement in rehabilitation.
Rehabilitation Psychology.
2005;
50
(1)
71-78
14 Frey A. Adaptives Testen. In: H Moosbrugger, A Keleva, Hrsg. Testtheorie und Fragebogenkonstruktion.
Springer: Berlin; 2007: 261-278
15
Gauggel S, Birkner B.
Diagnostik depressiver Störungen bei älteren Menschen: Eine Übersicht über Entwicklung
und Evaluation der „Geriatric Depression Scale” (GDS).
Zeitschrift für Gerontopsychologie und -psychiatrie.
1998;
11
159-171
16
Becker J, Walter OB, Fliege H. et al .
Using the item response theory to develop a computer adaptive test for anxiety.
Quality of Life Research.
2002;
11
670
17
Fliege H, Becker J, Walter OB. et al .
Development of a computer-adaptive test for depression (D-CAT).
Quality of Life Research.
2005;
14
2277-2291
18
Fliege H, Becker J, Walter OB. et al .
Evaluation of a computer-adaptive test for the assessment of depression (D-CAT) in
clinical application.
International Journal of Methods in Psychiatric Research.
2009;
18
23-36
19 Walter OB. Adaptive Tests for Measuring Anxiety and Depression. In: W van der Linden,
CAW Glas, Hrsg Elements of adaptive testing. New York: Springer; 2010: 123-136
20 Kocalevent RD. Stress-CAT – Entwicklung eines computeradaptiven Tests zur Erfassung
von Stresserleben. Saarbrücken: VDM; 2007
21
DeWalt DA, Rothrock N, Yount S, Stone AA.
Evaluation of item candidates: the PROMIS qualitative item review.
Medical Care.
2007;
45
(5 Suppl 1)
S12-S21
22
Reeve BB, Hays RD, Bjorner JB. et al .
Psychometric evaluation and calibration of health-related quality of life item banks:
plans for the Patient-Reported Outcomes Measurement Information System (PROMIS).
Medical Care.
2007;
45
(5 Suppl 1)
S22-S31
23
Hays RD, Liu H, Spitzer K, Cella D.
Item response theory analyses of physical functioning items in the medical outcomes
study.
Medical Care.
2007;
45
(5 Suppl 1)
S32-S38
24
Forkmann T, Boecker M, Norra C. et al .
Development of an item bank for the assessment of depression in persons with mental
illnesses and physical diseases using Rasch analysis.
Rehabilitation Psychology.
2009;
54
186-197
25
World Health Organisation (WHO)
.International Classification of Functioning, Disability and Health (ICF). Geneva:
WHO; 2001
26
Farin E, Fleitz A, Follert P.
Entwicklung eines ICF-orientierten Patientenfragebogens zur Erfassung von Mobilität
und Selbstversorgung.
Physikalische Medizin Rehabilitationsmedizin Kurortmedizin.
2006;
16
197-211
27
Farin E, Fleitz A, Frey C.
Psychometric properties of an International Classification of Functioning, Disability
and Health (ICF)-oriented, adaptive questionnaire for the assessment of mobility,
self-care and domestic life.
Journal of Rehabilitation Medicine.
2007;
39
537-546
1
Koordinatoren der Reihe “Methoden in der Rehabilitationsforschung”: Prof. Dr. Dr. Hermann Faller, Würzburg; Prof. Dr. Thomas Kohlmann, Greifswald; Prof.
Dr. Dr. Christian Zwingmann, Bochum Interessenten, die einen Beitrag zur Reihe beisteuern
möchten, werden gebeten, vorab Kontakt aufzunehmen, E-Mail: christian.zwingmann@web.de.
2 Diese Darstellung des Vorgehens ist vereinfacht. Genauer gesagt werden aufgrund der
Schätzung der Personenfähigkeit (auf Grundlage der vorhandenen Antworten) Items ausgewählt,
die die maximale zusätzliche Information liefern. Dies entspricht oft dem geschilderten
Vorgehen. Eine Person kann aber auch ein eigentlich zu schwieriges Item mit einer
gewissen Wahrscheinlichkeit lösen; dann sollte trotzdem sichergestellt werden, dass
der Algorithmus die Fähigkeit richtig (nämlich unterhalb der Schwierigkeit des gelösten
Items liegend) einschätzt.
Korrespondenzadresse
Prof. Dr. Markus Wirtz
Institut für Psychologie
Pädagogische Hochschule
Freiburg
Kunzenweg 21
79117 Freiburg
eMail: markus.wirtz@ph-freiburg.de