Zusammenfassung
Häufig werden zur Klärung von Zusammenhängen zwischen Messgrößen Regressionsanalysen
benutzt. Dabei bedeutet Regression die Untersuchung, inwiefern Ausprägungen einer
abhängigen Variablen sich zurückführen lassen auf die Ausprägungen einer oder mehrerer
unabhängiger Variablen. Somit können Modelle aufgestellt werden, um interessierende
Zielgrößen anhand bekannter Messwerte schätzen zu können. In rehabilitationswissenschaftlichen
Studien werden sehr häufig dichotome Zielgrößen, d. h. Merkmale mit nur zwei Ausprägungen
(z. B. erwerbsfähig: ja oder nein), erhoben. Für die Modellierung einer solchen Zielgröße
eignet sich das logistische Regressionsmodell. In diesem Beitrag wird dieses in der
Praxis häufig angewendete Modell hergeleitet und beschrieben. Ein wichtiger Aspekt
für die praktische Anwendung ist die Interpretierbarkeit der Regressionskoeffizienten.
Deshalb folgt eine entsprechende Beschreibung, speziell die Schätzung des Risikos
durch Vorliegen von Risikofaktoren. Anschließend wird auf Modellierungsaspekte und
-probleme hingewiesen, bevor das Modell anhand eines Beispiels aus der rehabilitationswissenschaftlichen
Forschung zur Prognose einer Erwerbsunfähigkeit nach stationärer Rehabilitation exemplarisch
angewendet wird.
Abstract
Regression analysis is a frequently used tool to examine associations between a dependent
(outcome) variable and one or more independent variables. The resulting model enables
prediction of an unobserved outcome based on the observed independent variables. In
rehabilitation research the dependent variable is quite often dichotomous, i. e. having
just two parameter values (e. g. capable of work: yes/no). For such an outcome variable,
the logistic regression model can be applied, having specific advantages in interpreting
the model parameters with respect to risk factor analysis. In this paper the basics
of the logistic regression model, interpretation of the model parameters and special
aspects of modelling are presented. Subsequently the logistic regression model is
applied to an example dataset for estimating the risk of early retirement after inpatient
rehabilitation.
Schlüsselwörter
logistische Regression - dichotome Zielgröße - Odds Ratio
Key words
logistic regression - dichotomous outcome - odds ratio
Literatur
- 1 Harrell Jr FE.
Regression modeling strategies. New York: Springer 2001
- 2
Bender R, Ziegler A, Lange S.
Logistische Regression.
Deut Med Wochenschr.
2002;
127
T11-T13
- 3
Muche R, Kaluscha R, Jacobi E.
Ist das ärztliche Urteil in der Qualitätssicherung stationärer Rehabilitation bei
Patienten mit Erkrankungen des Bewegungsapparates durch Routineparameter zu ersetzen?
Eine Untersuchung an 12.014 Beobachtungen.
Z ärztl Fortbild Qual Sich.
2005;
99
51-56
- 4 Hosmer DW, Lemeshow S.
Applied logistic regression. 2. Aufl. New York: John Wiley, 2000
- 5 Allison PD.
Logistic regression using the SAS system. Cary, NC: SAS Institute Books by Users, 1999
- 6 Kleinbaum DG, Klein M.
Logistic regression - A self-learning text. 2. Aufl. New York: Springer, 2002
- 7
Diaz-Bone R.
Eine kurze Einführung in die logistische Regression und binäre Logit-Analyse.
2003;
, - verfügbar unter:
http://www.agis.uni-hannover.de/EQQS/modulijk/Logistische_Regression.pdf
, (aufgerufen 7.8.2007)
- 8
Erlinghagen M.
Die binäre Logistische Regression - ein vielseitiges und robustes Analyseinstrument
sozialwissenschaftlicher Forschung.
2003;
, - verfügbar unter:
http://www.iatge.de/aktuell/veroeff/2003/erling07.pdf
, (aufgerufen am 7.8.2007)
- 9
Hupfeld J.
Logistische Regression - Eine Einführung.
1999;
, - verfügbar unter:
http://www.psy.unibe.ch/soz/team/pdf/hupfeld/Hupfeld1999c.pdf
, (aufgerufen am 7.8.2007)
- 10
Koch A.
Logistische Regression zur Modellierung von Binärdaten.
1999;
, - verfügbar unter:
http://www.urz.uni-heidelberg.de/statistik/sas-ah/2.2.2/LogistischeRegression.html
, (aufgerufen am 7.8.2007)
- 11
Abbott RD, Carroll RJ.
Interpreting multiple logistic regression coefficients in prospective observational
studies.
Am J Epidemiol.
1984;
119
830-836
- 12
Greenland S.
Limitations of the logistic analysis of epidemiologic data.
Am J Epidemiol.
2002;
110
693-698
- 13
Faller H.
Signifikanz, Effektstärke und Konfidenzintervall.
Rehabilitation.
2004;
43
174-178
- 14
Bland JM, Altman DG.
The odds ratio.
BMJ.
2000;
320
1468
- 15
Pepe MS.
Receiver operating characteristic methodology.
J Am Stat Assoc.
2000;
95
308-311
- 16
Faller H.
Sensitivität, Spezifität, positiver und negativer Vorhersagewert.
Rehabilitation.
2005;
44
44-49
- 17 Muche R. Variablenselektion in Kohortenstudien.
Dissertation. Ulm: Universität Ulm 1995
- 18
Peduzzi PN, Concato J, Kemper E, Holford TR, Feinstein A.
A simulation study of the number of events per variable in logistic regression analysis.
J Clin Epidemiol.
1996;
99
1373-1379
- 19
Muche R, Rösch M, Flierl S, Alt B, Jacobi E, Gaus W.
Entwicklung und Validierung eines Prognosemodells zur Vorhersage der Arbeitsfähigkeit
nach Rehabilitation anhand routinemäßig erhobener Parameter.
Rehabilitation.
2000;
39
262-267
- 20 Muche R, Ring C, Ziegler C.
Entwicklung und Validierung von Prognosemodellen auf der Basis der logistischen Regression. Aachen: Shaker, 2005
1 Koordinatoren der Reihe „Methoden in der Rehabilitationsforschung ”: Prof. Dr. Dr.
Hermann Faller, Würzburg; Prof. Dr.Thomas Kohlmann, Greifswald; Dr. Christian Zwingmann,Siegburg
Interessenten, die einen Beitrag zur Reihe beisteuernmöchten, werden gebeten, vorab
Kontakt aufzunehmen,eMail: E-Mail: christian.zwingmann@web.de
Korrespondenzadresse
PD Dr. Rainer Muche
Universität Ulm
Institut für Biometrie
Schwabstr. 13
89075 Ulm
eMail: rainer.muche@uni-ulm.de