Gesundheitswesen 2019; 81(08/09): 727
DOI: 10.1055/s-0039-1694552
Kongresstag 2: 17.09.2019
Georg Thieme Verlag KG Stuttgart · New York

Simulationsstudie zum Vergleich Multipler Imputationen und der Analyse vollständiger Fälle in sozialwissenschaftlichen Daten

M Herke
1   Institut für Medizinische Soziologie (IMS), Martin-Luther-Universität Halle-Wittenberg, Halle (Saale)
› Author Affiliations
Further Information

Publication History

Publication Date:
23 August 2019 (online)

 

Einleitung:

Fehlende Werte sind ein allgegenwärtiges Problem in der Analyse sozialwissenschaftlicher Daten. Es ist dabei wahrscheinlich, dass das Fehlen von Werten mit anderen beobachteten (Missing At Random, MAR) oder unbeobachteten (Missing Not At Random, MNAR) Eigenschaften zusammenhängt, statt gänzlich zufällig (Missing Completely At Random, MCAR) zu sein. Bei der Analyse vollständiger Fälle (Complete Cases, CC) führt dies zu deutlich größeren Standardfehlern und teils Verzerrungen in den Schätzern, doch modernere Methoden wie Multiple Imputationen (MI) werden selten genutzt. Am Beispiel einer Analyse aus der Jugendgesundheitsforschung werden die Verfahren verglichen.

Methoden:

Einer Simulationsstudie wurde ein logistisches Regressionsmodell zugrunde gelegt, das selbstberichtete Gesundheit in Abhängigkeit von Alter, Geschlecht, sozioökonomischem Status, Alkohol- sowie Tabakkonsum analysiert. Aus den letzten drei unabhängigen Variablen werden 10%, 25% und 50% der Werte zu variierenden Beteiligungen aus MCAR, MAR und MNAR gelöscht. Jede Kombination durchlief 1000 Replikationen.

Ergebnisse:

Da MCAR, MAR und MNAR zusammen 100% der Ausfallwahrscheinlichkeit abbilden, werden die Ergebnisse in einem Dreiecksdiagramm dargestellt. MCAR verursacht keine Verzerrungen der Schätzer, doch die Standardfehler fallen bei MI deutlich kleiner aus. MAR produziert teils starke Verzerrung in CC, insbesondere in Kombination mit MNAR, welche durch MI verringert werden können, jedoch bei vielen fehlenden Werten noch immer deutlich ist. MNAR allein verursacht fast keine Verzerrung, jedoch die stärkste Inflation der Standardfehler.

Diskussion:

MI ist CC in allen Fällen mindestens ebenbürtig. Viele fehlende Werte sind stets problematisch, doch MI kann der Inflation der Standardfehler teilweise entgegenwirken und Bias teils drastisch reduzieren. Insbesondere in einfacheren Analysen sollte die Analyse mit MI häufiger stattfinden.