In nahezu jeder (klinischen) Studie ist es erforderlich,
die gewonnenen Daten in geeigneter und einfacher Weise zusammenzufassen.
Für kategoriale Merkmale, wie zum Beispiel Geschlecht oder
Blutgruppe, liegt es nahe, die Anzahl von Beobachtungen innerhalb
jeder Kategorie darzustellen, gewöhnlich als absolute Häufigkeit
oder Prozentwert bezogen auf die Gesamtzahl beobachteter Patienten.
Für die statistische Beschreibung von quantitativen, stetigen
Merkmalen wird üblicherweise ein »Durchschnittswert« angegeben.
Ein solcher Wert soll einen für die beobachtete Population
typischen Wert repräsentieren. Unter »Durchschnitt« wird
im allgemeinen Sprachgebrauch der arithmetische Mittelwert verstanden,
der definiert ist als die Summe aller beobachteten Werte geteilt
durch die Gesamtzahl der Beobachtungen.
Neben dem arithmetischen Mittelwert gibt es noch ein weiteres
häufig verwendetes Lagemaß, den Median. Der Median
ist derjenige Wert der sortierten Stichprobe, der genau in der Mitte
liegt. Er teilt die Stichprobe also in zwei gleich große Hälften
(bei geradem Stichprobenumfang liegen genau zwei Werte in der Mitte;
der Median ist dann als arithmetischer Mittelwert dieser beiden
Werte definiert). Die eine Hälfte weist Werte auf, die
kleiner als der Median sind, während die Werte der anderen
Hälfte größer als der Median sind. In [Tab. 1] sind
die Werte für den systolischen Blutdruck zum Zeitpunkt
der Krankenhausaufnahme von 25 Patienten mit akutem Myokardinfarkt
angegeben. Der Mittelwert beträgt 128 mmHg (3200/25),
der Median 123 mmHg (der 13. Wert der sortierten Stichprobe).
Tab. 1 Systolische
Blutdruckwerte von 25 Patienten mit akutem Myokardinfarkt zum Zeitpunkt
der Krankenhausaufnahme (aufgelistet nach Patientennummer und aufsteigend sortiert
nach Höhe des Blutdrucks)
<TD VALIGN="TOP">
Patientennummer
</TD><TD VALIGN="TOP">
systolischer Blutdruck (mm Hg)
</TD><TD VALIGN="TOP">
sortierte Blutdruckwerte (mm Hg)
</TD>
<TD VALIGN="TOP">
1
</TD><TD VALIGN="TOP">
81
</TD><TD VALIGN="TOP">
81
</TD>
<TD VALIGN="TOP">
2
</TD><TD VALIGN="TOP">
170
</TD><TD VALIGN="TOP">
99
</TD>
<TD VALIGN="TOP">
3
</TD><TD VALIGN="TOP">
120
</TD><TD VALIGN="TOP">
106
</TD>
<TD VALIGN="TOP">
4
</TD><TD VALIGN="TOP">
127
</TD><TD VALIGN="TOP">
108
</TD>
<TD VALIGN="TOP">
5
</TD><TD VALIGN="TOP">
190
</TD><TD VALIGN="TOP">
110
</TD>
<TD VALIGN="TOP">
6
</TD><TD VALIGN="TOP">
118
</TD><TD VALIGN="TOP">
113
</TD>
<TD VALIGN="TOP">
7
</TD><TD VALIGN="TOP">
140
</TD><TD VALIGN="TOP">
118
</TD>
<TD VALIGN="TOP">
8
</TD><TD VALIGN="TOP">
132
</TD><TD VALIGN="TOP">
120
</TD>
<TD VALIGN="TOP">
9
</TD><TD VALIGN="TOP">
152
</TD><TD VALIGN="TOP">
120
</TD>
<TD VALIGN="TOP">
10
</TD><TD VALIGN="TOP">
123
</TD><TD VALIGN="TOP">
120
</TD>
<TD VALIGN="TOP">
11
</TD><TD VALIGN="TOP">
106
</TD><TD VALIGN="TOP">
123
</TD>
<TD VALIGN="TOP">
12
</TD><TD VALIGN="TOP">
120
</TD><TD VALIGN="TOP">
123
</TD>
<TD VALIGN="TOP">
13
</TD><TD VALIGN="TOP">
130
</TD><TD VALIGN="TOP">
123
</TD>
<TD VALIGN="TOP">
14
</TD><TD VALIGN="TOP">
99
</TD><TD VALIGN="TOP">
126
</TD>
<TD VALIGN="TOP">
15
</TD><TD VALIGN="TOP">
123
</TD><TD VALIGN="TOP">
127
</TD>
<TD VALIGN="TOP">
16
</TD><TD VALIGN="TOP">
108
</TD><TD VALIGN="TOP">
130
</TD>
<TD VALIGN="TOP">
17
</TD><TD VALIGN="TOP">
123
</TD><TD VALIGN="TOP">
131
</TD>
<TD VALIGN="TOP">
18
</TD><TD VALIGN="TOP">
110
</TD><TD VALIGN="TOP">
132
</TD>
<TD VALIGN="TOP">
19
</TD><TD VALIGN="TOP">
131
</TD><TD VALIGN="TOP">
138
</TD>
<TD VALIGN="TOP">
20
</TD><TD VALIGN="TOP">
126
</TD><TD VALIGN="TOP">
140
</TD>
<TD VALIGN="TOP">
21
</TD><TD VALIGN="TOP">
160
</TD><TD VALIGN="TOP">
140
</TD>
<TD VALIGN="TOP">
22
</TD><TD VALIGN="TOP">
113
</TD><TD VALIGN="TOP">
152
</TD>
<TD VALIGN="TOP">
23
</TD><TD VALIGN="TOP">
120
</TD><TD VALIGN="TOP">
160
</TD>
<TD VALIGN="TOP">
24
</TD><TD VALIGN="TOP">
140
</TD><TD VALIGN="TOP">
170
</TD>
<TD VALIGN="TOP">
25
</TD><TD VALIGN="TOP">
138
</TD><TD VALIGN="TOP">
190
</TD>
<TD VALIGN="TOP" COLSPAN="3">
Mittelwert:
128 mm Hg ([81 + 170 + 120 +
... + 138]/25 = 3 200/25); Median:
123 mm Hg (der 13. Wert der sortierten Stichprobe).
</TD>
Median und arithmetischer Mittelwert haben unterschiedliche Eigenschaften:
Der Median wird von extremen Werten (Ausreißern) praktisch
kaum beeinflusst. Dies ist jedoch kein Qualitätskriterium,
sondern eine Eigenschaft. Sie bedeutet, dass der Median weniger
von Ausreißern »gestört« wird,
andererseits jedoch auch, dass auf Ausreißer weniger deutlich aufmerksam
gemacht wird. Da bei jeder Anwendung ohnehin über Extremwerte
gesondert nachgedacht werden muss, und ihre Auswirkungen berücksichtigt
werden müssen, ist diese Eigenschaft des Medians meist
nicht von erheblicher Relevanz.
Entweder stellt ein Extremwert einen plausiblen Wert der Stichprobe
dar, dann ist der Mittelwert unter dessen Einbeziehung eine sinnvolle
Beschreibung, oder es ist davon auszugehen, dass der Extremwert
unplausibel ist, dann kann der Mittelwert auch ohne diesen Extremwert
berechnet werden. Letzteres erfordert natürlich eine Begründung.
Bei schiefen, unsymmetrischen Verteilungen, wie sie für
Laborwerte typisch sind, kann der Median besser interpretiert werden
als der Mittelwert [1]. Bei einer Erhebung
in einer internistischen Notfallaufnahmestation werden beispielsweise die
Werte der Kreatinkinase (CK) für die meisten Patienten zwischen
0 und 50 U/l liegen, allerdings werden einige Patienten
auch Werte bis 1000 U/l und darüber aufweisen.
Ohne dass hier Ausreißer im eigentlichen Sinne vorliegen,
lässt ein Mittelwert von zum Beispiel 100 U/l überhaupt
keine sinnvolle Interpretation zu, während die Interpretation
des Medians unbeeinflusst bleibt: Die Hälfte der Messwerte
ist niedriger als der Median von zum Beispiel 25 U/l, die
andere Hälfte größer. Häufig
lassen sich aber schiefe Verteilungen durch eine geeignete Transformation
in eine mehr oder weniger symmetrische Form umwandeln, wofür
der Mittelwert dann wieder ein geeignetes Lagemaß darstellt [2]
[3]
.
Bei der Betrachtung von Überlebenszeiten schließlich,
das heißt bei Studien, in denen man sich für die
Zeit bis zum Eintreten eines bestimmten Ereignisses (zum Beispiel
Tod) interessiert, liegen typischerweise nicht für alle
Patienten diese Zeiten vor, sondern es ist nur bekannt, dass innerhalb
eines bestimmten Zeitraumes das interessierende Ereignis nicht eingetreten
ist (zensierte Daten). In einer solchen Situation ist die Berechnung
eines Mittelwertes nicht sinnvoll, während eine mediane Überlebenszeit
spätestens dann angegeben werden kann, wenn die Hälfte
der beobachteten Patienten gestorben ist [1].
kurzgefasst: Der Median teilt eine Stichprobe
in zwei gleiche Hälften. Er wird von extremen Werten (Ausreißern)
praktisch kaum beeinflusst. Deshalb kann der Median zum Beispiel
bei schiefen, unsymmetrischen Verteilungen (Laborwerte) oder bei der
Betrachtung von Überlebenszeiten besser interpretiert werden.
Für die Interpretation englischsprachiger Studien sind
die Übersetzungen der wichtigsten in diesem Beitrag besprochenen
Termini in [Tab. 2] aufgelistet.
Tab. 2 Übersetzungen
(deutsch - englisch)
<TD VALIGN="TOP">
(arithmetischer) Mittelwert
</TD><TD VALIGN="TOP">
(arithmetic) mean
</TD>
<TD VALIGN="TOP">
Median
</TD><TD VALIGN="TOP">
Median
</TD>
<TD VALIGN="TOP">
Ausreißer
</TD><TD VALIGN="TOP">
Outlier
</TD>
<TD VALIGN="TOP">
Stichprobenumfang
</TD><TD VALIGN="TOP">
Sample size
</TD>
<TD VALIGN="TOP">
schiefe Verteilung
</TD><TD VALIGN="TOP">
Skewed distribution
</TD>
<TD VALIGN="TOP">
zensierte Daten
</TD><TD VALIGN="TOP">
Censored data
</TD>