Dtsch Med Wochenschr 2001; 126(Suppl. Statistik): T 42-T 44
DOI: 10.1055/s-2001-12742
Statistik
© Georg Thieme Verlag Stuttgart · New York

Was ist ein Signifikanztest?

Allgemeine AspekteSt Lange1 , R. Bender 2
  • 1Abteilung für Medizinische Informatik, Biometrie und Epidemiologie der Ruhr-Universität Bochum
  • 2Fakultät für Gesundheitswissenschaften, AG Epidemiologie und medizinische Statistik, Universität Bielefeld
Further Information

Publication History

Publication Date:
25 February 2002 (online)

Zum statistischen Nachweis von Unterschieden oder Effekten werden häufig Signifikanztests eingesetzt. Das Ergebnis eines solchen Tests wird zumeist als p-Wert [1] ausgegeben. Anhand dieses p-Werts wird entschieden, ob beobachtete Unterschiede statistisch signifikant sind (wenn der p-Wert kleiner ist als das Signifikanzniveau α von zum Beispiel 5 %) oder nicht.

Bei der Anwendung von Signifikanztests sind allgemein zwei Aspekte zu beachten: Zum einen kann mit Hilfe von Signifikanztests nichts (statistisch) »abgesichert« werden. Der Begriff »Absichern« impliziert eine 100 %ige Sicherheit, also den Ausschluss einer Irrtumsmöglichkeit. Aber diese Irrtumsmöglichkeit ist den Signifikanztests geradezu immanent; sie ist allenfalls unter Einhaltung bestimmter Voraussetzungen quantifizierbar [Signifikanz- bzw. Irrtumsniveau α [1]]. Zum anderen sind Signifikanztests im Sinne einer wissenschaftlichen Hypothesenüberprüfung - einer konfirmatorischen Statistik - nur dann einsetzbar, wenn die zu prüfende Hypothese vor Kenntnis der Daten aufgestellt wurde. Gegen diesen Grundsatz wird allerdings in der Praxis häufig verstoßen. Im anderen Fall können Signifikanztests nur noch der weitergehenden Beschreibung der erhobenen Daten dienen. Für solche deskriptiven Zwecke sind aber häufig Konfidenzintervalle [2] besser geeignet.

Ob nun überhaupt ein Signifikanztest eingesetzt werden soll, und wie er dann gegebenenfalls zu interpretieren ist, hängt also von der wissenschaftlichen Vorgehensweise ab. Wir wollen diese Problematik im Folgenden nicht weiter erörtern. Hat man sich für die Durchführung eines Signifikanztests entschieden, ist die Wahl des zu verwendenden Tests von der Fragestellung, dem Studiendesign und dem Messniveau des betrachteten Merkmals abhängig.

Zunächst muss man entscheiden, ob sich die zu testende Hypothese auf Verteilungsparameter einer Stichprobe bezieht (zum Beispiel ob ein Mittelwert signifikant von 0 verschieden ist), oder ob mehrere Stichproben verglichen werden sollen (zum Beispiel ob sich zwei Mittelwerte signifikant unterscheiden), was den weitaus häufigsten Fall darstellt. Bei der Auswertung von zwei oder mehr Stichproben muss man den Abhängigkeitsstatus der Stichproben berücksichtigen. Handelt es sich um den Vergleich von unabhängigen Gruppen (zum Beispiel im parallelen Gruppendesign einer kontrollierten Studie) so müssen Verfahren für unabhängige Stichproben verwendet werden. Handelt es sich dagegen um den Vergleich von abhängigen Werten (zum Beispiel bei Messwertwiederholungen [3] an denselben Probanden), so kommen Verfahren für abhängige Stichproben in Frage. Der nächste entscheidende Faktor ist das Messniveau der betrachteten Zielgröße. In der Praxis genügt hierbei die Unterscheidung zwischen den Messniveaus binär (ja/nein), nominal (ungeordnete Kategorien, zum Beispiel Tumorentitäten), ordinal (geordnete Kategorien, zum Beispiel Tumorstadien), stetig (quantitatives Merkmal mit theoretisch unendlich vielen Merkmalsausprägungen, zum Beispiel Herzfrequenz) und zensiert (Überlebenszeiten).

kurzgefasst: Signifikanztests dienen zumeist dem statistischen Nachweis von Unterschieden oder Effekten. Dabei versucht man, die Nullhypothese zu widerlegen. Signifikanztests sind nur dann einsetzbar, wenn die Hypothese vor Kenntnis der Daten aufgestellt wurde. Das Ergebnis des Tests wird häufig als p-Wert angegeben. Signifikanz liegt vor, wenn der p-Wert kleiner ist, als das zuvor festgelegte Signifikanzniveau. Mit Signifikanztests kann man die Irrtumswahrscheinlichkeit quantifizieren, nicht ausschließen.

Literatur

  • 1 Bender R, Lange S. Was ist der P-Wert?.  Dtsch med Wschr. 2001;  126 T39-T40
  • 2 Bender R, Lange S. Was ist ein Konfidenzintervall?.  Dtsch med Wschr. 2001;  126 T41
  • 3 Bender R, Lange S. Verlaufskurven.  Dtsch med Wschr. 2001;  126 T45-T46
  • 4 Diehm C, Trampisch H J, Lange S, Schmidt C. Comparsion of leg compression stocking and oral dried horse chestnut seed extract therapy in patients with chronic venous insufficiency.  Lancet. 1996;  347 292-294
  • 5 Lange S, Bender R. Variabilitätsmaße.  Dtsch med Wschr. 2001;  126 T29-T30

Korrespondenz

Dr. Stefan Lange

Abteilung für Medizinische Informatik, Biometrie
und Epidemiologie Ruhr-Universität

Universitätsstraße 150

44780 Bochum

Email: stefan.f.lange@ruhr-uni-bochum.de

    >