p-Werte#
Der p-Wert ist eines der am hĂ€ufigsten verwendeten â und am hĂ€ufigsten missverstandenen â Konzepte in der Statistik. Ein korrektes VerstĂ€ndnis ist entscheidend fĂŒr die Interpretation jedes statistischen Tests.
Definition#
Der p-Wert ist die Wahrscheinlichkeit, ein mindestens so extremes Ergebnis wie das beobachtete zu erhalten, wenn die Nullhypothese wahr ist.
Formal ausgedrĂŒckt:
Ein kleiner p-Wert bedeutet: Das beobachtete Ergebnis wÀre unter der Nullhypothese unwahrscheinlich. Das spricht gegen die Nullhypothese.
Das Signifikanzniveau α#
Das Signifikanzniveau (Alpha, α) ist ein im Voraus festgelegter Schwellenwert. In den meisten Disziplinen gilt:
Die Entscheidungsregel lautet:
- p < α â Ergebnis ist statistisch signifikant â Nullhypothese wird abgelehnt
- p ℠α â Ergebnis ist nicht signifikant â Nullhypothese kann nicht abgelehnt werden
Beispiel: t-Test mit p = 0,03
Ein t-Test zum Vergleich zweier Gruppen ergibt p = 0,03.
Korrekte Interpretation: Unter der Annahme, dass kein Unterschied zwischen den Gruppen besteht (Hâ), wĂŒrde man in nur 3 % der FĂ€lle ein so extremes oder extremeres Ergebnis erhalten. Da 0,03 < 0,05, wird das Ergebnis als statistisch signifikant betrachtet.
Falsche Interpretation: âEs gibt eine 97%-ige Wahrscheinlichkeit, dass der Effekt echt ist." â Das ist nicht korrekt!
Verschiedene Alpha-Niveaus#
| Niveau | Bezeichnung | Verwendung |
|---|---|---|
| α = 0,10 | Marginal signifikant | Explorative Studien |
| α = 0,05 | Signifikant | Standard in den meisten Fachgebieten |
| α = 0,01 | Hoch signifikant | Strengere Kriterien |
| α = 0,001 | Höchst signifikant | Sehr konservative Tests |
Einseitige vs. zweiseitige Tests#
- Zweiseitiger Test: PrĂŒft, ob ein Unterschied in beide Richtungen vorliegt. StandardmĂ€Ăig empfohlen.
- Einseitiger Test: PrĂŒft nur eine Richtung (z. B. âGruppe A ist besser als Gruppe B"). Der p-Wert ist halb so groĂ.
Wichtig: Einseitige Tests sollten nur verwendet werden, wenn die Richtung des Effekts vor der Datenerhebung festgelegt wurde.
Multiples Testen#
Werden mehrere Tests gleichzeitig durchgefĂŒhrt, steigt die Wahrscheinlichkeit, mindestens einen falsch-positiven Befund zu erhalten:
Bei 20 Tests mit α = 0,05 betrĂ€gt die Wahrscheinlichkeit fĂŒr mindestens einen Fehler bereits 64 %.
Korrekturen:
- Bonferroni: â Einfach, aber konservativ
- Holm-Bonferroni: Schrittweise Korrektur, weniger konservativ
- Benjamini-Hochberg: Kontrolliert die False Discovery Rate (FDR)
p-Wert und EffektstÀrke#
Ein signifikanter p-Wert sagt nichts ĂŒber die praktische Bedeutsamkeit eines Effekts aus.
Beispiel: GroĂe Stichprobe, kleiner Effekt
Bei n = 10.000 pro Gruppe findet ein t-Test einen signifikanten Unterschied (p < 0,001) von 0,5 Punkten auf einer 100-Punkte-Skala. Statistisch signifikant â aber praktisch völlig irrelevant.
Deshalb sollte immer die EffektstÀrke zusÀtzlich berichtet werden.
HÀufige MissverstÀndnisse#
âDer p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese wahr ist." Falsch. Der p-Wert sagt nichts ĂŒber die Wahrscheinlichkeit der Hypothese. Er gibt die Wahrscheinlichkeit der Daten unter der Annahme der Nullhypothese an.
âp = 0,05 bedeutet, dass der Effekt mit 95 % Sicherheit real ist." Falsch. Der p-Wert ist keine Wahrscheinlichkeit fĂŒr die Hypothese, sondern fĂŒr die Daten.
âEin nicht-signifikantes Ergebnis beweist, dass kein Effekt existiert." Falsch. Ein p > 0,05 bedeutet nur, dass die Evidenz nicht ausreicht, um die Nullhypothese abzulehnen. Der Effekt könnte dennoch existieren (fehlende Power).
âp = 0,049 und p = 0,051 sind grundlegend verschieden." Falsch. Der Unterschied ist minimal. Die Grenze bei 0,05 ist eine Konvention, kein Naturgesetz. Die Interpretation sollte nicht auf einem einzelnen Schwellenwert basieren.
âJe kleiner der p-Wert, desto gröĂer der Effekt." Falsch. Der p-Wert hĂ€ngt von der EffektstĂ€rke und der StichprobengröĂe ab. Ein winziger Effekt kann bei riesiger Stichprobe hochsignifikant sein.
WeiterfĂŒhrende Literatur
- Fisher, R. A. (1925). Statistical Methods for Research Workers. Oliver and Boyd.
- Wasserstein, R. L. & Lazar, N. A. (2016). The ASA statement on p-values: Context, process, and purpose. The American Statistician, 70(2), 129â133.
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.