Effektstärken#
Die Effektstärke quantifiziert die Größe eines Effekts unabhängig von der Stichprobengröße. Während der p-Wert nur angibt, ob ein Effekt statistisch signifikant ist, sagt die Effektstärke, wie groß der Effekt ist.
Warum Effektstärken wichtig sind#
Ein statistisch signifikantes Ergebnis kann praktisch unbedeutend sein. Umgekehrt kann ein nicht-signifikantes Ergebnis einen substanziellen Effekt widerspiegeln, der bei geringer Stichprobengröße nicht erkannt wurde.
Warum p-Werte allein nicht reichen
Zwei Studien untersuchen die Wirkung eines Medikaments:
- Studie A (n = 20): Mittelwertunterschied = 8 Punkte, p = 0,12, d = 0,72
- Studie B (n = 5000): Mittelwertunterschied = 0,3 Punkte, p < 0,001, d = 0,04
Studie B ist signifikant, aber der Effekt ist winzig. Studie A zeigt einen substanziellen Effekt, der wegen der kleinen Stichprobe nicht signifikant wurde.
Wichtige Effektstärkemaße#
Cohens d — Für Mittelwertvergleiche#
Cohens d misst den Unterschied zwischen zwei Mittelwerten in Einheiten der Standardabweichung.
Für unabhängige Stichproben:
mit der gepoolten Standardabweichung:
Für gepaarte Stichproben (Cohens d_z):
| Bewertung | Cohens d |
|---|---|
| Klein | 0,2 |
| Mittel | 0,5 |
| Groß | 0,8 |
Eta-Quadrat (η²) — Für ANOVA#
Eta-Quadrat gibt den Anteil der erklärten Varianz an der Gesamtvarianz an.
| Bewertung | η² |
|---|---|
| Klein | 0,01 |
| Mittel | 0,06 |
| Groß | 0,14 |
Hinweis: η² überschätzt die Populationseffektstärke systematisch. Besser ist partielles η² oder Omega-Quadrat (ω²).
Partielles Eta-Quadrat (η²_p)#
Im Kontext mehrfaktorieller ANOVAs berücksichtigt partielles η² nur die relevante Fehlerstreuung:
Omega-Quadrat (ω²) — Unverzerrter Schätzer#
Korrelationskoeffizient r#
Pearsons r ist selbst ein Effektstärkemaß für den linearen Zusammenhang zweier Variablen.
| Bewertung | |r| | |---|---| | Klein | 0,10 | | Mittel | 0,30 | | Groß | 0,50 |
Umrechnung zwischen Effektstärkemaßen#
Cramers V — Für kategoriale Daten#
Cramers V ist das Effektstärkemaß für den Chi-Quadrat-Test:
wobei k das Minimum aus Zeilen- und Spaltenanzahl ist.
Effektstärken berichten#
Die APA (American Psychological Association) empfiehlt, immer Effektstärken und Konfidenzintervalle zu berichten.
Korrekte Ergebnisdarstellung nach APA
„Der unabhängige t-Test zeigte einen signifikanten Unterschied zwischen Experimentalgruppe (M = 24,3, SD = 4,1) und Kontrollgruppe (M = 20,1, SD = 3,8), t(38) = 3,28, p = 0,002, d = 1,06, 95 % KI [0,38; 1,73]."
Praktische Einordnung#
Die Richtwerte von Cohen (klein, mittel, groß) sind allgemeine Orientierungswerte. Die praktische Bedeutsamkeit hängt vom Kontext ab:
- In der Medizin kann ein „kleiner" Effekt (d = 0,2) tausende Leben retten
- In der Bildungsforschung ist ein „mittlerer" Effekt (d = 0,5) bereits beachtlich
- In der Grundlagenforschung sind auch große Effekte nicht ungewöhnlich
Häufige Missverständnisse#
„Ein signifikanter p-Wert bedeutet einen großen Effekt." Nein. Signifikanz und Effektstärke sind unabhängige Konzepte. Die Signifikanz hängt stark von der Stichprobengröße ab.
„Cohens Richtwerte gelten universell." Die Richtwerte (0,2 / 0,5 / 0,8) sind Konventionen. In manchen Forschungsbereichen ist d = 0,2 bereits ein relevanter Effekt, in anderen ist d = 0,8 eher klein.
„Negative Effektstärken bedeuten schlechte Ergebnisse." Das Vorzeichen gibt nur die Richtung an. Ein d = -0,5 ist genauso groß wie d = +0,5, nur in die andere Richtung.
Weiterführende Literatur
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2. Aufl.). Lawrence Erlbaum Associates.
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.