Effektstärken#

Die Effektstärke quantifiziert die Größe eines Effekts unabhängig von der Stichprobengröße. Während der p-Wert nur angibt, ob ein Effekt statistisch signifikant ist, sagt die Effektstärke, wie groß der Effekt ist.

Warum Effektstärken wichtig sind#

Ein statistisch signifikantes Ergebnis kann praktisch unbedeutend sein. Umgekehrt kann ein nicht-signifikantes Ergebnis einen substanziellen Effekt widerspiegeln, der bei geringer Stichprobengröße nicht erkannt wurde.

Warum p-Werte allein nicht reichen

Zwei Studien untersuchen die Wirkung eines Medikaments:

Studie A (n = 20): Mittelwertunterschied = 8 Punkte, p = 0,12, d = 0,72
Studie B (n = 5000): Mittelwertunterschied = 0,3 Punkte, p < 0,001, d = 0,04

Studie B ist signifikant, aber der Effekt ist winzig. Studie A zeigt einen substanziellen Effekt, der wegen der kleinen Stichprobe nicht signifikant wurde.

Wichtige Effektstärkemaße#

Cohens d — Für Mittelwertvergleiche#

Cohens d misst den Unterschied zwischen zwei Mittelwerten in Einheiten der Standardabweichung.

Für unabhängige Stichproben:

d = \frac{\bar{X}_1 - \bar{X}_2}{s_p}

mit der gepoolten Standardabweichung:

s_p = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}}

Für gepaarte Stichproben (Cohens d_z):

d_z = \frac{\bar{d}}{s_d}

Bewertung	Cohens d
Klein	0,2
Mittel	0,5
Groß	0,8

Eta-Quadrat (η²) — Für ANOVA#

Eta-Quadrat gibt den Anteil der erklärten Varianz an der Gesamtvarianz an.

\eta^2 = \frac{SS_{\text{Effekt}}}{SS_{\text{gesamt}}}

Bewertung	η²
Klein	0,01
Mittel	0,06
Groß	0,14

Hinweis: η² überschätzt die Populationseffektstärke systematisch. Besser ist partielles η² oder Omega-Quadrat (ω²).

Partielles Eta-Quadrat (η²_p)#

Im Kontext mehrfaktorieller ANOVAs berücksichtigt partielles η² nur die relevante Fehlerstreuung:

\eta_p^2 = \frac{SS_{\text{Effekt}}}{SS_{\text{Effekt}} + SS_{\text{Fehler}}}

Omega-Quadrat (ω²) — Unverzerrter Schätzer#

\omega^2 = \frac{SS_{\text{Effekt}} - df_{\text{Effekt}} \cdot MS_{\text{Fehler}}}{SS_{\text{gesamt}} + MS_{\text{Fehler}}}

Korrelationskoeffizient r#

Pearsons r ist selbst ein Effektstärkemaß für den linearen Zusammenhang zweier Variablen.

| Bewertung | |r| | |---|---| | Klein | 0,10 | | Mittel | 0,30 | | Groß | 0,50 |

Umrechnung zwischen Effektstärkemaßen#

r = \frac{d}{\sqrt{d^2 + 4}}

d = \frac{2r}{\sqrt{1 - r^2}}

Cramers V — Für kategoriale Daten#

Cramers V ist das Effektstärkemaß für den Chi-Quadrat-Test:

V = \sqrt{\frac{\chi^2}{n \cdot (k - 1)}}

wobei k das Minimum aus Zeilen- und Spaltenanzahl ist.

Effektstärken berichten#

Die APA (American Psychological Association) empfiehlt, immer Effektstärken und Konfidenzintervalle zu berichten.

Korrekte Ergebnisdarstellung nach APA

„Der unabhängige t-Test zeigte einen signifikanten Unterschied zwischen Experimentalgruppe (M = 24,3, SD = 4,1) und Kontrollgruppe (M = 20,1, SD = 3,8), t(38) = 3,28, p = 0,002, d = 1,06, 95 % KI [0,38; 1,73]."

Praktische Einordnung#

Die Richtwerte von Cohen (klein, mittel, groß) sind allgemeine Orientierungswerte. Die praktische Bedeutsamkeit hängt vom Kontext ab:

In der Medizin kann ein „kleiner" Effekt (d = 0,2) tausende Leben retten
In der Bildungsforschung ist ein „mittlerer" Effekt (d = 0,5) bereits beachtlich
In der Grundlagenforschung sind auch große Effekte nicht ungewöhnlich

Häufige Missverständnisse#

„Ein signifikanter p-Wert bedeutet einen großen Effekt." Nein. Signifikanz und Effektstärke sind unabhängige Konzepte. Die Signifikanz hängt stark von der Stichprobengröße ab.

„Cohens Richtwerte gelten universell." Die Richtwerte (0,2 / 0,5 / 0,8) sind Konventionen. In manchen Forschungsbereichen ist d = 0,2 bereits ein relevanter Effekt, in anderen ist d = 0,8 eher klein.

„Negative Effektstärken bedeuten schlechte Ergebnisse." Das Vorzeichen gibt nur die Richtung an. Ein d = -0,5 ist genauso groß wie d = +0,5, nur in die andere Richtung.

Weiterführende Literatur

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2. Aufl.). Lawrence Erlbaum Associates.
Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.