PickMyTest

Effektstärken

Maße für die praktische Bedeutsamkeit statistischer Ergebnisse

Effektstärken#

Die Effektstärke quantifiziert die Größe eines Effekts unabhängig von der Stichprobengröße. Während der p-Wert nur angibt, ob ein Effekt statistisch signifikant ist, sagt die Effektstärke, wie groß der Effekt ist.

Warum Effektstärken wichtig sind#

Ein statistisch signifikantes Ergebnis kann praktisch unbedeutend sein. Umgekehrt kann ein nicht-signifikantes Ergebnis einen substanziellen Effekt widerspiegeln, der bei geringer Stichprobengröße nicht erkannt wurde.

Warum p-Werte allein nicht reichen

Zwei Studien untersuchen die Wirkung eines Medikaments:

  • Studie A (n = 20): Mittelwertunterschied = 8 Punkte, p = 0,12, d = 0,72
  • Studie B (n = 5000): Mittelwertunterschied = 0,3 Punkte, p < 0,001, d = 0,04

Studie B ist signifikant, aber der Effekt ist winzig. Studie A zeigt einen substanziellen Effekt, der wegen der kleinen Stichprobe nicht signifikant wurde.

Wichtige Effektstärkemaße#

Cohens d — Für Mittelwertvergleiche#

Cohens d misst den Unterschied zwischen zwei Mittelwerten in Einheiten der Standardabweichung.

Für unabhängige Stichproben:

d=Xˉ1Xˉ2spd = \frac{\bar{X}_1 - \bar{X}_2}{s_p}

mit der gepoolten Standardabweichung:

sp=(n11)s12+(n21)s22n1+n22s_p = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}}

Für gepaarte Stichproben (Cohens d_z):

dz=dˉsdd_z = \frac{\bar{d}}{s_d}
BewertungCohens d
Klein0,2
Mittel0,5
Groß0,8

Eta-Quadrat (η²) — Für ANOVA#

Eta-Quadrat gibt den Anteil der erklärten Varianz an der Gesamtvarianz an.

η2=SSEffektSSgesamt\eta^2 = \frac{SS_{\text{Effekt}}}{SS_{\text{gesamt}}}
Bewertungη²
Klein0,01
Mittel0,06
Groß0,14

Hinweis: η² überschätzt die Populationseffektstärke systematisch. Besser ist partielles η² oder Omega-Quadrat (ω²).

Partielles Eta-Quadrat (η²_p)#

Im Kontext mehrfaktorieller ANOVAs berücksichtigt partielles η² nur die relevante Fehlerstreuung:

ηp2=SSEffektSSEffekt+SSFehler\eta_p^2 = \frac{SS_{\text{Effekt}}}{SS_{\text{Effekt}} + SS_{\text{Fehler}}}

Omega-Quadrat (ω²) — Unverzerrter Schätzer#

ω2=SSEffektdfEffektMSFehlerSSgesamt+MSFehler\omega^2 = \frac{SS_{\text{Effekt}} - df_{\text{Effekt}} \cdot MS_{\text{Fehler}}}{SS_{\text{gesamt}} + MS_{\text{Fehler}}}

Korrelationskoeffizient r#

Pearsons r ist selbst ein Effektstärkemaß für den linearen Zusammenhang zweier Variablen.

| Bewertung | |r| | |---|---| | Klein | 0,10 | | Mittel | 0,30 | | Groß | 0,50 |

Umrechnung zwischen Effektstärkemaßen#

r=dd2+4r = \frac{d}{\sqrt{d^2 + 4}} d=2r1r2d = \frac{2r}{\sqrt{1 - r^2}}

Cramers V — Für kategoriale Daten#

Cramers V ist das Effektstärkemaß für den Chi-Quadrat-Test:

V=χ2n(k1)V = \sqrt{\frac{\chi^2}{n \cdot (k - 1)}}

wobei k das Minimum aus Zeilen- und Spaltenanzahl ist.

Effektstärken berichten#

Die APA (American Psychological Association) empfiehlt, immer Effektstärken und Konfidenzintervalle zu berichten.

Korrekte Ergebnisdarstellung nach APA

„Der unabhängige t-Test zeigte einen signifikanten Unterschied zwischen Experimentalgruppe (M = 24,3, SD = 4,1) und Kontrollgruppe (M = 20,1, SD = 3,8), t(38) = 3,28, p = 0,002, d = 1,06, 95 % KI [0,38; 1,73]."

Praktische Einordnung#

Die Richtwerte von Cohen (klein, mittel, groß) sind allgemeine Orientierungswerte. Die praktische Bedeutsamkeit hängt vom Kontext ab:

  • In der Medizin kann ein „kleiner" Effekt (d = 0,2) tausende Leben retten
  • In der Bildungsforschung ist ein „mittlerer" Effekt (d = 0,5) bereits beachtlich
  • In der Grundlagenforschung sind auch große Effekte nicht ungewöhnlich

Häufige Missverständnisse#

„Ein signifikanter p-Wert bedeutet einen großen Effekt." Nein. Signifikanz und Effektstärke sind unabhängige Konzepte. Die Signifikanz hängt stark von der Stichprobengröße ab.

„Cohens Richtwerte gelten universell." Die Richtwerte (0,2 / 0,5 / 0,8) sind Konventionen. In manchen Forschungsbereichen ist d = 0,2 bereits ein relevanter Effekt, in anderen ist d = 0,8 eher klein.

„Negative Effektstärken bedeuten schlechte Ergebnisse." Das Vorzeichen gibt nur die Richtung an. Ein d = -0,5 ist genauso groß wie d = +0,5, nur in die andere Richtung.

Weiterführende Literatur

  • Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2. Aufl.). Lawrence Erlbaum Associates.
  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.