Cochran-Q-Test#

Der Cochran-Q-Test ist die Erweiterung des McNemar-Tests auf drei oder mehr verbundene Stichproben mit einer binären abhängigen Variable (ja/nein, bestanden/nicht bestanden, richtig/falsch). Wenn du wissen willst, ob sich die Erfolgsrate derselben Personen über mehrere Bedingungen hinweg unterscheidet, ist Cochran Q dein Test.

Wann verwenden?#

Du hast drei oder mehr Bedingungen und die gleichen Personen werden unter jeder Bedingung gemessen
Deine abhängige Variable ist binär (0/1, ja/nein, bestanden/durchgefallen)
Du willst testen, ob die Anteile (z. B. Bestehensquoten) sich zwischen den Bedingungen unterscheiden
Du hast ein Messwiederholungsdesign mit kategorialen Daten — Cochran Q ist das nichtparametrische Gegenstück zur RM-ANOVA für binäre Outcomes
Bei nur zwei Bedingungen verwende stattdessen den McNemar-Test

Voraussetzungen#

Binäre (dichotome) abhängige Variable (0 oder 1)
Verbundene Stichproben — dieselben Personen unter allen Bedingungen
Ausreichend große Stichprobe (Faustregel: n × k ≥ 24)

Hinweis: Cochran Q ist ein Omnibus-Test — er sagt dir nur, dass sich mindestens eine Bedingung unterscheidet, aber nicht welche. Für paarweise Vergleiche verwendest du Post-hoc McNemar-Tests mit Bonferroni-Korrektur.

Formel#

Die Teststatistik Q folgt approximativ einer Chi-Quadrat-Verteilung mit $k - 1$ Freiheitsgraden:

$Q = \frac{k(k-1) \sum_{j=1}^{k}(G_j - \bar{G})^2}{k \sum_{i=1}^{n} R_i - \sum_{i=1}^{n} R_i^2}$

Dabei ist:

$k$ = Anzahl der Bedingungen
$G_j$ = Summe der Erfolge in Bedingung $j$
$\bar{G}$ = Mittelwert der Spaltensummen
$R_i$ = Zeilensumme (Anzahl Erfolge) für Person $i$

Beispiel#

Praxisbeispiel: Prüfungserfolg in drei Fächern

50 Studierende legen drei Prüfungen ab (Statistik, Methodenlehre, Diagnostik). Für jede Prüfung wird erfasst, ob sie bestanden haben (1) oder nicht (0).

	Statistik	Methodenlehre	Diagnostik
Bestanden	38	42	30
Nicht bestanden	12	8	20

Berechnung: $Q = 8.67$ , $df = 2$ , $p = .013$

Interpretation: Die Bestehensquoten unterscheiden sich signifikant zwischen den drei Prüfungen. Post-hoc-Tests (McNemar mit Bonferroni) zeigen, dass Diagnostik eine signifikant niedrigere Bestehensquote hat als Methodenlehre ( $p = .004$ ).

Effektstärke#

Als Effektstärke kann der Cochran-Q-Koeffizient berichtet werden, der den Q-Wert normiert:

$\text{Effektstärke} = \frac{Q}{n(k-1)}$

Dieser Wert liegt zwischen 0 und 1. Alternativ lässt sich Serlin's S verwenden, das den Anteil des maximal möglichen Q-Werts angibt.

Wert	Interpretation
0.01–0.05	kleiner Effekt
0.06–0.15	mittlerer Effekt
> 0.15	großer Effekt

Tipp: Bei signifikantem Ergebnis immer Post-hoc-Tests durchführen. Ohne sie weißt du nicht, welche Bedingungen sich unterscheiden.

Weiterführende Literatur

Sheskin, D. J. (2011). Handbook of Parametric and Nonparametric Statistical Procedures (5th ed.). Chapman & Hall/CRC.
Bortz, J. & Lienert, G. A. (2008). Kurzgefasste Statistik für die klinische Forschung (3. Aufl.). Springer.
Siegel, S. & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). McGraw-Hill.