PickMyTest

Cochran-Q-Test

Der Cochran-Q-Test vergleicht drei oder mehr verbundene Stichproben mit binärer abhängiger Variable — die Erweiterung des McNemar-Tests.

Cochran-Q-Test#

Der Cochran-Q-Test ist die Erweiterung des McNemar-Tests auf drei oder mehr verbundene Stichproben mit einer binären abhängigen Variable (ja/nein, bestanden/nicht bestanden, richtig/falsch). Wenn du wissen willst, ob sich die Erfolgsrate derselben Personen über mehrere Bedingungen hinweg unterscheidet, ist Cochran Q dein Test.

Wann verwenden?#

  • Du hast drei oder mehr Bedingungen und die gleichen Personen werden unter jeder Bedingung gemessen
  • Deine abhängige Variable ist binär (0/1, ja/nein, bestanden/durchgefallen)
  • Du willst testen, ob die Anteile (z. B. Bestehensquoten) sich zwischen den Bedingungen unterscheiden
  • Du hast ein Messwiederholungsdesign mit kategorialen Daten — Cochran Q ist das nichtparametrische Gegenstück zur RM-ANOVA für binäre Outcomes
  • Bei nur zwei Bedingungen verwende stattdessen den McNemar-Test

Voraussetzungen#

  • Binäre (dichotome) abhängige Variable (0 oder 1)
  • Verbundene Stichproben — dieselben Personen unter allen Bedingungen
  • Ausreichend große Stichprobe (Faustregel: n × k ≥ 24)

Hinweis: Cochran Q ist ein Omnibus-Test — er sagt dir nur, dass sich mindestens eine Bedingung unterscheidet, aber nicht welche. Für paarweise Vergleiche verwendest du Post-hoc McNemar-Tests mit Bonferroni-Korrektur.

Formel#

Die Teststatistik Q folgt approximativ einer Chi-Quadrat-Verteilung mit k1k - 1 Freiheitsgraden:

Q=k(k1)j=1k(GjGˉ)2ki=1nRii=1nRi2Q = \frac{k(k-1) \sum_{j=1}^{k}(G_j - \bar{G})^2}{k \sum_{i=1}^{n} R_i - \sum_{i=1}^{n} R_i^2}

Dabei ist:

  • kk = Anzahl der Bedingungen
  • GjG_j = Summe der Erfolge in Bedingung jj
  • Gˉ\bar{G} = Mittelwert der Spaltensummen
  • RiR_i = Zeilensumme (Anzahl Erfolge) für Person ii

Beispiel#

Praxisbeispiel: Prüfungserfolg in drei Fächern

50 Studierende legen drei Prüfungen ab (Statistik, Methodenlehre, Diagnostik). Für jede Prüfung wird erfasst, ob sie bestanden haben (1) oder nicht (0).

StatistikMethodenlehreDiagnostik
Bestanden384230
Nicht bestanden12820

Berechnung: Q=8.67Q = 8.67, df=2df = 2, p=.013p = .013

Interpretation: Die Bestehensquoten unterscheiden sich signifikant zwischen den drei Prüfungen. Post-hoc-Tests (McNemar mit Bonferroni) zeigen, dass Diagnostik eine signifikant niedrigere Bestehensquote hat als Methodenlehre (p=.004p = .004).

Effektstärke#

Als Effektstärke kann der Cochran-Q-Koeffizient berichtet werden, der den Q-Wert normiert:

Effektsta¨rke=Qn(k1)\text{Effektstärke} = \frac{Q}{n(k-1)}

Dieser Wert liegt zwischen 0 und 1. Alternativ lässt sich Serlin's S verwenden, das den Anteil des maximal möglichen Q-Werts angibt.

WertInterpretation
0.01–0.05kleiner Effekt
0.06–0.15mittlerer Effekt
> 0.15großer Effekt

Tipp: Bei signifikantem Ergebnis immer Post-hoc-Tests durchführen. Ohne sie weißt du nicht, welche Bedingungen sich unterscheiden.

Weiterführende Literatur

  • Sheskin, D. J. (2011). Handbook of Parametric and Nonparametric Statistical Procedures (5th ed.). Chapman & Hall/CRC.
  • Bortz, J. & Lienert, G. A. (2008). Kurzgefasste Statistik für die klinische Forschung (3. Aufl.). Springer.
  • Siegel, S. & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). McGraw-Hill.