PickMyTest

Chi-Quadrat-Anpassungstest

Prüft, ob die beobachtete Häufigkeitsverteilung einer kategorialen Variable einer erwarteten Verteilung entspricht

Chi-Quadrat-Anpassungstest#

Der Chi-Quadrat-Anpassungstest (auch: Goodness-of-Fit-Test) prüft, ob die beobachtete Häufigkeitsverteilung einer kategorialen Variable mit einer theoretisch erwarteten Verteilung übereinstimmt. Er beantwortet die Frage: Weicht die beobachtete Verteilung signifikant von der erwarteten ab?

Wann verwenden?#

Verwende den Chi-Quadrat-Anpassungstest, wenn du:

  • Prüfen möchtest, ob eine Häufigkeitsverteilung einer erwarteten Verteilung entspricht
  • Eine einzelne kategoriale Variable mit mehreren Kategorien untersuchst
  • Testen möchtest, ob Kategorien gleichverteilt sind oder einer bestimmten Verteilung folgen
  • Die Stichprobe ausreichend groß ist (erwartete Häufigkeiten ≥ 5)

Voraussetzungen#

  • Die Beobachtungen sind unabhängig voneinander
  • Die Variable ist kategorial (nominal oder ordinal)
  • Alle erwarteten Häufigkeiten sind ≥ 5 (bei Verletzung: Kategorien zusammenfassen oder exakten Test verwenden)
  • Jede Beobachtung gehört zu genau einer Kategorie

Formel#

Die Teststatistik berechnet sich als:

χ2=i=1k(OiEi)2Ei\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}

wobei:

  • OiO_i die beobachtete Häufigkeit der Kategorie ii ist
  • EiE_i die erwartete Häufigkeit der Kategorie ii ist
  • kk die Anzahl der Kategorien ist

Die Freiheitsgrade betragen:

df=k1df = k - 1

Bei einer Gleichverteilungsannahme gilt:

Ei=nkE_i = \frac{n}{k}

Beispiel#

Praxisbeispiel: Fairness eines Würfels

Ein Spieler vermutet, dass ein Würfel nicht fair ist. Er wirft den Würfel 120-mal und notiert die Ergebnisse:

Augenzahl123456
Beobachtet (O)251715232416
Erwartet (E)202020202020

Bei einem fairen Würfel wird jede Augenzahl gleich oft erwartet: Ei=120/6=20E_i = 120/6 = 20.

χ2=(2520)220+(1720)220+(1520)220+(2320)220+(2420)220+(1620)220=5.0\chi^2 = \frac{(25-20)^2}{20} + \frac{(17-20)^2}{20} + \frac{(15-20)^2}{20} + \frac{(23-20)^2}{20} + \frac{(24-20)^2}{20} + \frac{(16-20)^2}{20} = 5.0

Mit df = 5 ergibt sich p = 0.416 (nicht signifikant). Es gibt keinen Hinweis darauf, dass der Würfel unfair ist.

Effektstärke#

Cohens w als Maß der Effektstärke:

w=χ2nw = \sqrt{\frac{\chi^2}{n}}

Alternativ:

w=i=1k(pbeobachtet,iperwartet,i)2perwartet,iw = \sqrt{\sum_{i=1}^{k} \frac{(p_{\text{beobachtet},i} - p_{\text{erwartet},i})^2}{p_{\text{erwartet},i}}}
EffektstärkeCohens w
Klein0.10
Mittel0.30
Groß0.50

Hinweis: Der Chi-Quadrat-Anpassungstest ist empfindlich gegenüber der Stichprobengröße. Bei sehr großen Stichproben können auch kleine, praktisch unbedeutende Abweichungen signifikant werden. Daher sollte immer die Effektstärke berichtet werden.

Weiterführende Literatur

  • Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine, 50(302), 157–175.
  • Agresti, A. (2007). An Introduction to Categorical Data Analysis (2. Aufl.). Wiley.