Chi-Quadrat-Anpassungstest#

Der Chi-Quadrat-Anpassungstest (auch: Goodness-of-Fit-Test) prüft, ob die beobachtete Häufigkeitsverteilung einer kategorialen Variable mit einer theoretisch erwarteten Verteilung übereinstimmt. Er beantwortet die Frage: Weicht die beobachtete Verteilung signifikant von der erwarteten ab?

Wann verwenden?#

Verwende den Chi-Quadrat-Anpassungstest, wenn du:

Prüfen möchtest, ob eine Häufigkeitsverteilung einer erwarteten Verteilung entspricht
Eine einzelne kategoriale Variable mit mehreren Kategorien untersuchst
Testen möchtest, ob Kategorien gleichverteilt sind oder einer bestimmten Verteilung folgen
Die Stichprobe ausreichend groß ist (erwartete Häufigkeiten ≥ 5)

Voraussetzungen#

Die Beobachtungen sind unabhängig voneinander
Die Variable ist kategorial (nominal oder ordinal)
Alle erwarteten Häufigkeiten sind ≥ 5 (bei Verletzung: Kategorien zusammenfassen oder exakten Test verwenden)
Jede Beobachtung gehört zu genau einer Kategorie

Formel#

Die Teststatistik berechnet sich als:

\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}

wobei:

$O_i$ die beobachtete Häufigkeit der Kategorie $i$ ist
$E_i$ die erwartete Häufigkeit der Kategorie $i$ ist
$k$ die Anzahl der Kategorien ist

Die Freiheitsgrade betragen:

df = k - 1

Bei einer Gleichverteilungsannahme gilt:

E_i = \frac{n}{k}

Beispiel#

Praxisbeispiel: Fairness eines Würfels

Ein Spieler vermutet, dass ein Würfel nicht fair ist. Er wirft den Würfel 120-mal und notiert die Ergebnisse:

Augenzahl	1	2	3	4	5	6
Beobachtet (O)	25	17	15	23	24	16
Erwartet (E)	20	20	20	20	20	20

Bei einem fairen Würfel wird jede Augenzahl gleich oft erwartet: $E_i = 120/6 = 20$ .

$\chi^2 = \frac{(25-20)^2}{20} + \frac{(17-20)^2}{20} + \frac{(15-20)^2}{20} + \frac{(23-20)^2}{20} + \frac{(24-20)^2}{20} + \frac{(16-20)^2}{20} = 5.0$

Mit df = 5 ergibt sich p = 0.416 (nicht signifikant). Es gibt keinen Hinweis darauf, dass der Würfel unfair ist.

Effektstärke#

Cohens w als Maß der Effektstärke:

w = \sqrt{\frac{\chi^2}{n}}

Alternativ:

w = \sqrt{\sum_{i=1}^{k} \frac{(p_{\text{beobachtet},i} - p_{\text{erwartet},i})^2}{p_{\text{erwartet},i}}}

Effektstärke	Cohens w
Klein	0.10
Mittel	0.30
Groß	0.50

Hinweis: Der Chi-Quadrat-Anpassungstest ist empfindlich gegenüber der Stichprobengröße. Bei sehr großen Stichproben können auch kleine, praktisch unbedeutende Abweichungen signifikant werden. Daher sollte immer die Effektstärke berichtet werden.

Weiterführende Literatur

Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine, 50(302), 157–175.
Agresti, A. (2007). An Introduction to Categorical Data Analysis (2. Aufl.). Wiley.