Chi-Quadrat-Anpassungstest#
Der Chi-Quadrat-Anpassungstest (auch: Goodness-of-Fit-Test) prüft, ob die beobachtete Häufigkeitsverteilung einer kategorialen Variable mit einer theoretisch erwarteten Verteilung übereinstimmt. Er beantwortet die Frage: Weicht die beobachtete Verteilung signifikant von der erwarteten ab?
Wann verwenden?#
Verwende den Chi-Quadrat-Anpassungstest, wenn du:
- Prüfen möchtest, ob eine Häufigkeitsverteilung einer erwarteten Verteilung entspricht
- Eine einzelne kategoriale Variable mit mehreren Kategorien untersuchst
- Testen möchtest, ob Kategorien gleichverteilt sind oder einer bestimmten Verteilung folgen
- Die Stichprobe ausreichend groß ist (erwartete Häufigkeiten ≥ 5)
Voraussetzungen#
- Die Beobachtungen sind unabhängig voneinander
- Die Variable ist kategorial (nominal oder ordinal)
- Alle erwarteten Häufigkeiten sind ≥ 5 (bei Verletzung: Kategorien zusammenfassen oder exakten Test verwenden)
- Jede Beobachtung gehört zu genau einer Kategorie
Formel#
Die Teststatistik berechnet sich als:
wobei:
- die beobachtete Häufigkeit der Kategorie ist
- die erwartete Häufigkeit der Kategorie ist
- die Anzahl der Kategorien ist
Die Freiheitsgrade betragen:
Bei einer Gleichverteilungsannahme gilt:
Beispiel#
Praxisbeispiel: Fairness eines Würfels
Ein Spieler vermutet, dass ein Würfel nicht fair ist. Er wirft den Würfel 120-mal und notiert die Ergebnisse:
| Augenzahl | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| Beobachtet (O) | 25 | 17 | 15 | 23 | 24 | 16 |
| Erwartet (E) | 20 | 20 | 20 | 20 | 20 | 20 |
Bei einem fairen Würfel wird jede Augenzahl gleich oft erwartet: .
Mit df = 5 ergibt sich p = 0.416 (nicht signifikant). Es gibt keinen Hinweis darauf, dass der Würfel unfair ist.
Effektstärke#
Cohens w als Maß der Effektstärke:
Alternativ:
| Effektstärke | Cohens w |
|---|---|
| Klein | 0.10 |
| Mittel | 0.30 |
| Groß | 0.50 |
Hinweis: Der Chi-Quadrat-Anpassungstest ist empfindlich gegenüber der Stichprobengröße. Bei sehr großen Stichproben können auch kleine, praktisch unbedeutende Abweichungen signifikant werden. Daher sollte immer die Effektstärke berichtet werden.
Weiterführende Literatur
- Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine, 50(302), 157–175.
- Agresti, A. (2007). An Introduction to Categorical Data Analysis (2. Aufl.). Wiley.