PickMyTest

Chi-Quadrat-Unabhängigkeitstest

Prüft die Unabhängigkeit zweier kategorialer Variablen

Chi-Quadrat-Unabhängigkeitstest#

Der Chi-Quadrat-Unabhängigkeitstest (χ2\chi^2-Test) prüft, ob zwei kategoriale Variablen statistisch unabhängig voneinander sind. Er basiert auf dem Vergleich beobachteter und erwarteter Häufigkeiten in einer Kreuztabelle.

Wann verwenden?#

Verwende den Chi-Quadrat-Test, wenn du:

  • Den Zusammenhang zwischen zwei kategorialen Variablen untersuchen möchtest
  • Die Daten als Häufigkeiten in einer Kreuztabelle vorliegen
  • Die erwarteten Häufigkeiten in allen Zellen mindestens 5 betragen
  • Die Stichprobe ausreichend groß ist

Voraussetzungen#

  • Unabhängigkeit der Beobachtungen
  • Kategoriale (nominale oder ordinale) Variablen
  • Erwartete Häufigkeiten ≥ 5 in allen Zellen der Kreuztabelle
  • Zufällige Stichprobenziehung

Formel#

Die Teststatistik berechnet sich als:

χ2=i=1rj=1c(OijEij)2Eij\chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}

wobei OijO_{ij} die beobachtete Häufigkeit und EijE_{ij} die erwartete Häufigkeit in Zelle (i,j)(i, j) ist. Die erwarteten Häufigkeiten berechnen sich als:

Eij=ninjNE_{ij} = \frac{n_{i \cdot} \cdot n_{\cdot j}}{N}

wobei nin_{i \cdot} die Zeilensumme, njn_{\cdot j} die Spaltensumme und NN die Gesamtanzahl ist.

Beispiel#

Praxisbeispiel: Rauchen und Geschlecht

Ein Forscher untersucht, ob ein Zusammenhang zwischen Geschlecht und Rauchverhalten besteht. Dazu werden 200 Personen befragt:

RaucherNichtraucherSumme
Männlich4555100
Weiblich3070100
Summe75125200

Der Chi-Quadrat-Test prüft, ob die Verteilung des Rauchverhaltens unabhängig vom Geschlecht ist. Die erwartete Häufigkeit für "Männlich/Raucher" wäre 10075200=37,5\frac{100 \cdot 75}{200} = 37{,}5.

Effektstärke#

Cramers V als Maß der Effektstärke:

V=χ2N(min(r,c)1)V = \sqrt{\frac{\chi^2}{N \cdot (\min(r, c) - 1)}}

wobei rr die Anzahl der Zeilen und cc die Anzahl der Spalten ist.

EffektstärkeCramers V (df*=1)Cramers V (df*=2)
Klein0.100.07
Mittel0.300.21
Groß0.500.35

df = min(r, c) - 1

Weiterführende Literatur

  • Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine, 50(302), 157–175.
  • Agresti, A. (2007). An Introduction to Categorical Data Analysis (2. Aufl.). Wiley.
  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.