Levene-Test#
Der Levene-Test ist ein inferenzstatistisches Verfahren zur Überprüfung der Varianzhomogenität (Homoskedastizität) über zwei oder mehr Gruppen hinweg. Er testet, ob die Varianzen in verschiedenen Gruppen gleich sind — eine zentrale Voraussetzung für viele parametrische Verfahren wie den t-Test für unabhängige Stichproben oder die einfaktorielle ANOVA.
Im Gegensatz zum klassischen Bartlett-Test ist der Levene-Test deutlich robuster gegenüber Abweichungen von der Normalverteilung, weshalb er in der Praxis bevorzugt wird. Die von Brown und Forsythe (1974) vorgeschlagene Variante, die den Median statt des Mittelwerts verwendet, erhöht die Robustheit zusätzlich.
Wann verwenden?#
- Vor der Durchführung eines t-Tests für unabhängige Stichproben, um die Annahme gleicher Varianzen zu prüfen
- Vor einer ANOVA, um die Voraussetzung der Varianzhomogenität zu überprüfen
- Wenn die Daten möglicherweise nicht normalverteilt sind (robuster als der Bartlett-Test)
- Beim Vergleich der Streuung in experimentellen Gruppen
- Als Teil einer systematischen Voraussetzungsprüfung vor parametrischen Analysen
Voraussetzungen#
- Unabhängige Beobachtungen — keine Abhängigkeiten zwischen Gruppen oder innerhalb von Gruppen
- Stetige abhängige Variable auf mindestens Intervallskalenniveau
- Zufällige Stichproben aus den jeweiligen Populationen
Formel#
Der Levene-Test berechnet eine F-Statistik auf Basis der absoluten Abweichungen der Beobachtungen vom jeweiligen Gruppenzentrum:
Dabei sind:
- die Anzahl der Gruppen
- die Gesamtstichprobengröße
- die Stichprobengröße der -ten Gruppe
- die absolute Abweichung vom Gruppenmittelwert (klassischer Levene-Test)
- der Mittelwert der in Gruppe
- der Gesamtmittelwert aller
Brown-Forsythe-Variante: Verwendet den Median statt des Mittelwerts, d. h. . Diese Variante ist robuster bei schiefen Verteilungen.
Hypothesen#
- H₀: Die Varianzen sind in allen Gruppen gleich ()
- H₁: Mindestens zwei Gruppen unterscheiden sich in ihrer Varianz
Die Teststatistik folgt unter H₀ einer F-Verteilung mit und Freiheitsgraden.
Beispiel#
Praxisbeispiel: Varianzprüfung bei drei Lehrmethoden
Ein Bildungsforscher möchte mit einer einfaktoriellen ANOVA untersuchen, ob sich die Prüfungsleistungen von Studierenden unter drei verschiedenen Lehrmethoden unterscheiden (Vorlesung, Seminar, E-Learning). Bevor er die ANOVA durchführen kann, muss er die Varianzhomogenität prüfen.
Die Gruppen umfassen jeweils 25 Studierende. Er führt den Levene-Test durch und erhält F(2, 72) = 1.34 mit p = 0.27. Da p > 0.05, kann die Nullhypothese der Varianzgleichheit nicht verworfen werden. Die Voraussetzung der Homoskedastizität ist erfüllt, und die Standard-ANOVA darf angewendet werden.
Hätte der Test ein signifikantes Ergebnis geliefert, wäre die Welch-ANOVA als robuste Alternative eingesetzt worden.
Effektstärke#
Für den Levene-Test gibt es kein standardmäßiges Effektstärkemaß. In der Praxis werden die F-Statistik und der p-Wert berichtet. Ergänzend kann das Varianzverhältnis als deskriptives Maß herangezogen werden:
| Varianzverhältnis | Interpretation |
|---|---|
| < 2:1 | Varianzen annähernd gleich — unproblematisch |
| 2:1 – 4:1 | Moderate Unterschiede — Vorsicht bei ungleichen Gruppengrößen |
| > 4:1 | Große Unterschiede — robuste Verfahren empfohlen |
Hinweis: Wie bei allen Voraussetzungstests gilt: Bei großen Stichproben wird der Test sehr empfindlich. Bei kleinen Stichproben kann er relevante Verletzungen übersehen. Die Betrachtung des Varianzverhältnisses ist daher eine sinnvolle Ergänzung.
Weiterführende Literatur
- Levene, H. (1960). Robust tests for equality of variances. In I. Olkin (Ed.), Contributions to Probability and Statistics (pp. 278–292). Stanford University Press.
- Brown, M. B., & Forsythe, A. B. (1974). Robust tests for the equality of variances. Journal of the American Statistical Association, 69(346), 364–367.
- Glass, G. V. (1966). Testing homogeneity of variances. American Educational Research Journal, 3(3), 187–190.