Was ist ANOVA?#

Die ANOVA (Analysis of Variance, Varianzanalyse) ist ein statistisches Verfahren zum Vergleich der Mittelwerte von drei oder mehr Gruppen. Sie prüft, ob sich mindestens zwei Gruppen signifikant voneinander unterscheiden.

Warum nicht einfach mehrere t-Tests?#

Bei drei Gruppen (A, B, C) könnte man drei t-Tests durchführen: A vs. B, A vs. C, B vs. C. Das Problem:

P(\text{mindestens ein Fehler}) = 1 - (1 - 0{,}05)^3 = 0{,}143

Die Wahrscheinlichkeit für mindestens einen falsch-positiven Befund steigt auf 14,3 % statt der gewünschten 5 %. Bei 10 Gruppen wären es 45 paarweise Vergleiche und eine Fehlerwahrscheinlichkeit von fast 90 %.

Die ANOVA löst dieses Problem, indem sie alle Gruppen gleichzeitig testet.

Die Grundlogik#

Die ANOVA zerlegt die Gesamtvarianz der Daten in zwei Komponenten:

Varianz zwischen den Gruppen (systematische Variation): Unterschiede, die durch den Gruppenfaktor erklärt werden
Varianz innerhalb der Gruppen (Fehlervarianz): Zufällige Schwankungen innerhalb jeder Gruppe

SS_{\text{gesamt}} = SS_{\text{zwischen}} + SS_{\text{innerhalb}}

Wenn die Varianz zwischen den Gruppen deutlich größer ist als die Varianz innerhalb der Gruppen, spricht das für einen Effekt.

Die F-Statistik#

F = \frac{MS_{\text{zwischen}}}{MS_{\text{innerhalb}}} = \frac{SS_{\text{zwischen}} / df_{\text{zwischen}}}{SS_{\text{innerhalb}} / df_{\text{innerhalb}}}

F ≈ 1: Die Gruppenunterschiede sind nicht größer als zufällige Schwankungen
F >> 1: Die Gruppenunterschiede sind größer als erwartet → signifikant

Arten der ANOVA#

Einfaktorielle ANOVA#

Ein Faktor (unabhängige Variable) mit k Gruppen.

Beispiel: Einfaktorielle ANOVA

Vergleich von drei Diätprogrammen auf den Gewichtsverlust:

Faktor: Diätprogramm (A, B, C)
AV: Gewichtsverlust in kg
Frage: Unterscheiden sich die drei Programme im mittleren Gewichtsverlust?

Zweifaktorielle (mehrfaktorielle) ANOVA#

Zwei oder mehr Faktoren werden gleichzeitig untersucht. Ermöglicht die Analyse von Haupteffekten und Interaktionseffekten.

Beispiel: Zweifaktorielle ANOVA

Faktor 1: Therapieform (Medikament A, B)
Faktor 2: Geschlecht (männlich, weiblich)
AV: Symptomreduktion

Ergebnisse können sein:

Haupteffekt Therapie: Medikament A wirkt besser als B (unabhängig vom Geschlecht)
Haupteffekt Geschlecht: Frauen zeigen mehr Reduktion (unabhängig von der Therapie)
Interaktion: Medikament A wirkt bei Frauen besser, aber bei Männern schlechter als B

Messwiederholungs-ANOVA#

Die gleichen Personen werden mehrfach gemessen (z. B. vor, während und nach einer Behandlung).

Vorteil: Mehr Power, da interindividuelle Unterschiede kontrolliert werden
Zusätzliche Voraussetzung: Sphärizität (Mauchly-Test)

Gemischte ANOVA (Mixed ANOVA)#

Kombination aus Zwischen-Subjekt-Faktoren und Innerhalb-Subjekt-Faktoren.

Beispiel: Gemischte ANOVA

Zwischen-Subjekt-Faktor: Therapiegruppe (Behandlung vs. Kontrolle)
Innerhalb-Subjekt-Faktor: Messzeitpunkt (Vorher, Nachher, Follow-up)
AV: Angstniveau

Die zentrale Frage: Unterscheidet sich der Verlauf über die Zeit zwischen den Gruppen? (Interaktion Gruppe × Zeit)

Voraussetzungen#

Metrische abhängige Variable
Unabhängigkeit der Beobachtungen (zwischen Gruppen)
Normalverteilung der Residuen in jeder Gruppe
Varianzhomogenität (Levene-Test)
Sphärizität (nur bei Messwiederholung, Mauchly-Test)

Post-hoc-Tests#

Die ANOVA sagt nur, dass sich mindestens zwei Gruppen unterscheiden, aber nicht welche. Dafür werden Post-hoc-Tests benötigt:

Test	Eigenschaft
Tukey HSD	Am häufigsten verwendet, alle paarweisen Vergleiche
Bonferroni	Konservativ, für wenige geplante Vergleiche
Scheffé	Sehr konservativ, auch für komplexe Kontraste
Games-Howell	Bei Varianzheterogenität (keine Varianzhomogenität nötig)

Post-hoc-Ergebnis interpretieren

Einfaktorielle ANOVA mit drei Gruppen (A, B, C) ergibt F(2, 57) = 5,34, p = 0,008.

Tukey-HSD-Post-hoc-Test zeigt:

A vs. B: p = 0,006 (signifikant)
A vs. C: p = 0,042 (signifikant)
B vs. C: p = 0,784 (nicht signifikant)

→ Gruppe A unterscheidet sich von B und C, aber B und C unterscheiden sich nicht.

Effektstärken#

Maß	Klein	Mittel	Groß
η² (Eta-Quadrat)	0,01	0,06	0,14
ω² (Omega-Quadrat)	0,01	0,06	0,14
Cohens f	0,10	0,25	0,40

Umrechnung:

f = \sqrt{\frac{\eta^2}{1 - \eta^2}}

ANOVA-Tabelle#

Ein typisches ANOVA-Ergebnis wird als Tabelle berichtet:

Quelle	SS	df	MS	F	p
Zwischen	120,5	2	60,25	5,34	0,008
Innerhalb	643,2	57	11,28
Gesamt	763,7	59

Nichtparametrische Alternativen#

ANOVA-Typ	Nichtparametrische Alternative
Einfaktorielle ANOVA	Kruskal-Wallis-Test
Messwiederholungs-ANOVA	Friedman-Test

Häufige Missverständnisse#

„ANOVA vergleicht Varianzen." Der Name ist irreführend. Die ANOVA nutzt Varianzen als Werkzeug, aber das Ziel ist der Vergleich von Mittelwerten.

„Ein signifikantes ANOVA-Ergebnis sagt mir, welche Gruppen sich unterscheiden." Nein. Das ANOVA-Ergebnis (Omnibus-Test) sagt nur, dass irgendwo ein Unterschied besteht. Post-hoc-Tests identifizieren die spezifischen Unterschiede.

„ANOVA funktioniert nur mit gleichen Gruppengrößen." Nein. ANOVA funktioniert auch mit ungleichen Gruppen, ist dann aber empfindlicher gegenüber Verletzungen der Varianzhomogenität.

„Bei nur zwei Gruppen kann man keine ANOVA verwenden." Doch. Bei zwei Gruppen liefert die ANOVA dasselbe Ergebnis wie der t-Test. Es gilt: $F = t^2$ .

Weiterführende Literatur

Fisher, R. A. (1925). Statistical Methods for Research Workers. Oliver and Boyd.
Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.