PickMyTest

Was ist ANOVA?

Die Varianzanalyse zum Vergleich von drei oder mehr Gruppenmittelwerten

Was ist ANOVA?#

Die ANOVA (Analysis of Variance, Varianzanalyse) ist ein statistisches Verfahren zum Vergleich der Mittelwerte von drei oder mehr Gruppen. Sie prĂŒft, ob sich mindestens zwei Gruppen signifikant voneinander unterscheiden.

Warum nicht einfach mehrere t-Tests?#

Bei drei Gruppen (A, B, C) könnte man drei t-Tests durchfĂŒhren: A vs. B, A vs. C, B vs. C. Das Problem:

P(mindestens ein Fehler)=1−(1−0,05)3=0,143P(\text{mindestens ein Fehler}) = 1 - (1 - 0{,}05)^3 = 0{,}143

Die Wahrscheinlichkeit fĂŒr mindestens einen falsch-positiven Befund steigt auf 14,3 % statt der gewĂŒnschten 5 %. Bei 10 Gruppen wĂ€ren es 45 paarweise Vergleiche und eine Fehlerwahrscheinlichkeit von fast 90 %.

Die ANOVA löst dieses Problem, indem sie alle Gruppen gleichzeitig testet.

Die Grundlogik#

Die ANOVA zerlegt die Gesamtvarianz der Daten in zwei Komponenten:

  1. Varianz zwischen den Gruppen (systematische Variation): Unterschiede, die durch den Gruppenfaktor erklÀrt werden
  2. Varianz innerhalb der Gruppen (Fehlervarianz): ZufÀllige Schwankungen innerhalb jeder Gruppe
SSgesamt=SSzwischen+SSinnerhalbSS_{\text{gesamt}} = SS_{\text{zwischen}} + SS_{\text{innerhalb}}

Wenn die Varianz zwischen den Gruppen deutlich grĂ¶ĂŸer ist als die Varianz innerhalb der Gruppen, spricht das fĂŒr einen Effekt.

Die F-Statistik#

F=MSzwischenMSinnerhalb=SSzwischen/dfzwischenSSinnerhalb/dfinnerhalbF = \frac{MS_{\text{zwischen}}}{MS_{\text{innerhalb}}} = \frac{SS_{\text{zwischen}} / df_{\text{zwischen}}}{SS_{\text{innerhalb}} / df_{\text{innerhalb}}}
  • F ≈ 1: Die Gruppenunterschiede sind nicht grĂ¶ĂŸer als zufĂ€llige Schwankungen
  • F >> 1: Die Gruppenunterschiede sind grĂ¶ĂŸer als erwartet → signifikant

Arten der ANOVA#

Einfaktorielle ANOVA#

Ein Faktor (unabhÀngige Variable) mit k Gruppen.

Beispiel: Einfaktorielle ANOVA

Vergleich von drei DiÀtprogrammen auf den Gewichtsverlust:

  • Faktor: DiĂ€tprogramm (A, B, C)
  • AV: Gewichtsverlust in kg
  • Frage: Unterscheiden sich die drei Programme im mittleren Gewichtsverlust?

Zweifaktorielle (mehrfaktorielle) ANOVA#

Zwei oder mehr Faktoren werden gleichzeitig untersucht. Ermöglicht die Analyse von Haupteffekten und Interaktionseffekten.

Beispiel: Zweifaktorielle ANOVA

  • Faktor 1: Therapieform (Medikament A, B)
  • Faktor 2: Geschlecht (mĂ€nnlich, weiblich)
  • AV: Symptomreduktion

Ergebnisse können sein:

  • Haupteffekt Therapie: Medikament A wirkt besser als B (unabhĂ€ngig vom Geschlecht)
  • Haupteffekt Geschlecht: Frauen zeigen mehr Reduktion (unabhĂ€ngig von der Therapie)
  • Interaktion: Medikament A wirkt bei Frauen besser, aber bei MĂ€nnern schlechter als B

Messwiederholungs-ANOVA#

Die gleichen Personen werden mehrfach gemessen (z. B. vor, wÀhrend und nach einer Behandlung).

  • Vorteil: Mehr Power, da interindividuelle Unterschiede kontrolliert werden
  • ZusĂ€tzliche Voraussetzung: SphĂ€rizitĂ€t (Mauchly-Test)

Gemischte ANOVA (Mixed ANOVA)#

Kombination aus Zwischen-Subjekt-Faktoren und Innerhalb-Subjekt-Faktoren.

Beispiel: Gemischte ANOVA

  • Zwischen-Subjekt-Faktor: Therapiegruppe (Behandlung vs. Kontrolle)
  • Innerhalb-Subjekt-Faktor: Messzeitpunkt (Vorher, Nachher, Follow-up)
  • AV: Angstniveau

Die zentrale Frage: Unterscheidet sich der Verlauf ĂŒber die Zeit zwischen den Gruppen? (Interaktion Gruppe × Zeit)

Voraussetzungen#

  1. Metrische abhÀngige Variable
  2. UnabhÀngigkeit der Beobachtungen (zwischen Gruppen)
  3. Normalverteilung der Residuen in jeder Gruppe
  4. VarianzhomogenitÀt (Levene-Test)
  5. SphÀrizitÀt (nur bei Messwiederholung, Mauchly-Test)

Post-hoc-Tests#

Die ANOVA sagt nur, dass sich mindestens zwei Gruppen unterscheiden, aber nicht welche. DafĂŒr werden Post-hoc-Tests benötigt:

TestEigenschaft
Tukey HSDAm hÀufigsten verwendet, alle paarweisen Vergleiche
BonferroniKonservativ, fĂŒr wenige geplante Vergleiche
ScheffĂ©Sehr konservativ, auch fĂŒr komplexe Kontraste
Games-HowellBei VarianzheterogenitÀt (keine VarianzhomogenitÀt nötig)

Post-hoc-Ergebnis interpretieren

Einfaktorielle ANOVA mit drei Gruppen (A, B, C) ergibt F(2, 57) = 5,34, p = 0,008.

Tukey-HSD-Post-hoc-Test zeigt:

  • A vs. B: p = 0,006 (signifikant)
  • A vs. C: p = 0,042 (signifikant)
  • B vs. C: p = 0,784 (nicht signifikant)

→ Gruppe A unterscheidet sich von B und C, aber B und C unterscheiden sich nicht.

EffektstÀrken#

MaßKleinMittelGroß
ηÂČ (Eta-Quadrat)0,010,060,14
ωÂČ (Omega-Quadrat)0,010,060,14
Cohens f0,100,250,40

Umrechnung:

f=η21−η2f = \sqrt{\frac{\eta^2}{1 - \eta^2}}

ANOVA-Tabelle#

Ein typisches ANOVA-Ergebnis wird als Tabelle berichtet:

QuelleSSdfMSFp
Zwischen120,5260,255,340,008
Innerhalb643,25711,28
Gesamt763,759

Nichtparametrische Alternativen#

ANOVA-TypNichtparametrische Alternative
Einfaktorielle ANOVAKruskal-Wallis-Test
Messwiederholungs-ANOVAFriedman-Test

HÀufige MissverstÀndnisse#

„ANOVA vergleicht Varianzen." Der Name ist irrefĂŒhrend. Die ANOVA nutzt Varianzen als Werkzeug, aber das Ziel ist der Vergleich von Mittelwerten.

„Ein signifikantes ANOVA-Ergebnis sagt mir, welche Gruppen sich unterscheiden." Nein. Das ANOVA-Ergebnis (Omnibus-Test) sagt nur, dass irgendwo ein Unterschied besteht. Post-hoc-Tests identifizieren die spezifischen Unterschiede.

„ANOVA funktioniert nur mit gleichen GruppengrĂ¶ĂŸen." Nein. ANOVA funktioniert auch mit ungleichen Gruppen, ist dann aber empfindlicher gegenĂŒber Verletzungen der VarianzhomogenitĂ€t.

„Bei nur zwei Gruppen kann man keine ANOVA verwenden." Doch. Bei zwei Gruppen liefert die ANOVA dasselbe Ergebnis wie der t-Test. Es gilt: F=t2F = t^2.

WeiterfĂŒhrende Literatur

  • Fisher, R. A. (1925). Statistical Methods for Research Workers. Oliver and Boyd.
  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.