PickMyTest

Gepaarter t-Test

Vergleich der Mittelwerte zweier verbundener Stichproben

Gepaarter t-Test#

Der gepaarte t-Test (auch: t-Test für verbundene Stichproben oder abhängige Stichproben) prüft, ob sich die Mittelwerte zweier verbundener Messungen statistisch signifikant unterscheiden. Typische Anwendungsfälle sind Vorher-Nachher-Messungen an denselben Personen.

Wann verwenden?#

Verwende den gepaarten t-Test, wenn du:

  • Zwei verbundene Messungen vergleichen möchtest (z. B. Vorher vs. Nachher)
  • Die abhängige Variable metrisch (stetig) ist
  • Die Differenzen zwischen den gepaarten Werten annähernd normalverteilt sind
  • Jede Beobachtung in der einen Gruppe genau einer Beobachtung in der anderen Gruppe zugeordnet werden kann

Voraussetzungen#

  • Gepaarte Beobachtungen (jede Messung hat ein zugehöriges Paar)
  • Metrisches Skalenniveau der abhängigen Variable
  • Normalverteilung der Differenzen (Shapiro-Wilk-Test auf die Differenzen anwenden)
  • Unabhängigkeit der Paare (die Paare selbst sind unabhängig voneinander)

Hinweis: Die Normalverteilungsannahme bezieht sich auf die Differenzen der gepaarten Werte, nicht auf die Rohwerte selbst. Bei Verletzung dieser Annahme ist der Wilcoxon-Vorzeichen-Rang-Test die geeignete Alternative.

Formel#

Die Teststatistik basiert auf den Differenzen di=X1i−X2id_i = X_{1i} - X_{2i}:

t=dˉsd/nt = \frac{\bar{d}}{s_d / \sqrt{n}}

wobei:

  • dˉ\bar{d} der Mittelwert der Differenzen ist
  • sds_d die Standardabweichung der Differenzen ist
  • nn die Anzahl der Paare ist

Der Mittelwert und die Standardabweichung der Differenzen berechnen sich als:

dˉ=1n∑i=1ndi\bar{d} = \frac{1}{n} \sum_{i=1}^{n} d_i sd=1n−1∑i=1n(di−dˉ)2s_d = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (d_i - \bar{d})^2}

Die Teststatistik folgt einer t-Verteilung mit df=n−1df = n - 1 Freiheitsgraden.

Beispiel#

Praxisbeispiel: Trainingseffekt auf die Ausdauer

Ein Sportmediziner möchte untersuchen, ob ein 8-wöchiges Ausdauertraining die maximale Sauerstoffaufnahme (VO₂max) verbessert. Er misst bei 25 Teilnehmern die VO₂max vor und nach dem Training.

  • Messung 1 (Vorher): VOâ‚‚max vor dem Trainingsprogramm
  • Messung 2 (Nachher): VOâ‚‚max nach 8 Wochen Training

Da jede Person zweimal gemessen wird, liegen gepaarte Daten vor. Der gepaarte t-Test prüft, ob die mittlere Differenz der VO₂max-Werte signifikant von Null verschieden ist.

Effektstärke#

Cohens dzd_z als Maß der Effektstärke für gepaarte Designs:

dz=dˉsdd_z = \frac{\bar{d}}{s_d}
EffektstärkeCohens d_z
Klein0.2
Mittel0.5
Groß0.8

Tipp: Cohens dzd_z bezieht sich auf die standardisierte mittlere Differenz. Alternativ kann auch Cohens davd_{av} berechnet werden, das die durchschnittliche Standardabweichung der beiden Messzeitpunkte verwendet.

Weiterführende Literatur

  • Student (1908). The probable error of a mean. Biometrika, 6(1), 1–25.
  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.