Gepaarter t-Test#

Der gepaarte t-Test (auch: t-Test für verbundene Stichproben oder abhängige Stichproben) prüft, ob sich die Mittelwerte zweier verbundener Messungen statistisch signifikant unterscheiden. Typische Anwendungsfälle sind Vorher-Nachher-Messungen an denselben Personen.

Wann verwenden?#

Verwende den gepaarten t-Test, wenn du:

Zwei verbundene Messungen vergleichen möchtest (z. B. Vorher vs. Nachher)
Die abhängige Variable metrisch (stetig) ist
Die Differenzen zwischen den gepaarten Werten annähernd normalverteilt sind
Jede Beobachtung in der einen Gruppe genau einer Beobachtung in der anderen Gruppe zugeordnet werden kann

Voraussetzungen#

Gepaarte Beobachtungen (jede Messung hat ein zugehöriges Paar)
Metrisches Skalenniveau der abhängigen Variable
Normalverteilung der Differenzen (Shapiro-Wilk-Test auf die Differenzen anwenden)
Unabhängigkeit der Paare (die Paare selbst sind unabhängig voneinander)

Hinweis: Die Normalverteilungsannahme bezieht sich auf die Differenzen der gepaarten Werte, nicht auf die Rohwerte selbst. Bei Verletzung dieser Annahme ist der Wilcoxon-Vorzeichen-Rang-Test die geeignete Alternative.

Formel#

Die Teststatistik basiert auf den Differenzen $d_i = X_{1i} - X_{2i}$ :

t = \frac{\bar{d}}{s_d / \sqrt{n}}

wobei:

$\bar{d}$ der Mittelwert der Differenzen ist
$s_d$ die Standardabweichung der Differenzen ist
$n$ die Anzahl der Paare ist

Der Mittelwert und die Standardabweichung der Differenzen berechnen sich als:

\bar{d} = \frac{1}{n} \sum_{i=1}^{n} d_i

s_d = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (d_i - \bar{d})^2}

Die Teststatistik folgt einer t-Verteilung mit $df = n - 1$ Freiheitsgraden.

Beispiel#

Praxisbeispiel: Trainingseffekt auf die Ausdauer

Ein Sportmediziner möchte untersuchen, ob ein 8-wöchiges Ausdauertraining die maximale Sauerstoffaufnahme (VO₂max) verbessert. Er misst bei 25 Teilnehmern die VO₂max vor und nach dem Training.

Messung 1 (Vorher): VO₂max vor dem Trainingsprogramm
Messung 2 (Nachher): VO₂max nach 8 Wochen Training

Da jede Person zweimal gemessen wird, liegen gepaarte Daten vor. Der gepaarte t-Test prüft, ob die mittlere Differenz der VO₂max-Werte signifikant von Null verschieden ist.

Effektstärke#

Cohens $d_z$ als Maß der Effektstärke für gepaarte Designs:

d_z = \frac{\bar{d}}{s_d}

Effektstärke	Cohens d_z
Klein	0.2
Mittel	0.5
Groß	0.8

Tipp: Cohens $d_z$ bezieht sich auf die standardisierte mittlere Differenz. Alternativ kann auch Cohens $d_{av}$ berechnet werden, das die durchschnittliche Standardabweichung der beiden Messzeitpunkte verwendet.

Weiterführende Literatur

Student (1908). The probable error of a mean. Biometrika, 6(1), 1–25.
Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.