Shapiro-Wilk-Test#

Der Shapiro-Wilk-Test ist ein statistischer Test zur Überprüfung der Normalverteilungsannahme. Er vergleicht die beobachteten Daten mit den erwarteten Werten einer Normalverteilung und liefert eine W-Statistik zwischen 0 und 1. Je näher W an 1 liegt, desto besser passen die Daten zu einer Normalverteilung.

Der Test wurde 1965 von Samuel Shapiro und Martin Wilk entwickelt und gilt besonders bei Stichprobengrößen von n < 50 als einer der leistungsstärksten Normalitätstests. Er wird häufig als Voraussetzungsprüfung vor parametrischen Verfahren wie dem t-Test oder der ANOVA eingesetzt.

Wann verwenden?#

Vor der Durchführung parametrischer Tests (t-Test, ANOVA), um die Normalverteilungsannahme zu prüfen
Bei kleinen bis mittleren Stichproben (n < 50), wo der Test seine größte Teststärke hat
Zur Ergänzung visueller Methoden wie Q-Q-Plots oder Histogrammen
Wenn eine formale statistische Entscheidung über die Verteilungsform benötigt wird
Bei der Analyse von Residuen in Regressionsmodellen

Voraussetzungen#

Zufällige Stichprobe aus der Grundgesamtheit
Stetige (kontinuierliche) Daten auf mindestens Intervallskalenniveau
Unabhängige Beobachtungen — keine Messwiederholungen oder Cluster

Formel#

Die W-Statistik berechnet sich als Verhältnis zweier Varianzschätzer:

W = \frac{\left(\sum_{i=1}^{n} a_i \, x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}

Dabei sind:

$x_{(i)}$ die geordneten Stichprobenwerte (Order Statistics)
$\bar{x}$ der Stichprobenmittelwert
$a_i$ tabellarische Gewichte, die aus den erwarteten Werten und der Kovarianzmatrix der Ordnungsstatistiken einer Normalverteilung berechnet werden

(a_1, a_2, \ldots, a_n) = \frac{m^T V^{-1}}{(m^T V^{-1} V^{-1} m)^{1/2}}

wobei $m$ der Vektor der erwarteten Ordnungsstatistiken und $V$ die zugehörige Kovarianzmatrix ist.

Hypothesen#

H₀: Die Daten stammen aus einer normalverteilten Grundgesamtheit
H₁: Die Daten stammen nicht aus einer normalverteilten Grundgesamtheit

Ein signifikantes Ergebnis (p < α) führt zur Ablehnung der Normalverteilungsannahme.

Beispiel#

Praxisbeispiel: Blutdruckwerte vor einem t-Test

Eine Forscherin möchte mit einem t-Test untersuchen, ob ein neues Medikament den systolischen Blutdruck senkt. Dazu hat sie die Blutdruckwerte von 30 Patienten gemessen. Bevor sie den t-Test durchführen kann, muss sie prüfen, ob die Daten annähernd normalverteilt sind.

Sie führt den Shapiro-Wilk-Test durch und erhält W = 0.967 mit p = 0.42. Da p > 0.05, kann die Nullhypothese der Normalverteilung nicht verworfen werden. Die Daten sind mit einer Normalverteilung vereinbar, und der t-Test darf angewendet werden.

Ergänzend betrachtet sie den Q-Q-Plot, der ebenfalls keine systematischen Abweichungen von der Normalverteilung zeigt.

Effektstärke#

Für den Shapiro-Wilk-Test gibt es keine traditionelle Effektstärke im üblichen Sinne. Die W-Statistik selbst dient als Maß für die Abweichung von der Normalverteilung:

W-Wert	Interpretation
0.95 – 1.00	Daten sind gut mit Normalverteilung vereinbar
0.90 – 0.95	Leichte Abweichungen von der Normalverteilung
< 0.90	Deutliche Abweichungen von der Normalverteilung

Wichtig: Bei großen Stichproben (n > 100) wird der Test sehr empfindlich und erkennt auch triviale Abweichungen als signifikant. In solchen Fällen sollten ergänzend visuelle Methoden (Q-Q-Plot, Histogramm) herangezogen werden.

Weiterführende Literatur

Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3-4), 591–611.
Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage Publications.