Shapiro-Wilk-Test#
Der Shapiro-Wilk-Test ist ein statistischer Test zur Überprüfung der Normalverteilungsannahme. Er vergleicht die beobachteten Daten mit den erwarteten Werten einer Normalverteilung und liefert eine W-Statistik zwischen 0 und 1. Je näher W an 1 liegt, desto besser passen die Daten zu einer Normalverteilung.
Der Test wurde 1965 von Samuel Shapiro und Martin Wilk entwickelt und gilt besonders bei Stichprobengrößen von n < 50 als einer der leistungsstärksten Normalitätstests. Er wird häufig als Voraussetzungsprüfung vor parametrischen Verfahren wie dem t-Test oder der ANOVA eingesetzt.
Wann verwenden?#
- Vor der Durchführung parametrischer Tests (t-Test, ANOVA), um die Normalverteilungsannahme zu prüfen
- Bei kleinen bis mittleren Stichproben (n < 50), wo der Test seine größte Teststärke hat
- Zur Ergänzung visueller Methoden wie Q-Q-Plots oder Histogrammen
- Wenn eine formale statistische Entscheidung über die Verteilungsform benötigt wird
- Bei der Analyse von Residuen in Regressionsmodellen
Voraussetzungen#
- Zufällige Stichprobe aus der Grundgesamtheit
- Stetige (kontinuierliche) Daten auf mindestens Intervallskalenniveau
- Unabhängige Beobachtungen — keine Messwiederholungen oder Cluster
Formel#
Die W-Statistik berechnet sich als Verhältnis zweier Varianzschätzer:
Dabei sind:
- die geordneten Stichprobenwerte (Order Statistics)
- der Stichprobenmittelwert
- tabellarische Gewichte, die aus den erwarteten Werten und der Kovarianzmatrix der Ordnungsstatistiken einer Normalverteilung berechnet werden
wobei der Vektor der erwarteten Ordnungsstatistiken und die zugehörige Kovarianzmatrix ist.
Hypothesen#
- H₀: Die Daten stammen aus einer normalverteilten Grundgesamtheit
- H₁: Die Daten stammen nicht aus einer normalverteilten Grundgesamtheit
Ein signifikantes Ergebnis (p < α) führt zur Ablehnung der Normalverteilungsannahme.
Beispiel#
Praxisbeispiel: Blutdruckwerte vor einem t-Test
Eine Forscherin möchte mit einem t-Test untersuchen, ob ein neues Medikament den systolischen Blutdruck senkt. Dazu hat sie die Blutdruckwerte von 30 Patienten gemessen. Bevor sie den t-Test durchführen kann, muss sie prüfen, ob die Daten annähernd normalverteilt sind.
Sie führt den Shapiro-Wilk-Test durch und erhält W = 0.967 mit p = 0.42. Da p > 0.05, kann die Nullhypothese der Normalverteilung nicht verworfen werden. Die Daten sind mit einer Normalverteilung vereinbar, und der t-Test darf angewendet werden.
Ergänzend betrachtet sie den Q-Q-Plot, der ebenfalls keine systematischen Abweichungen von der Normalverteilung zeigt.
Effektstärke#
Für den Shapiro-Wilk-Test gibt es keine traditionelle Effektstärke im üblichen Sinne. Die W-Statistik selbst dient als Maß für die Abweichung von der Normalverteilung:
| W-Wert | Interpretation |
|---|---|
| 0.95 – 1.00 | Daten sind gut mit Normalverteilung vereinbar |
| 0.90 – 0.95 | Leichte Abweichungen von der Normalverteilung |
| < 0.90 | Deutliche Abweichungen von der Normalverteilung |
Wichtig: Bei großen Stichproben (n > 100) wird der Test sehr empfindlich und erkennt auch triviale Abweichungen als signifikant. In solchen Fällen sollten ergänzend visuelle Methoden (Q-Q-Plot, Histogramm) herangezogen werden.
Weiterführende Literatur
- Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3-4), 591–611.
- Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage Publications.