PickMyTest

Shapiro-Wilk-Test

Der Shapiro-Wilk-Test prüft, ob eine Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Er gilt als einer der stärksten Normalitätstests für kleine bis mittlere Stichproben.

Shapiro-Wilk-Test#

Der Shapiro-Wilk-Test ist ein statistischer Test zur Überprüfung der Normalverteilungsannahme. Er vergleicht die beobachteten Daten mit den erwarteten Werten einer Normalverteilung und liefert eine W-Statistik zwischen 0 und 1. Je näher W an 1 liegt, desto besser passen die Daten zu einer Normalverteilung.

Der Test wurde 1965 von Samuel Shapiro und Martin Wilk entwickelt und gilt besonders bei Stichprobengrößen von n < 50 als einer der leistungsstärksten Normalitätstests. Er wird häufig als Voraussetzungsprüfung vor parametrischen Verfahren wie dem t-Test oder der ANOVA eingesetzt.

Wann verwenden?#

  • Vor der Durchführung parametrischer Tests (t-Test, ANOVA), um die Normalverteilungsannahme zu prüfen
  • Bei kleinen bis mittleren Stichproben (n < 50), wo der Test seine größte Teststärke hat
  • Zur Ergänzung visueller Methoden wie Q-Q-Plots oder Histogrammen
  • Wenn eine formale statistische Entscheidung über die Verteilungsform benötigt wird
  • Bei der Analyse von Residuen in Regressionsmodellen

Voraussetzungen#

  • Zufällige Stichprobe aus der Grundgesamtheit
  • Stetige (kontinuierliche) Daten auf mindestens Intervallskalenniveau
  • Unabhängige Beobachtungen — keine Messwiederholungen oder Cluster

Formel#

Die W-Statistik berechnet sich als Verhältnis zweier Varianzschätzer:

W=(i=1naix(i))2i=1n(xixˉ)2W = \frac{\left(\sum_{i=1}^{n} a_i \, x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}

Dabei sind:

  • x(i)x_{(i)} die geordneten Stichprobenwerte (Order Statistics)
  • xˉ\bar{x} der Stichprobenmittelwert
  • aia_i tabellarische Gewichte, die aus den erwarteten Werten und der Kovarianzmatrix der Ordnungsstatistiken einer Normalverteilung berechnet werden
(a1,a2,,an)=mTV1(mTV1V1m)1/2(a_1, a_2, \ldots, a_n) = \frac{m^T V^{-1}}{(m^T V^{-1} V^{-1} m)^{1/2}}

wobei mm der Vektor der erwarteten Ordnungsstatistiken und VV die zugehörige Kovarianzmatrix ist.

Hypothesen#

  • H₀: Die Daten stammen aus einer normalverteilten Grundgesamtheit
  • H₁: Die Daten stammen nicht aus einer normalverteilten Grundgesamtheit

Ein signifikantes Ergebnis (p < α) führt zur Ablehnung der Normalverteilungsannahme.

Beispiel#

Praxisbeispiel: Blutdruckwerte vor einem t-Test

Eine Forscherin möchte mit einem t-Test untersuchen, ob ein neues Medikament den systolischen Blutdruck senkt. Dazu hat sie die Blutdruckwerte von 30 Patienten gemessen. Bevor sie den t-Test durchführen kann, muss sie prüfen, ob die Daten annähernd normalverteilt sind.

Sie führt den Shapiro-Wilk-Test durch und erhält W = 0.967 mit p = 0.42. Da p > 0.05, kann die Nullhypothese der Normalverteilung nicht verworfen werden. Die Daten sind mit einer Normalverteilung vereinbar, und der t-Test darf angewendet werden.

Ergänzend betrachtet sie den Q-Q-Plot, der ebenfalls keine systematischen Abweichungen von der Normalverteilung zeigt.

Effektstärke#

Für den Shapiro-Wilk-Test gibt es keine traditionelle Effektstärke im üblichen Sinne. Die W-Statistik selbst dient als Maß für die Abweichung von der Normalverteilung:

W-WertInterpretation
0.95 – 1.00Daten sind gut mit Normalverteilung vereinbar
0.90 – 0.95Leichte Abweichungen von der Normalverteilung
< 0.90Deutliche Abweichungen von der Normalverteilung

Wichtig: Bei großen Stichproben (n > 100) wird der Test sehr empfindlich und erkennt auch triviale Abweichungen als signifikant. In solchen Fällen sollten ergänzend visuelle Methoden (Q-Q-Plot, Histogramm) herangezogen werden.

Weiterführende Literatur

  • Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3-4), 591–611.
  • Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage Publications.