Parametrisch vs. Nichtparametrisch#

Die Unterscheidung zwischen parametrischen und nichtparametrischen Tests ist eine der grundlegendsten Entscheidungen bei der Wahl des richtigen statistischen Verfahrens.

Was bedeutet "parametrisch"?#

Parametrische Tests treffen Annahmen über die Verteilung der Daten in der Grundgesamtheit. Sie schätzen Parameter wie Mittelwert und Varianz und setzen typischerweise voraus:

Die Daten sind metrisch skaliert
Die Daten sind (annähernd) normalverteilt
Varianzhomogenität zwischen den Gruppen

Nichtparametrische Tests machen keine oder weniger strenge Annahmen über die Verteilung. Sie arbeiten häufig mit Rängen statt mit Rohwerten.

Gegenüberstellung#

Eigenschaft	Parametrisch	Nichtparametrisch
Verteilungsannahme	Normalverteilung	Keine/minimal
Skalenniveau	Metrisch (Intervall/Verhältnis)	Ordinal oder metrisch
Analysiert	Mittelwerte, Varianzen	Ränge, Mediane
Power	Höher (wenn Voraussetzungen erfüllt)	Geringer
Stichprobengröße	Kann auch mit kleinem n funktionieren	Auch für kleines n geeignet
Robustheit	Empfindlich bei Verletzung	Robust gegen Ausreißer

Parametrische Tests und ihre nichtparametrischen Alternativen#

Fragestellung	Parametrisch	Nichtparametrisch
2 unabhängige Gruppen	t-Test	Mann-Whitney-U-Test
2 verbundene Gruppen	Gepaarter t-Test	Wilcoxon-Vorzeichen-Rang-Test
3+ unabhängige Gruppen	Einfaktorielle ANOVA	Kruskal-Wallis-Test
3+ verbundene Gruppen	Messwiederholungs-ANOVA	Friedman-Test
Zusammenhang (2 Variablen)	Pearson-Korrelation	Spearman-Rangkorrelation

Wann parametrisch?#

Verwende parametrische Tests, wenn:

Die abhängige Variable metrisch skaliert ist
Die Daten annähernd normalverteilt sind (oder n groß genug)
Die Varianzen der Gruppen ähnlich sind
Du maximale Power benötigst

Beispiel: Parametrisch geeignet

Ein Pharmakonzern testet ein neues Medikament. Die abhängige Variable ist der Blutdruck (metrisch, in mmHg). Beide Gruppen (n = 50) zeigen normalverteilte Daten und ähnliche Varianzen.

→ t-Test für unabhängige Stichproben ist die richtige Wahl.

Wann nichtparametrisch?#

Verwende nichtparametrische Tests, wenn:

Die Daten ordinal skaliert sind (z. B. Likert-Einzelitems)
Die Normalverteilung deutlich verletzt ist und die Stichprobe klein ist
Es starke Ausreißer gibt, die nicht entfernt werden können
Die Verteilung stark schief ist
Die Stichprobengröße sehr klein ist (n < 15 pro Gruppe)

Beispiel: Nichtparametrisch geeignet

Ein Forscher untersucht die Zufriedenheit mit einem Service auf einer 5-Punkte-Skala (1 = sehr unzufrieden bis 5 = sehr zufrieden). Die Daten sind stark rechtsschief, und die Stichprobe umfasst nur n = 12 pro Gruppe.

→ Mann-Whitney-U-Test ist die bessere Wahl als der t-Test.

Wie funktionieren Rangtests?#

Nichtparametrische Tests wandeln die Rohdaten häufig in Ränge um:

Prinzip der Rangbildung

Originalwerte: 12, 5, 28, 3, 19

Sortiert: 3, 5, 12, 19, 28

Ränge: 1, 2, 3, 4, 5

Der Test arbeitet dann mit den Rängen statt mit den Originalwerten. Dadurch werden Ausreißer abgemildert und die Verteilungsform wird irrelevant.

Der Powerverlust#

Nichtparametrische Tests haben bei normalverteilten Daten weniger Power als ihre parametrischen Gegenstücke. Die asymptotische relative Effizienz (ARE) gibt an, wie viel Prozent der Power erhalten bleibt:

Nichtparametrischer Test	ARE bei Normalverteilung
Mann-Whitney vs. t-Test	~95,5 %
Wilcoxon vs. gepaarter t-Test	~95,5 %
Kruskal-Wallis vs. ANOVA	~95,5 %
Spearman vs. Pearson	~91,2 %

Der Powerverlust ist also oft erstaunlich gering. Bei nicht-normalverteilten Daten können nichtparametrische Tests sogar mehr Power haben.

Der Graubereich#

In der Praxis gibt es viele Situationen, die nicht eindeutig sind:

Summenwerte von Likert-Skalen: Oft quasi-metrisch behandelt. Bei ≥ 5 Items und annähernder Normalverteilung sind parametrische Tests in der Regel vertretbar.

Große Stichproben mit leichter Nicht-Normalverteilung: Der zentrale Grenzwertsatz sorgt dafür, dass parametrische Tests robust sind. Ab n ≥ 30 pro Gruppe sind leichte Abweichungen meist unproblematisch.

Kleine Stichproben mit Normalverteilung: Hier sind parametrische Tests angemessen, auch wenn der Shapiro-Wilk-Test bei kleinem n wenig Power hat.

Entscheidungshilfe#

Skalenniveau prüfen → Ordinal? → Nichtparametrisch
Normalverteilung prüfen → Deutlich verletzt bei kleinem n? → Nichtparametrisch
Ausreißer prüfen → Extreme Ausreißer vorhanden? → Nichtparametrisch
Im Zweifel: Beide Tests durchführen. Wenn die Ergebnisse übereinstimmen, ist die Wahl weniger kritisch.

Häufige Missverständnisse#

„Nichtparametrische Tests sind immer besser, weil sie weniger Voraussetzungen haben." Nein. Wenn die Voraussetzungen für parametrische Tests erfüllt sind, haben diese mehr Power. „Sicherer" bedeutet nicht „besser".

„Nichtparametrische Tests haben gar keine Voraussetzungen." Falsch. Auch sie setzen Unabhängigkeit voraus. Für den Vergleich von Medianen muss die Verteilungsform ähnlich sein.

„Bei Verletzung der Normalverteilung muss ich immer nichtparametrisch testen." Nicht bei großen Stichproben. Der t-Test ist bei n > 30 pro Gruppe erstaunlich robust gegen Nicht-Normalverteilung.

Weiterführende Literatur

Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.
Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Springer.