Parametrisch vs. Nichtparametrisch#
Die Unterscheidung zwischen parametrischen und nichtparametrischen Tests ist eine der grundlegendsten Entscheidungen bei der Wahl des richtigen statistischen Verfahrens.
Was bedeutet "parametrisch"?#
Parametrische Tests treffen Annahmen über die Verteilung der Daten in der Grundgesamtheit. Sie schätzen Parameter wie Mittelwert und Varianz und setzen typischerweise voraus:
- Die Daten sind metrisch skaliert
- Die Daten sind (annähernd) normalverteilt
- Varianzhomogenität zwischen den Gruppen
Nichtparametrische Tests machen keine oder weniger strenge Annahmen über die Verteilung. Sie arbeiten häufig mit Rängen statt mit Rohwerten.
GegenĂĽberstellung#
| Eigenschaft | Parametrisch | Nichtparametrisch |
|---|---|---|
| Verteilungsannahme | Normalverteilung | Keine/minimal |
| Skalenniveau | Metrisch (Intervall/Verhältnis) | Ordinal oder metrisch |
| Analysiert | Mittelwerte, Varianzen | Ränge, Mediane |
| Power | Höher (wenn Voraussetzungen erfüllt) | Geringer |
| Stichprobengröße | Kann auch mit kleinem n funktionieren | Auch für kleines n geeignet |
| Robustheit | Empfindlich bei Verletzung | Robust gegen AusreiĂźer |
Parametrische Tests und ihre nichtparametrischen Alternativen#
| Fragestellung | Parametrisch | Nichtparametrisch |
|---|---|---|
| 2 unabhängige Gruppen | t-Test | Mann-Whitney-U-Test |
| 2 verbundene Gruppen | Gepaarter t-Test | Wilcoxon-Vorzeichen-Rang-Test |
| 3+ unabhängige Gruppen | Einfaktorielle ANOVA | Kruskal-Wallis-Test |
| 3+ verbundene Gruppen | Messwiederholungs-ANOVA | Friedman-Test |
| Zusammenhang (2 Variablen) | Pearson-Korrelation | Spearman-Rangkorrelation |
Wann parametrisch?#
Verwende parametrische Tests, wenn:
- Die abhängige Variable metrisch skaliert ist
- Die Daten annähernd normalverteilt sind (oder n groß genug)
- Die Varianzen der Gruppen ähnlich sind
- Du maximale Power benötigst
Beispiel: Parametrisch geeignet
Ein Pharmakonzern testet ein neues Medikament. Die abhängige Variable ist der Blutdruck (metrisch, in mmHg). Beide Gruppen (n = 50) zeigen normalverteilte Daten und ähnliche Varianzen.
→ t-Test für unabhängige Stichproben ist die richtige Wahl.
Wann nichtparametrisch?#
Verwende nichtparametrische Tests, wenn:
- Die Daten ordinal skaliert sind (z. B. Likert-Einzelitems)
- Die Normalverteilung deutlich verletzt ist und die Stichprobe klein ist
- Es starke Ausreißer gibt, die nicht entfernt werden können
- Die Verteilung stark schief ist
- Die Stichprobengröße sehr klein ist (n < 15 pro Gruppe)
Beispiel: Nichtparametrisch geeignet
Ein Forscher untersucht die Zufriedenheit mit einem Service auf einer 5-Punkte-Skala (1 = sehr unzufrieden bis 5 = sehr zufrieden). Die Daten sind stark rechtsschief, und die Stichprobe umfasst nur n = 12 pro Gruppe.
→ Mann-Whitney-U-Test ist die bessere Wahl als der t-Test.
Wie funktionieren Rangtests?#
Nichtparametrische Tests wandeln die Rohdaten häufig in Ränge um:
Prinzip der Rangbildung
Originalwerte: 12, 5, 28, 3, 19
Sortiert: 3, 5, 12, 19, 28
Ränge: 1, 2, 3, 4, 5
Der Test arbeitet dann mit den Rängen statt mit den Originalwerten. Dadurch werden Ausreißer abgemildert und die Verteilungsform wird irrelevant.
Der Powerverlust#
Nichtparametrische Tests haben bei normalverteilten Daten weniger Power als ihre parametrischen GegenstĂĽcke. Die asymptotische relative Effizienz (ARE) gibt an, wie viel Prozent der Power erhalten bleibt:
| Nichtparametrischer Test | ARE bei Normalverteilung |
|---|---|
| Mann-Whitney vs. t-Test | ~95,5 % |
| Wilcoxon vs. gepaarter t-Test | ~95,5 % |
| Kruskal-Wallis vs. ANOVA | ~95,5 % |
| Spearman vs. Pearson | ~91,2 % |
Der Powerverlust ist also oft erstaunlich gering. Bei nicht-normalverteilten Daten können nichtparametrische Tests sogar mehr Power haben.
Der Graubereich#
In der Praxis gibt es viele Situationen, die nicht eindeutig sind:
Summenwerte von Likert-Skalen: Oft quasi-metrisch behandelt. Bei ≥ 5 Items und annähernder Normalverteilung sind parametrische Tests in der Regel vertretbar.
Große Stichproben mit leichter Nicht-Normalverteilung: Der zentrale Grenzwertsatz sorgt dafür, dass parametrische Tests robust sind. Ab n ≥ 30 pro Gruppe sind leichte Abweichungen meist unproblematisch.
Kleine Stichproben mit Normalverteilung: Hier sind parametrische Tests angemessen, auch wenn der Shapiro-Wilk-Test bei kleinem n wenig Power hat.
Entscheidungshilfe#
- Skalenniveau prüfen → Ordinal? → Nichtparametrisch
- Normalverteilung prüfen → Deutlich verletzt bei kleinem n? → Nichtparametrisch
- Ausreißer prüfen → Extreme Ausreißer vorhanden? → Nichtparametrisch
- Im Zweifel: Beide Tests durchfĂĽhren. Wenn die Ergebnisse ĂĽbereinstimmen, ist die Wahl weniger kritisch.
Häufige Missverständnisse#
„Nichtparametrische Tests sind immer besser, weil sie weniger Voraussetzungen haben." Nein. Wenn die Voraussetzungen für parametrische Tests erfüllt sind, haben diese mehr Power. „Sicherer" bedeutet nicht „besser".
„Nichtparametrische Tests haben gar keine Voraussetzungen." Falsch. Auch sie setzen Unabhängigkeit voraus. Für den Vergleich von Medianen muss die Verteilungsform ähnlich sein.
„Bei Verletzung der Normalverteilung muss ich immer nichtparametrisch testen." Nicht bei großen Stichproben. Der t-Test ist bei n > 30 pro Gruppe erstaunlich robust gegen Nicht-Normalverteilung.
WeiterfĂĽhrende Literatur
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE.
- Bortz, J. & Schuster, C. (2010). Statistik fĂĽr Human- und Sozialwissenschaftler (7. Aufl.). Springer.