Partialkorrelation#
Die Partialkorrelation misst den linearen Zusammenhang zwischen zwei Variablen und , nachdem der Einfluss einer oder mehrerer Kontrollvariablen statistisch herausgerechnet wurde. Sie ist ein unverzichtbares Werkzeug, um Scheinkorrelationen aufzudecken und den „wahren" Zusammenhang zwischen zwei Variablen zu isolieren. Wenn eine Drittvariable sowohl als auch beeinflusst, kann die einfache Pearson-Korrelation ein verzerrtes Bild liefern — die Partialkorrelation bereinigt diesen Effekt.
Wann verwenden?#
- Du vermutest, dass der Zusammenhang zwischen und durch eine Drittvariable verzerrt sein könnte
- Du möchtest prüfen, ob eine beobachtete Korrelation eine Scheinkorrelation ist
- Du willst den bereinigten Zusammenhang zwischen zwei Variablen berichten
- Alle Variablen sind metrisch (intervall- oder ratioskaliert)
- Du möchtest den Einfluss einer Störvariable (Confounder) kontrollieren, ohne eine vollständige Regressionsanalyse durchzuführen
Voraussetzungen#
- Metrisches Skalenniveau aller Variablen (X, Y und Z)
- Lineare Beziehung zwischen allen Variablenpaaren
- Annähernde Normalverteilung aller Variablen
- Unabhängige Beobachtungen
- Keine perfekte Multikollinearität zwischen den Variablen
Formel#
Die Partialkorrelation erster Ordnung (Kontrolle einer Variable ) berechnet sich aus den drei bivariaten Pearson-Korrelationen:
Dabei ist die Korrelation zwischen und , die Korrelation zwischen und , und die Korrelation zwischen und .
Die Signifikanz wird mit einem t-Test geprüft:
Bei Kontrolle von Variablen gilt .
Beispiel#
Praxisbeispiel: Eisverkauf, Ertrinken und Temperatur
Eine Studie findet eine hohe positive Korrelation zwischen Eisverkäufen () und der Anzahl der Ertrinkungsfälle () in Freibädern. Bedeutet mehr Eis essen ein höheres Ertrinkungsrisiko? Natürlich nicht — die Temperatur () ist die gemeinsame Ursache.
Korrelationen (n = 50 Sommertage):
- (Eisverkauf ↔ Ertrinkungsfälle)
- (Eisverkauf ↔ Temperatur)
- (Ertrinkungsfälle ↔ Temperatur)
Berechnung der Partialkorrelation:
Interpretation: Die ursprünglich starke Korrelation von sinkt nach Kontrolle der Temperatur auf — ein nur noch kleiner, vermutlich nicht signifikanter Zusammenhang. Die beobachtete Korrelation war größtenteils eine Scheinkorrelation, verursacht durch die gemeinsame Drittvariable Temperatur.
Effektstärke#
Die Partialkorrelation ist selbst ein Effektstärkemaß und wird nach denselben Konventionen wie Pearsons interpretiert:
| | Interpretation | |---|---| | 0.10 | Kleiner Effekt | | 0.30 | Mittlerer Effekt | | 0.50 | Großer Effekt |
Zusätzlich kann der Anteil der einzigartig erklärten Varianz berechnet werden:
Dieser Wert gibt an, wie viel Varianz von durch erklärt wird, nachdem der Einfluss von bereits berücksichtigt wurde. Im obigen Beispiel erklärt der Eisverkauf nach Kontrolle der Temperatur nur noch der Varianz in den Ertrinkungsfällen.
Weiterführende Literatur
- Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Springer.
- Cohen, J., Cohen, P., West, S. G. & Aiken, L. S. (2003). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences (3. Aufl.). Lawrence Erlbaum Associates.
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5. Aufl.). SAGE Publications.