RSS

Zusammenhangsmaße: Korrelation und Regression

Sitzungsüberblick: Statistik: Datenbasis, Streuungswerte, Normalverteilung, Kreuztabellen, Zusammenhangsmaße, Signifikanz (14.5.2013)
12345
6
789
Zurück zur Kursübersicht

Korrelation

Die Korrelation mißt den Zusammenhang zwischen zwei quantitativen Merkmalen. Eine Maßzahl für die Stärke der Korrelation ist der Korrelationskoeffizient.


So wird der Korrelationskoeffizient r (PEARSONsche Produkt-Moment-Korrelations-Koeffizient) zur Bestimmung der Beziehung zwischen zwei metrischen Variablen verwendet.

Er kann Werte zwischen -1 und +1 annehmen. Je größer r ist, desto stärker ist die Beziehung zwischen den Variablen.




Bivariate Verteilungen können mit einem Streudiagramm veranschaulicht werden:





aus:http://medweb.uni-muenster.de/institute/imib/lehre/skripte/biomathe/bio/gif/kap3/im2.gif



Die x-Achse repräsentiert immer die unabhängige Variable, die y-Achse die abhängige.

Fragestellungen können beispielsweise folgendermaßen lauten:

Wie sehr hängen die Ausgaben für Wohnzwecke (abhängige Variable) von dem Einkommen (unabhängige Variable) eines Privathaushaltes ab?



Aufgrund der Punktewolke kann eine Tendenz abgelesen werden, die bei linearen Beziehungen eine Gerade darstellt und auch rechnerisch als Regressionsgerade bestimmt werden kann.




Regression

Als lineare Regression bezeichnet man die vermittels einer linearen Funktion beschriebene Abhängigkeit eines quantitativen Merkmals von einem anderen quantitativen Merkmal.

Sollen nun Vorraussagen getroffen werden (z.B. Ein Haushalt xy hat ein Einkommen von 4000 Euro; wie hoch darf die Miete sein, das die Wohnung für diesen Haushalt noch interessant ist?), ist der wahrscheinlichste Wert der, der auf der Regressionsgerade liegt.