RSS

Streuungswerte - univariate Verteilung -

Sitzungsüberblick: Statistik: Datenbasis, Streuungswerte, Normalverteilung, Kreuztabellen, Zusammenhangsmaße, Signifikanz (14.5.2013)
12
3
456789
Zurück zur Kursübersicht

Streuungswerte

Während die Mittelwerte Maße der zentralen Tendenz sind, geben die Streuungswerte Auskunft über die Homogenität bzw. Heterogenität von Variablenwerte.


Zwei Verteilungen mit gleicher zentralen Tendenz (h = = = 10), aber ungleicher Streuung



Die wichtigsten Maßzahlen zur Bestimmung der Streuung:

1. Range (total range, Spannweite, Variationsweite)
Der Range ist die Differenz zwischen dem größten und dem kleinsten Meßwert:

R = xmax - xmin

Diese Maßzahl kann nur bei metrischen Daten verwendet werden und informiert eher über die Grenzen der Streuung, als über die Streuung der Verteilung.

2. (mittlerer) Quartilsabstand (interquartile range, range deviation)
Ein Quartil (Q) ist der Schnittpunkt zwischen Vierteln und trennt die oberen (Q3) bzw. unteren 25 Prozent (Q1) von den mittleren 50 Prozent der Fälle. Das zweite Quartil ist identisch mit dem Median: Q2 =


Veranschaulichung von Quartilen einer Verteilung

Quartilabstand = Q3 - Q1
mittlere Quartilabstand = QA = (Q3 - Q1)/2

für symmetrischen Verteilungen gilt: Q2 - Q1 = Q3 - Q2
für linksschiefe Verteilungen gilt: Q2 - Q1 > Q3 - Q2
für rechtsschiefe Verteilungen gilt: Q2 - Q1 < Q3 - Q2

Diese Aussagen sind richtig!

Der Quartilabstand ist sinnvoll immer dann zu bestimmen, wenn die mittleren 50 Prozent der Fälle von besonderem Interesse sind, was meistens bei extrem schiefen Verteilungen oder solchen mit sehr extremen Werten der Fall ist.

Analog dazu lassen sich die Werte in beliebig große Unterteilungen (Quantile) einteilen. Erfolgt die Einteilung in zehn Abschnitte, spricht man von 'Dezil'(D), sind es hundert, von 'Centil'(C).

Für eine sinnvolle Interpretation müssen die Variablen mindestens intervallskalierte Werte aufweisen.

--> Während der Range und der Quartilabstand nur auf zwei Werten basiert, beziehen die nun folgenden Streuungsmaße den Mittelwert ein. Da die Summe der Abweichungen aller Meßwerte von ihrem arithmetischen Mittel immer 0 ist, werden diese Maße mit der absoluten Abweichung oder der quadrierten Abweichung bestimmt.

3. Durchschnittliche Abweichung      (average deviation)
Die durchschnittliche Abweichung (AD) ist der Durchschnitt der absoluten Abweichungen aller Meßwerte von ihrem arithmetischen Mittel:

aus: Helmut Thome, Grundkurs Statistik für Historiker. Teil I: Deskriptive Statistik, HSR-TRANS 7 (2001), Version 20-12-2001, http://www.wiso.uni-koeln.de/hsr/volume7.htm

Die Richtung der Abweichung bleibt bei dieser Maßzahl unberücksichtigt (Entfernen aller Vorzeichen), es werden die absoluten Werte der gemessenen Abweichung verwendet.

Dieses anschauliche Streuungsmaß hat (leider) in letzter Zeit an Bedeutung zu Gunsten der folgenden Maße verloren.

Standardabweichung und Varianz
Das gängiste Streuungsmaß ist die Standardabweichung (s), die durch Ziehen der Quadratwurzel der Varianz (s2) bestimmt wird:

aus: Helmut Thome, Grundkurs Statistik für Historiker. Teil I: Deskriptive Statistik, HSR-TRANS 7 (2001), Version 20-12-2001, http://www.wiso.uni-koeln.de/hsr/volume7.htm

Die Varianz ist also die durch die Anzahl der Fälle dividierte Summe der quadrierte Abweichung aller Meßwerte von ihrem arithmetischen Mittel. Dementsprechend wird zunächst zu jedem Meßwert der Abstand zum arithmetischen Mittel bestimmt und quadriert. Alle diese Werte werden addiert und durch die Anzahl der Fälle geteilt.

Durch das Quadrieren der Mittelwertabweichungen wird erreicht, dass sich die Abweichungen in der Summe nicht ausgleichen. Um daraus eine lineare Maßzahl zu erhalten, wird aus der Varianz die Quadratwurzel gezogen und man erhält die Standardabweichung.

Die Standardabweichung (s) wie folgt definiert:

aus: Helmut Thome, Grundkurs Statistik für Historiker. Teil I: Deskriptive Statistik, HSR-TRANS 7 (2001), Version 20-12-2001, http://www.wiso.uni-koeln.de/hsr/volume7.htm

Grundsätzlich sind diese beiden Streuungsmaße gleichwertig. Für die descriptive Statistik ist die Standardabweichung oft leichter handhabbar, da die Einheit dieses Maßes nicht quadriert ist.
Beispiel:

Varianz s2 = 49 min2
Standardabweichung s  =  7 min

Diese Maßzahlen setzen metrische Daten vorraus und berücksichtigen alle Fälle der Verteilung. Aus diesem Grund werden sie für weiterführende Berechnungen häufig eingesetzt.

Variationskoeffizient
Der Variationskoeffizient (V) ist der Quotient aus der Division von Standardabweichung (s) und arithmetische Mittel() und drückt die Standardabweichung als Anteil des Mittelwertes aus:

V = s /

Wird dieser Wert nun mit 100 multipliziert wird die Standardabweichung als Prozentwert des Mittelwertes ausgedrückt. Dieser Wert wird anstelle der Standardabweichung verwendet, wenn für die zu treffende Aussage die Konstanz der Verhältnisse wichtiger ist, als die Konstanz der absoluten Beträge. Dies ist der Fall, wenn Verteilungen mit sehr unterschiedlichen Mittelwerten verglichen werden sollen.

z-Werte (Standardwerte, standard measures, z-scores)
Durch die z-Transformation eines Variablenwertes wird es möglich, diesen mit anderen aus derselben oder anderen Verteilungen zu vergleichen, da durch die Umwandlung ein standardisierter Wert erzeugt wird.
Die z-Transformation ist wie folgt definiert:


vgl: http://wwwpsy.uni-muenster.de/inst3/pdmeinhardt/lehre/Ws0203/FragenMethoden/Klausur/Formeltabelle.htm

Nach der Standardisierung werden die Abweichungen vom arithmetischen Mittel in Standardabweichungseinheiten ausgedrückt. So ergeben sich positive und negative z-Werte, je nachdem auf welcher "Seite" des arithmetische Mittels dieser liegt.

Wenn alle Meßwerte einer Verteilung in z-Werte transformiert werden, erhält man eine neue Verteilung der z-transformierten Werte und damit eine neue Variable, die z-transformierte Variable.
Verteilungen von z-transformierten Werten haben immer folgende Eigenschaften:

    1. das arithmetische Mittel ist immer 0
    2. die Standardabweichung ist immer 1

Hinweis: Durch diese Transformation ändert sich nicht die Form der Verteilung!