Formen einer Verteilung (Verteilungstypen)
Das Zentrum einer Verteilung
-Modus= der häufigste Wert (für alle Skalenniveaus geeignet)
Möglichkeit: Tabelle anzeigen lassen und den häufigsten Wert suchen> “tab variable”
Möglichkeit: Werte der Tabelle nach Häufigkeit sortieren lassen> “tab variable, sort”
Zentrum einer Variable kann auf zwei verschiedene Arten berechnet werden:
-Median= der Wert “in der Mitte”; teilt Fälle in zwei gleich große Hälften auf (ab Ordinalskala geeignet)
Möglichkeit: Tabelle anzeigen lassen und Wert suchen, bei dem die kumulierte Häufigkeit von 50% überschritten wird-> „tab variable“
Möglichkeit: durch den sum-Befehl das 50% Perzentil anzeigen lassen-> „sum variable, detail“
=mit den Werten einer ordinalskalierten Variablen kann man nicht rechnen da sie nur eine Rangordnung kennzeichnen, daher-> Einzeldaten werden der Größe nach geordnet, der Wert der genau in der Mitte liegt heißt Median (bei ungeraden Anzahl an Werten)
Bei geraden Anzahl an Werten= beiden mittigen werte zusammenrechnen x0.5
-Arithmetisches Mittel= der Durchschnitt, ist die Summe aller Werte geteilt durch die Anzahl der Werte
= sinnvoll fürt metrische Daten, also mindestens Intervallskalenniveau
->Lagemaße sollen durch einen numerischen Wert charakterisieren, wo das „Zentrum“ oder der „Schwerpunkt“ einer Verteilung von Datenwerten liegt
Quantile- Verallgemeinerung des Medians
-Spezielle p-Quantile:
xp ist das sognannten p-Quantil, also der Wert, der in einer der Größe nach geordneten Reihe des Umfangs n so liegt, dass ein Anteil p kleiner oder gleichen diesem Wert ist
Madian = x 0.50;
Quartile x 0.25, x o.50, x 0.75;
Dezile x 0.1…x 0.9
Streuungsmaße
Streumaße: zeigen wie nahe Ausgeprägungen in der Nähe des Zentrums liegen (oder auch nicht)-> geringe oder starke Streuung
Streuung: von dem mittleren Wert abzuweichen
Streumaße: Varianz
Varaianz: mittlere quadratische Abweichung vom Mittelwert= wie weit die einzelnen Werte einer Zahlenreihe im Durchschnitt vom Mittelwert der Zahlenreihe entfernt sind (Streuung um den Mittelwert)
Wenn Werte nah am Mittelwert liegen= kleine Streuung/niedrige Varianz; wenn sie weit entfernt liegen= große Streuung/hohe Varianz
Streumaße: Standardabweichung (sd)
Wurzel auf Varianz um aussagekräftigen Wert zu erhalten
Streumaße: Variationskoeffizient (“cv”)
Variationskoeffizient drückt die Standardabweichung als Anteil des Mittelwerts aus= beschreibt Streuung der Daten um den Mittelwert, dieser ist UNABHÄNGIG von der Maßeinheit (Vorteil gegenüber SD)
Im gegensatz zu Standardabweichung ein relatives Streuungsmaß
beschreibt die Streuung um den Mittelwert (relatives Streuungsmaß)
Rechnung -> Standardabweichung durch Mittelwert
Streumaße: Interquartilsabstand IQR
-Interquartilsabstand IQR: ist die Distanz zwischen dem 25%-Quantil („unteres Quartil“) und dem 75%-Quantil („oberes Quartil“), d.h. IQR = x0.75-x0.25 (ist geeignet ab ordinalskalierten Variablen)
dh: IQR= x0.75-x0.25
Streumaße: Spannweite R
Spannweite R: ist der Abstand zwischen dem kleinsten und dem größten Wert
Rechnung: größter - kleinster Wert = je nach dem kleine oder gr0ße Streuung! -> R= max- min
-Eigenschaften der Spannweite: alle Datenwerte außer Min und Max werden vernachlässigt, die Spannweite wächst tendenziell mit n, er ist empfindlich gegenüber “Ausreißern”
Problem: Ausreißer, Genauigkeit der Werte hier nicht möglich.
Boxplot
Boxplot: graphische Darstellung der Verteilung statistischer Daten, Überblick der Datenstruktur
Besteht aus: oberes Quartil x0.75; dem Median; unteres Quartil x0.25
Zusammenfassung
Last changed5 months ago