Wie kann ich das “Zentrum” einer Verteilung beschreiben?
= arithmetisches Mittel (Durchschnitt=
STATA = mean
Berechnung:
Interpretation der Häufigkeitstabelle
= Median (Wert in der Mitte)
Einzeldaten werden der Größe nach geordnet
Der Wert, welcher bei den nach der Größe geordneten Daten genau in der Mitte liegt, heißt Median
wenn n ungerade ist, muss der Median berechnet werden:
Interquartilsabstand
Das Werte-Intervall einer Variable, in dem die mittleren 50% der Fälle liegen
es befindet sich zwischen dem 25% und 75%-Quartil
IQR = X0,75 - X0,25
Eigenschaften und Interpretation des arithmetischen Mittels
ist sinnvoll für metrische Daten -> mindestens Intervallskalenniveau benötigt
ist häufig eine Zahl, die nicht in den Daten beobachtet werden kann
Problem:
das arithmetische Mittel ist bei bi- oder mehrgipfligen Verteilungen nicht sinnvoll interpretierbar
Modus
(Modalwert)
häufigster Wert in der Verteilung
Bsp.: das Item in einer Umfrage, was am häufigsten genommen wurde
Boxplot
Visualisiert die wichtigsten Perzentil-basierten Lage- und Streuungsmaße
Spannweite
Die Spannweite R einer Verteilung ist der Abstand zwischen dem kleinsten und dem größten Wert
R = max - min
in STATA: range
Eigenschaften:
Alle Datenwerte außer min und max werden vernachlässigt
Spannweite wächst mit zunehmender Fallzahl n
empfindlich gegenüber Ausreißern
Beispiel Median bestimmen
hier: ungerade Termanzahl
Wenn die Termanzahl gerade ist, so ist der Medianwert, das arithmetische Mittel der beiden mittleren Elemente der Datenreihe
Verteilungstypen
4 Verteilungstypen:
Streumaße
Zeigen, wie nahe Ausprägungen in der Nähe des Zentrums liegen oder auch nicht
Welche Lagemaße ist empfindlicher gegenüber Ausreißern? (Mittelwert oder Median)
= der Mittelwert
dadurch wird der Durchschnitt viel höher und wird nicht realistisch abgebildet
der Median ist unpräziser, jedoch weniger empfindlich gegenüber Ausreißern
Wie sind die Lagemaße bei einer symmetrischen Verteilung ?
Bei einer symmetrischen unimodalen Verteilung sind Modus, Median und Mittel identisch
Wie sind die Lagemaße bei schiefen / asymmetrischen Verteilungen?
Beispiel: rechtsschiefe Verteilung
-> Modus liegt auf dem Gipfel (am häufigsten vorkommener Wert)
Median teilt die Daten in der Mitte, weil das rechte Ende der Verteilung ausufender ist -> also liegt die Mitte rechts von Gipfel
der Mittelwert wird stärker als der Median von den extremen Werten am rechten Ende der Verteilung beeinflusst
Was gibt die weiße Linie im Boxplot an?
den Median
Was ist das Ziel eines Lagemaßes?
Das Lagemaß soll einen typischen Wert / das Zentrum der Verteilung darstellen
Beispiele für Lagemaße
Welches Skalenniveau benötigt der Median mindestens, um berechnet zu werden?
Ordinalskala
Form einer Verteilung beschreiben
Beispiel:
Modus, Median und Arithmetisches Mittel bei symmetrischen Verteilungen
Bei symmetrischen Verteilungen sind Modus, Median und arithmetisches Mittel identisch
Wie berechnet man die Standardabweichung?
Wurzel aus der Varianz:
S = 2
Zuletzt geändertvor 6 Tagen