Welche Methoden gibt es zur Beschreibung von Daten?
Urlisten und Tabellen
Häufigkeiten
tabellarische Darstellung
graphische Darstellung
Maßzahlen (Kennwerte)
Spezielle graphische Darstellungsformen
Was ist die Funktion von Maßzahlen/Kennwerten?
sie geben in zusammengefasster Form Auskunft über Eigenschaften von Verteilungen
sind Grundlage statistischer Auswertungen
durch sie kann man die Verteilung einer Variable hinsichtlich der zentralen Tendenz oder Streuung beschreiben
Was sind Maße der zentralen Tendenz? Welche gibt es?
durch sie kann ein Wert ermittelt werden, der “typisch” für die erhobenen Messwerte ist
Modalwert/Modus
arithmetisches Mittel/Mittelwert
Median
Quantile
Was beschreibt der Modus/Modalwert?
Mo = die Messewertausprägung, die am häufigsten beobachtet wurde
es kann mehr als einen Modus geben
2 Modi = bimodale Verteilung
mehrere Modi = multimodale Verteilung
Was beschreibt der Median?
Md = der Wert, der eine geordnete Messwertreihe in zwei gleichgroße Hälften teilt
mittlere Position der geordneten Urliste
gerade Anzahl an Werten - Mittelwert zwischen zwei mittleren wird zum Median
=> (Mindestens) 50% der Merkmalsträger*innen haben einen Messwert, der kleiner oder gleich dem Median ist
Summe absoluter Abweichungen von Md minimal
wenig anfällig gegenüber Ausreißern
Wie kann der Median berechnet werden?
n = Anzahl der Personen
Messwerte der Urliste müssen geordnet werden
Ordinalskalenniveau notwendig
Was beschreibt das arithmetische Mittel/Mittelwert? Wie wird es berechnet?
x (quer)= Summe aller aufgetretenen Messwerte durch Anzahl der Versuchspersonen
Durchschnittlicher Messwert
sehr Ausreißerempfindlich
kann zentrale Tendenz verzerrt wiedergeben
mindestens Intervallskalenniveau
Summe aller Abweichungen zum Mittelwert = 0
Informationsstärker als Md
Was beschreibt das p%-Quantil?
p% der Merkmalsträger*innen haben einen Messwert, der kleiner oder gleich dem p%-Quantil ist
Md = 50%-Quantil
Perzentile: p = 1,2,..99
Dezilie: p = 10,20,…90
Quartile: p = 25,50,75
Was sind Streuungsmaße / Dispersionsmaße? Welche gibt es?
= Maße, die das Ausmaß der Unterschiedlichkeit der Messwerte quantifizieren = Auskunft über die Variabilität der Werte, d.h. wie weit die Werte um die zentrale Tendenz verteilt liegen
Spannweite/Range
Varianz
Standardabweichung
Interquartilsabstand
Was beschreibt die Spannweite?
= Differenz zwischen Maximum und Minimum
stark abhängig von den Extremwerten
Was beschreibt die Varianz?
s^2 = durchschnittliche (quadrierte) Abweichung vom Mittelwert
= Summe der quadrierten Abweichungen, die anschließend gemittelt werden (dividiert durch Anzahl der Messwerte)
je größer die Varianz, desto mehr streuen die Messwerte um das arithmetische Mittel
Was beschreibt die Standardabweichung?
s = positive Quadratwurzel der Varianz
= durchschnittliche Abweichung vom Mittelwert
gibt an wie gut der Mittelwert die Verteilung repräsentiert
je größer die Standardabweichung im Verhältnis zum Mittelwert, umso mehr weichen die einzelnen Messwerte vom Mittelwert ab
Was beschreibt der Interquartilsabstand?
IQA = Bereich der Werte zwischen erstem und drittem Quartil
repräsentiert die mittleren 50% der Werte
wenig durch Ausreißer beeinflusst
Differenz von drittem und erstem Quartil
Welche graphischen Darstellungsarten wurden besprochen?
Tabellen
Häufigkeitstabellen
Säulen-/ Balkendiagramme
Histogramme
Box-Plot
Welche Arten von Häufigkeiten gibt es?
absolute
relative
absolute kumulierte
relative kumulierte
Sie alle können tabellarisch und graphisch dargestellt werden.
Was beschreibt die absolute Häufigkeit?
H(xj) = Anzahl der Merkmalsträger einer Messwertausprägung
es kann auch sinnvoll sein nicht beobachtete Messwertausprägungen H(xj)=0 zu berücksichtigen
Was beschreibt die relative Häufigkeit?
h(xj) = absolute Häufigkeit durch n
= Anteil der MerkmalsträgerInnen, die die Messwertauspräung aufweisen
auch in Prozent angebbar
Was beschreibt die absolute kumulierte Häufigkeit?
Hkum(xk) = Summe der absoluten Häufigkeit einer Messwertausprägung und allen kleineren Messwertausprägungen
Was beschreibt die relativ kumulierte Häufigkeit?
hkum(xk) = absolute kumulierte Häufigkeit durch n
= Anteil der MerkmalsträgerInnen, die die Messwertausprägung xk oder eine kleinere Messwertausprägung aufweisen
Was ist bei der Erstellung von Grafiken zu beachten?
Daten stehen im Mittelpunkt
möglichst viele Daten mit möglichst wenigen graphischen Mitteln zeigen
wenig Ablenkung (zb 3D Effekte)
klare Darstellung durch Überschrift, Achsenbeschriftung, Legende, Datenbasis, Erhebungszeitpunkt
Darstellung so unverzerrt wie möglich
Wann werden Balkendiagramme verwendet?
= bei diskreten Variablen
x Achse = Zahlen oder Symbole je nach Variablenart
y Achse = jeweilige Häufigkeiten
beginn immer bei null
Wann wird ein Histogramm verwendet?
= bei kontinuierlichen Variablen
lückenlose Aneinanderreihung der Balken veranschaulicht Kontinuität der Variablen
Balkenbreite durch Breite der Kategorien
Wann wird ein Box-Plot benutzt?
= meist bei metrischen Variablen
fünf wesentliche Werte:
Minimaler Messwert
Maximaler Messwert
Q1, Q2, Q3
Boxlänge = IQA
kennzeichnung von Ausreißerwerten
komprimiert Info von Histogramm
Last changeda year ago