Wie erfolgt die Aufbereitung des erhobenen Datenmaterials?
Urliste Sortieren
Daten Gruppieren X(n)(Merkmalsausprägung bestimmen)
Absolute Häufigkeit h(n) ermitteln (Häufigkeit der Merkmale innerhalb einer Merkmalsausprägung notieren -> Strichliste) und Tupelpaare bilden (Häufigkeitsverteilung)
Ermittlung der relativen und prozentualen relativen Häufigkeiten: f(n) = 1/n x h(n) -> relative Häufigkeiten f(n%) = f(n)x100 -> relative prozentuale Häufigkeit -> Summe f(n) = 1 und Summe f(n%) = 100
Darstellung der Häufigkeitsverteilung als Tabelle oder Grafik
Ermittlung von kumulierten Häufigkeiten: Aufaddierung alle absoluten Häufigkeiten H(n) -> Kumulierte relative Häufigkeit F(n): Aufaddierung aller relativen Häufigkeiten
Was ist Klasseneinteilung?
Eine Klasseneinteilung wird genutzt wenn man sehr viele unterschiedliche Werte bei einem stetigen Merkmal hat. Anstatt jeden Wert aufzuschreiben werden sie in Gruppen klassifiziert. Dabei muss jeder Wert in einer Klasse passen und darf nicht in zwei gleichzeitig vorkommen.
Wie berechnet man Klassengrenzen bei Konstanten Klassenbreiten?
Wertebereich bestimmen [Min, …, Max]
Anzahl m der Klassen bestimmen
Klassenbreite berechnen x= (Max-Min)/ m
Berechnung Klassenunter- und obergrenze [...;...) usw.
Wie wird die relative Klassenhäufigkeit berechnet?
Welches Diagramm kann bei der grafischen Darstellung der Häufigkeitsverteilung verwendet werden?
Histogramm
Wie werden neue Balkenhöhen bei ungleichen Klassenbereiten berechnet?
Was ist eine Lageparameter?
Lageparameter (oder Lagemaße) geben an, wo das Zentrum oder ein bestimmter Punkt deiner Daten liegt. Sie beantworten die Frage: „Wo befinden sich meine Daten auf der Zahlengerade?“
Was ist der Modus?
Der Modus ist der einfachste Parameter. Er ist der Wert, der am häufigsten in deinen Daten vorkommt.
Vorteil: Er funktioniert auch bei nicht-zahlenbasierten Daten (z. B. "Welche Haarfarbe ist im Raum am häufigsten?").
Beispiel: Bei [1, 2, 2, 3, 5] ist der Modus die 2.
Was ist der Median?
Der Median ist der Wert, der genau in der Mitte steht, wenn du alle Daten der Größe nach sortierst. Er teilt die Daten in zwei hälften (50% kleiner/gleich, 50% größer/gleich).
Vorteil: Er ist extrem robust gegen Ausreißer. (Wenn ein Milliardär in eine Kneipe geht, steigt das Durchschnittseinkommen enorm, aber der Median bleibt fast gleich).
Berechnung: * Bei ungerader Anzahl (n): Der mittlere Wert.
Bei gerader Anzahl (n): Der Durchschnitt der beiden mittleren Werte.
Was ist das p%-Quantil?
Das Quantil ist die Verallgemeinerung des Medians. Während der Median bei 50% teilt, teilt ein p%-Quantil die Daten an einer beliebigen Stelle p.
Beispiel: Das 25%-Quantil (Q_1) bedeutet: 25% der Werte sind kleiner oder gleich diesem Wert.
Bekanntestes Beispiel: Das 50%-Quantil ist genau der Median.
Was ist der Streuungsparameter?
Beschreiben die Streuung der Merkmalswerte um einen mittleren Wert
Maß für Streuung kann auch Entfernung zwischen zwei ausgewählten Merkmalsträgern sein
Was ist die Spannweite?
Maß für die Entfernung zwischen kleinstem und größtem beobachteten Merkmalswert, gibt Länge des Bereichs an, über den sich die Merkmalswerte verteilen.
Was ist der Quartilabstand?
Was ist die mittlere absolute Abweichung?
Was ist die Varianz?
Was ist die Standardabweichung?
Was ist der Variationskoeffizient?
Zuletzt geändertvor 19 Tagen