Balkendiagramm
Häufigkeit von Merkmalsausprägungen (nominal, ordinal, metrisch diskret)
Visualisiert die absoluten oder relativen Häufigkeiten von kategorialen oder metrisch diskreten Variablen.
Histogramm
Histogramm: Häufigkeit von gruppierten Merkmalsausprägungen (metrisch)
Visualisiert die (gruppierte) Verteilung einer numerischen Variable.
Verteilung
Verteilung: Die Verteilung gibt an, wie häufig bzw. wahrscheinlich bestimmte Werte bzw. Wertebereiche sind.
Schiefe: Bei rechtsschiefen (linkssteilen) Verteilungen sind mehr Werte im unteren Wertebereich, bei linksschiefen (rechtssteilen) im oberen.
Bei symmetrische Verteilungen verteilen sich die Daten symmetrisch um eine zentrale Lage.
Bei mehrgipfligen Verteilungen gibt es mehr als nur ein Zentrum, um das die Werte streuen.
Boxplot
Visualisierung von Median, oberem und unterem Quartil, Minimum und Maximum, Ausreißer
Streudiagramm / Scatterplot
Darstellung der Merkmalsausprägungen von zwei i. d. R. metrischen Merkmalen als Punkte
Mosaikplot
Darstellung der Merkmalsausprägungen zweier nominaler Merkmale
Stimmt die Aussage: Die Berechnung des arithmetischen Mittelwertes ist bei nominalen Merkmalen nicht sinnvoll?
Ja, nominalskalierte Variablen repräsentieren Kategorien, bei denen die Reihenfolge der Kategorien keine Bedeutung hat (z.B. Geschlecht, Farbe…). Das arithmetische Mittel basiert auf numerischen Werten.
Stimmt die Aussage: Der Median ist das 50% Quantil einer Verteilung?
Ja, korrekt. Der Median repräsentiert den Wert, unter dem 50% der Daten liegen und über dem 50% der Daten liegen
Welche Aussage stimmt?
Hypothesentest
- mathematische/statistische Operationalisierung von Hypothesen und Modellen
- Nullhypothese H0 = kein Zusammenhang/kein Unterschied
- Alternativhypothese HA = logisches Gegenteil v. H0
- Hypothese beziehen sich auf Population / Grundgesamtheit, d.h. 𝜋, 𝜇, 𝛽
- Nullhypothesen können einseitig, gerichtet ( ≤ , ≥ ) oder
zweiseitig, ungerichtet (=) sein.
- Anhand einer geeigneten Teststatistik 𝛿 werden die Stichprobendaten zusammengefasst. Ist die Wahrscheinlichkeit der Teststatistik unter H0 klein, fällt der Wert der Teststatistik in den Ablehnungsbereich und H0 wird verworfen, andernfalls nicht.
- Das vorab festgelegte Signifikanzniveau 𝛼* eines Tests gibt die maximal zugebilligte Irrtumswahrscheinlichkeit dafür an, H0 zu verwerfen, obwohl H0 gilt.
Zuletzt geändertvor einem Jahr