Was ist Datenkompetenz?
Die Fähigkeit, Daten zu finden, zu verstehen, zu interpretieren und kritisch zu bewerten.
Grundlage für evidenzbasierte Entscheidungen und zur Vermeidung von Fehlinterpretationen/Verzerrungen.
Unterschied quantitative vs. qualitative Daten?
Quantitativ = numerisch:
diskret (ganze Zahlen, z. B. Anzahl Kinder) oder
kontinuierlich (beliebige Werte, z. B. Körpergröße).
Qualitativ = kategorial:
nominal (ohne Rangordnung, z. B. Farbe) oder
ordinal (mit Rangordnung, z. B. Schulnote).
Nenne die vier Skalenniveaus (Messniveaus).
Nominal (Kategorien ohne Rang),
Ordinal (Rangordnung, aber keine gleichen Abstände),
Intervall (gleiche Abstände, kein absoluter Nullpunkt, z. B. °C),
Verhältnis (gleiche Abstände MIT absolutem Nullpunkt, z. B. Gewicht).
Nominal/Ordinal = kategorial,
Intervall/Verhältnis = metrisch.
Was sind Mittelwert, Median und Modus?
Mittelwert = arithmetisches Mittel (1/n · Σ x_i).
Median = mittlerer Wert der sortierten Daten.
Modus = häufigster Wert.
Median ist robust gegen Ausreißer, Modus schon ab Nominalskala nutzbar.
Wann wählt man Mittelwert, Median oder Modus als Lagemaß?
Mittelwert: symmetrische Verteilung ohne extreme Ausreißer, Intervall-/Verhältnisniveau.
Median: schiefe Verteilung oder Ausreißer, ab Ordinalskala.
Modus: Nominaldaten, häufigste Kategorie.
Welche Streuungsmaße gibt es?
Spannweite (max − min),
Interquartilsabstand IQR = Q3 − Q1,
Varianz (mittlere quadratische Abweichung vom Mittelwert)
Standardabweichung (Wurzel der Varianz).
Unterschied Korrelation und Kausalität?
Korrelation = statistischer Zusammenhang zweier Variablen ohne nachgewiesene Ursache.
Kausalität = echter Ursache-Wirkungs-Zusammenhang.
„Korrelation ist nicht Kausalität“: Scheinkorrelationen (z. B. Störche/Geburten) durch dritte Faktoren möglich.
Nenne wichtige Verzerrungen (Bias) bei Stichproben.
Selection Bias (nicht repräsentative Auswahl),
Non-Response Bias (bestimmte Gruppen antworten nicht),
Survivor Bias (nur „Überlebende“ betrachtet),
Beobachtungsbias, ausgelassene Variablen, Ausreißerverzerrung.
Wichtig: zufällige bzw. repräsentative Stichprobe.
Aufgabe: Welches Lagemaß für eine Gewichtsspalte mit einem Ausreißer (z. B. 55 kg neben 78–90 kg)?
Der Median, weil er robust gegen den Ausreißer nach unten ist und die zentrale Tendenz repräsentativer abbildet als das durch den Ausreißer verzerrte arithmetische Mittel.
Begründung immer über die Ausreißer-Robustheit.
Geschichtete (stratifizierte) vs. Quotenstichprobe?
Geschichtet: Aufteilung in Schichten (z. B. Altersgruppen), dann ZUFÄLLIGE Auswahl je Schicht → gut für statistische Analysen.
Quote: feste Quoten vorgegeben, Auswahl aber NICHT zufällig (Interviewer wählt) → schneller, aber potenziell verzerrt.
Zuletzt geändertvor 8 Tagen