Zeilenprozente
geben Auskunft über die Zusammensetzung einer Kategorie der Y-Variablen
die abhängige Variable wird in den Zeilen abgetragen
Notation von Kreuztabellen
Spaltenprozente
geben die konditionale Verteilung der Y-Variablen für unterschiedliche Ausprägungen der X-Variablen an
-> werden zum Vergleich von verschiedenen Gruppen der X-Variable verwendet
Was bedeutet “relatives Risiko”?
das Verhältnis von zwei interessierenden Anteilswerten
Prozentsatzdifferenz
= Maß zur Beschreibung von Gruppenunterschieden
gut auf 2*2 Tabellen anwendbar
Einheit: Prozentpunkte
Beispiel:
Wie berechnet man das Odds Ratio?
Interpretation:
Wie kann man zwei kategoriale Variablen gemeinsam beschreiben?
Wie berechnet man die Spaltenprozente?
Ergebnisse:
-> Prozentsatzdifferenz: Einsetzen der berechneten Wahrscheinlichkeiten
dxy% = 38.16 - 24.81 = 13.35
dxy% = 61.84 - 75.19 = -13.35
Was misst man mit Chi²?
Das Zusammenhangsmaß X² misst die Abweichung der beobachteten Häufigkeiten von den unter Unabhängigkeit erwarteten Häufigkeiten
𝑛𝑖𝑗 = beobachtete, tatsächliche Häufigkeit
𝑒𝑖𝑗 = erwartete Häufigkeit
-> Weicht die Verteilung unter Annahme von Unabhängigkeit von der beobachteten Verteilung ab?
Was sagt uns die Korrelation und was nicht?
Korrelation eignet sich nur für lineare Zusammenhänge (positiv oder negativ linear)
Korrelation beschreibt die Richtung und Stärke eines linearen Zusammenhangs zwischen kontinuierlichen Variablen
gibt an, ob die abhängige Variable mit zunehmender unabhängiger Variable zunimmt (=positive Korrelation) oder abnimmt (=negative Korrelation)
Ökologischer Fehlschluss
In Subgruppen kann eine positive Korrelation vorkommen, wobei aber eine negative Gesamtkorrelation vorliegt
Indifferenztabelle
Hypothetische Kreuztabelle, die zeigt wie die bedingten Verteilungen aussähen, wenn zwei Variablen gar nicht im Zusammenhang miteinander stehen würden
Berechnung mithilfe der Randverteilung:
Wie berechnet man Cramers V?
erwartete Häufigkeiten: wie sähe die Kreuztabelle aus, wenn die Variablen unabhängig wären?
Berechne Chi² (X²) -> besteht ein Zusammenhang zwischen X und Y?
Berechne Cramers V: normieren von X² in eine Maßzahl zwischen 0 und 1
Wie lässt sich die Korrelation interpretieren?
Faustregel:
-0.2/0.2: Schwache Korrelation
-0.6/0.6: Starke Korrelation
r: kann Werte zwischen -1 und 1 annehmen
-1: perfekte negative K.
0: keine Korrelation
1: perfekte positive K.
Was sind vier wesentliche Aspekte zur Beschreibung eines Streudiagramms?
Richtung: positiv / negativ
Form: linear / nicht linear
Verteilung: dicht / weit gestreut
Ausreißer: ja / nein
Chi²-Statistik
Kennzahl die die Stärke des Zusammenhangs zweier kategorialer Variablen angibt -> variiert zwischen 0 bis n
Interpretation von Cramers V
Maßzahl für die Stärke der Assoziation:
Je näher Cramers V an 1, desto stärker ist der Zusammenhang der beiden Variablen
Was ist der kleinste Wert von X²?
X²min = 0
Wie bestimmt man den größten Wert von X² (Chi)?
bei maximaler Abhängigkeit (perfekter Zusammenhang) ist X²max = n*(k-1)
enthält die Tabelle weniger Zeilen als Spalten, bezeichnet k die Anzahl der Zeilen, ansonsten die Anzahl der Spalten
das heißt, k hängt von der Anzahl der Zeilen und Spalten ab
bei 2 Spalten und Zeilen: k = 2
X²max = n(k-1) = 2702 * (2-1) = 2702
Was sagt uns eine Korrelation nicht?
Durch den Korrelationskoeffizienten kann man keine Rückschlüsse auf die Gründe des Zusammenhangs ziehen
Welche Werte kann das Odds Ratio annehmen?
Kann Werte zwischen 0 und unendlich annehmen
Wie berechnet man die relativen häufigkeiten bzw. Spaltenprozente einer Kreuztabelle?
Bsp.: Die Grünen -> Pro Europa: 142 / 5454 * 100 = 2.6%
+ Die Grünen -> Regulierung der Märkte: 312 / 5454 * 100 = 5.72%
Wie wird die Prozentsatzdifferenz ausgedrückt?
mit Prozentpunkten
Was gibt eine Kovarianz an, die kleiner als 0 ist?
Wie berechnet man die Kovarianz?
3 Schritte:
Wie berechnet man Chi²?
Schritte:
erwartete Häufigkeiten berechnen (Kreuztabelle) -> Formel:
Werte in Chi² - Formel einsetzen und alle einzelnen ergebnisse addieren, um auf den Chi²-Wert zu kommen
Wo steht die abhängige Variable in einer Kreuztabelle?
in der Zeile
Bsp.: AV: Grad der Zustimmung zu der Aussage, ob die Demokratie in Gefahr ist
Demgegenüber zeigt die unabhängige Variable die Information,
ob der*die Befragte aus Ost- oder Westdeutschland kommt
Zuletzt geändertvor 5 Tagen