Relevanz bivariater Zusammenhänge
zwei Arten von bivariaten Zusammenhängen
ungerichteter (symetrischer) Zusammenhang
es gibt einen Zusammenhang (mit einer gewissen Stärke)
UV —> AV-Beziehung wird nicht! definiert , d.h. wir wissen nicht, was Ursache und was Wirkung ist
gerichteter (asymmetrischer) Zusammenhang
zusätzlich zur Stärke gibt es eine Wirkungsrichtung des Zusammenhangs
dazu muss UV —> AV-Beziehung definiert werden
unabhängige = erklärende = bedingende Variable (i.d.R. X)
abhängige = erklärte = bedingte Variable (i.d.R. Y)
=> Fokus der quantitativ-empirischen Sozialforschung
Wie erkennen wir Zusammenhang in Kreuztabelle?
Bivariate Zusammenhangsmaße Überblick
Maße für polytome kategoriale Variablen
Beispiel: Zugehörigkeit Religionsgemeinschaft
Ost + West besteht ein Zusammenhamg zur Religionsgemeinschaft
Geschlecht und Religionsgemeinschaft kein Zusammenhang
Zwei X Variablen und Sechs Y Variablen
Vergleich: bedingte Verteilungen und Randvereilungen
erwartete Verteilung = Anzahl absoluter Häufigkeiten, wenn kein Zusammenhang besteht,
d.h. bedingte Verteilung = Randverteilung
links: Abweichung = Zusammenhang
rechts: keine Abweichung = kein Zusammenhang
Wie berechnen wir Zusammenhang in Kreuztabelle?
Bsp. Rechnung aus der VL:
x/alle Befragte im West = x/2604 = 1511/3169
x = 1511 * 2604/1244
= 1244
1244 von 2604 (Westen) = 47,8%
Berechnung von Erwartungswerten
Chi-Quadrat 𝜒²
0 —> keine Abweichung & kein Zusammenhang; je größer desto stärker Abweichung und größerer Zusammenhang
Chi 2
links: größerer Zusammenhang als rechts
—> aber nicht normiert deswegen schwierig zu Interpretieren
Cramérs V
Zusammenhangsmaße
Faustregeln zur Interpretation der Maßzahlen
Cramer‘s V
Bivariate Zusammenhangsmaße
Überblick
Grundidee der Analyse zweier ordinaler Variablen
ordinale Variablen sind nominalen Variablen ähnlich
ABER: zusätzlich sind Ausprägungen geordnet
Maße für polytome kategoriale Variablen (Chi² und Cramer‘s V) sind auch anwendbar
zeigen nur, ob ein Zusammenhang besteht und dessen Stärke, nicht aber die Richtung
Zusammenhangsmaße für ordinale Variablen nutzen zusätzlich Information zur Ordnung
z.B. geht mit einer höheren Klasse von X auch eine höhere Klasse von Y einher?
=> Richtung des Zusammenhangs ist positiv
z.B. Paarvergleich: für jeweils 2 Fälle werden wird Ausprägungen von X mit Ausprägu
Möglichkeiten
C – konkordant: xa > xb & ya > yb
—>für diese 2 Fälle: positiver Zusammenhang
Fall 1: Xa = mittlere Bildung & Ya = hohes Einkommen
Fall 2: Xb = niedrige Bildung & Yb = niedriges Einkommen
D – diskordant: xa > xb & ya < yb
—>für diese 2 Fälle: negativer Zusammenhang
Fall 1: Xa = mittlere Bildung & Ya = mittleres Einkommen
Fall 2: Xb = niedrige Bildung & Yb = hohes Einkommen
darüber hinaus sind verschiedene andere Ausprägungen möglich (alle gleich, X gleich aber Y ungleich und vice versa)
je nach Maßzahl unterschiedliche Beachtung/Gewichtung dieser Paarvergleiche – wir betrachten nur Kendall‘s tau b
Beispiel: Kendall‘s 𝜏𝜏𝑏𝑏 (tau b)
Maße für ordinale kategoriale Variablen
ungerichtetes (symetrisches) Zusammenhangsmaß
aber: zeigt die Richtung des Zusammenhangs an
Wertebereich -1 bis 1
-1 perfekter negativer Zusammenhang; 0 = kein Zusammenhang; 1 = perfekter positiver Zusammenhang
Beispiel:
in Ehen: Zusammenhang zwischen eigener Bildung und Bildung Partner*in
Beispiel: Bildungslevel der Partner in Ehen (Allbus 2018)
Mittelwertvergleich
Maße für Kombi: X=nominal & Y=metrisch
Maße für metrische Variablen
Grafische/visuelle Analyse
Darstellung im Streudiagramm
X auf X-Achse
Y auf Y-Achse
jeder Fall stellt einen Punkt im Streudiagramm dar
Interpretation
Verteilung ungefähr entlang einer Geraden => linearer Zusammenhang
Steigung der Geraden zeigt Stärke und Richtung
Punktewolke => kein Zusammenhang
Kovarianz
symmetrisches Zusammenhangsmaß (keine Variable wird als ursächlich angenommen)
aber: Aussage über Richtung des Zusammenhangs
Wertebereich -∞ bis +∞; je größer der Wert, desto stärker, der neg./pos. Zusammenhang
—> Bedeutung schwierig zu deuten, weil es von der Skalierung abhängt und nicht nomiert ist
Pearsons r (Produkt-Moment-Korrelation)
Eigenschaften wie Kovarianz (also symetrisch), aber
—> Normierter Wert von Kovarianz kann gedeutet werden
Beispiel: Alter und Einkommen
Punktewolke
r mit 0.06 fast bei 0 —> kein Zusammenhang
Beispiel: Alter und Alter Ehepartner*in
Zusammenhang da, weil r fast 1
Drittvariablenkontrolle
Chi-Quadrat: Grundlage
Wir haben schon letzte Woche besprochen, dass wir als Maß für einen Zusammenhang die Abweichungen zwischen einer Indifferenztabelle - die zeigt wie die Häufigkeiten aussehen müssten, wenn kein Zusammenhang vorlage – und der Kontingenztabelle – die zeigt wie die Häufigkeiten tatsächlich verteilt sind – messen.
Je starker die tatsächlich gemessene Verteilung (Kontingenztabelle) von den erwarteten Häufigkeiten (Indifferenztabelle) abweicht, desto stärker ist der Zusammenhang
Ein Maß, dass das ausdrückt ist Chi-Quadrat
Wie berechnet man die erwarteten Häufigkeiten?
Für jede Zelle:
Zeilensumme * Spaltensumme/Gesamtsumme
Wertebereich Chi-Quadrat
Chi-Quadrat hat einen Wertebereich zwischen 0 und + ∞
Ein Chi-Quadrat von 0 bedeutet: Es gibt keinen Zusammenhang zwischen beiden Variablen. Ein Chi-Quadrat von 0 würde nämlich nur dann zustande kommen, wenn die Kontingenztabelle und die Indifferenztabelle exakt gleich wären
Je weiter entfernt von 0, desto stärker ist der Zusammenhang
Problem: Es fehlt die Normierung, wir Wissen nicht, was ein “großes” oder “kleines” Chi-Quadrat ist
Lösung: Cramérs V berechnen
Wertebereich Cramérs V
Cramérs V liegt zwischen 0 und 1. Je näher an 1, desto stärker ist der Zusammenhang
Ein Cramérs V von 0 bedeutet: Es gibt keinen Zusammenhang zwischen den beiden
Variablen
Richtung von Zusammenhängen
Bisher haben wir uns mit Maßzahlen beschäftigt, die nur angeben können ob ein Zusammenhang vorliegt oder nicht und wie stark der Zusammenhang ist
Einige Maßzahlen können aber zusätzlich noch etwas: Sie können angeben, ob der Zusammenhang zwischen den Variablen positiv oder negativ ist
Voraussetzung dafür ist, dass die Variablen mindestens eine logische Rangfolge haben – also mindestens ordinal sind
Die Richtung des Zusammenhangs drückt man am besten in einem Je desto Satz aus, zum
Beispiel “Je höher das Einkommen, desto höher ist die Lebenszufriedenheit”
Maßzahlen die die Richtung des Zusammenhangs angeben können sind z.B.: Pearson’sche Korrelation, Kendalls 𝑇𝑎𝑢𝑏 oder der Regressionskoeffizient
Richtung und Stärke des Zusammenhangs
Positive Zusammenhänge bedeuten: Mehr von der einen Variable geht tendenziell mit mehr von der anderen Variable einher. Je mehr x, desto mehr y.
Negative Zusammenhänge bedeuten: Mehr von der einen Variable geht tendenziell mit weniger von der anderen Variable einher. Je mehr x, desto weniger y
Die Richtung des Zusammenhangs kann mit einem Je/Desto-Satz beschrieben werden, z.B.: Je mehr investierte Lernzeit, desto besser ist das Testergebnis im Deutschtest. Je mehr Stunden Sport pro Woche, desto geringer das Körpergewicht.
Korrelationen grafisch erkennen
Ob ein positiver oder negativer Zusammenhang vorliegt, lässt sich oft schon grafisch erkennen
Bei einem positiven Zusammenhang verläuft die Punktwolke von unten links (niedrig-niedrig) nach oben rechts (hoch – hoch)
Bei einem negativen Zusammenhang verläuft die Punktwolke von oben links (niedrig – hoch) nach unten rechts (hoch – niedrig)
Wir wollen aber natürlich keine grafische sondern eine mathematische Zusammenfassung, deswegen berechnen wir Maßzahlen. Eine Maßzahl die ausdrückt ob ein Zusammenhang vorliegt, wie stark er ist und welche Richtung er annimmt ist der Korrelationskoeffizient und damit verbunden die Kovarianz
Positive vs. Negative Kovarianz
Kombinationen aus positiven und negativen Werten (über- und unterdurchschnittlichen Ausprägungen) weisen auf negative Korrelationen hin: Viel vom einen, wenig vom anderen
Kombinationen aus positiven und positiven Werten (oder negativen und negativen Werten) weisen auf positive Korrelationen hin: Viel vom einen, viel vom anderen
Kovarianz interpretieren
Die Kovarianz ist die Vorstufe zur Korrelation
Wertebereich [-∞, + ∞], kann angeben ob ein Zusammenhang positiv oder negativ ist
Je höher der Wert, desto stärker ist der Zusammenhang
Problem: Keine Normierung, deshalb schwer zu beurteilen ob ein Zusammenhang stark oder schwach ist (gleiches Problem wie bei der Varianz!) – schlecht interpretierbar
Aus der Kovarianz lässt sich aber ein normiertes Maß berechnen – die Pearson’sche Korrelation
Gerichtet vs. Richtung
Es gibt (un)gerichtete ((a)symmetrische) Zusammenhangsmaße und es gibt Zusammenhangsmaße, die die Richtung des Zusammenhangs angeben können - beides sind aber unterschiedliche Dimensionen
Die pearson’sche Korrelation kann die Richtung eines Zusammenhangs (positiv/negativ) angeben
Die pearson’sche Korrelation bleibt immer gleich – egal welche Variable ich als unabhängig und welche
ich als abhängig verwende – sie ist deshalb ein symmetrisches=ungerichtetes Zusammenhangsmaß
Cramérs V kann nicht die Richtung eines Zusammenhangs angeben und ändert sich nicht, je nachdem welche Variable als abhängig und welche als unabhängig betrachtet wird, ist also auch ungerichtet
Die Odds können nicht die Richtung eines Zusammenhangs angeben, aber ändern sich, je nachdem welche Variable als abhängig und welche als unabhängig betrachtet wird, ist also gerichtet!
Zuletzt geändertvor einem Jahr