Zusammanhänge:
zwischen zwei kategorialen Variablen: (häufig) Assoziation
zwischen zwei metrischen Variablen: Korrelation
Kreuztabelle mit Häufigkeiten
Kreuztabelle mit Häufigkeiten: zur Beschreibung zwei kategorialer Variablen
Prozentsatzdifferenz
Prozentsatzdifferenz: ein einfaches Maß zur Beschreibung von Gruppenunterschieden; bei der Interpretation der Prozentsatzdifferenz muss man die Ausgangswerte berücksichtigen
(bsp Verdopplung von Prozenten) Prozentsatzdifferenzierung wird in Prozentpunkten dargestellt
Interpretation:
die Bildung der Eltern hat einen Einfluss auf das Erreichen eines Hochschulabschlusses denn: haben die Eltern keinen Hochschulabschluss ist der Anteil der personen mit Hochschulabschluss 26 Prozentpunkte geringer (Siehe Bild unten)
Interpretation Spalten- und zeilenprozente
Interpretation Spalten- und Zeilenprozente: Zeilenprozente geben Auskunft über die Zusammensetzung einer Kategorie der Y-Variablen aussagekräftig nur relativ zur Randverteilung!!
Spaltenprozente geben die konditionale Verteilung der Y-Variablen für unterschiedliche Ausprägungen der X-Variablen an-> werden zum Vergleich von verschiedenen Gruppen der X-Variablen verwendet
Relatives Risiko
Relatives Risiko: Verhältnis zweier interessierender Anteilswerte
Im Beispiel das Risiko von Befragten aus Akademikerfamilien einen Hochschulabschluss zu erreichen 47,37% / 20,97% = 2,26 mal so groß (= mehr als doppelt so groß) wie das für Befragte, die nicht aus einer Akademikerfamilie stammen.
Oods Ratio/ Chancenverhältnis
-Odds/ Chancenverhältnis: Verhältnis des Verhältnis von Anteilswerten
-> das Odds Ratio kann jeden Wert größer oder gleich null haben. Es gibt keine obere Grenze für das Odds Ratio, da es sich um ein Verhältnis von Quoten handelt =0 bis + unendlich
Chi2 und Cramers V
Chi2 (x2) und Cramers V: für größere Tabellen andere Maßzahlen besser, z.B. Chi2 (c2) und c2-basierte Maßzahlen (für kategoriale!!)
Cramers V: Maßzahl für die Stärke der Assoziation: je näher Cramers V an 1, desto stärker ist der Zusammenhang der beiden Variablen
Chi: veranschaulicht ob beobachtete Verteilung eines Merkmals einer erwarteten Verteilung entspricht.
Streudiagramm
Vier wesentliche Aspekte zur Beschreibung eines Streudiagramms:
Richtung: positiv/ negativ
Form: linear/ nicht-linear
Verteilung: dicht/ weit gestreut
Ausreißer: ja/nein
Kovarianz (“cov(Y,X)”)
Kovarianz: zur mMessung der Stärke des Zusammenhangs zwischen kontinuierlichen Variablen
Drei Schritte zur berechnung der Kovariantz:
Berechne die beiden arithmetischen Mittelwerte
Berechne die Abweichung der Beobachtungen vom Mittelwert
Berechne den Mittelwert der Produkte
Interpretation: beschreibt die Richtung des Zusammenhangs; man kann daran ablesen in welche Richtung sich die Punkte verteilen= positiver Zusammenhang nach oben, negativer nach unten
Korrelation
Korrelation:BeschreibtdieRichtungundStärkeeineslinearenZusammenhangszwischen kontinuierlichen Variablen. Sie liegt zwischen -1 und +1 und gibt an, ob die abhängige Variable mit zunehmender unabhängiger Variable tendenziell zunimmt (positive Korrelation) oder abnimmt (negative Korrelation).
Da die Kovarianz von den Einheiten von X und Y abhängt:
"Normiere" sXY in eine Maßzahl zwischen -1 (negativer Zus.hang) und 1 (positiver Zus.hang)
Rechenweg: dividiere Kovarianz durch die Standardabweichung von X und Y
Interpretation: siehe Bild
Korrelation ist nicht sinnvoll für nicht-lineare Zusammenhänge- nur für lineare Zusammenhänge
Spearman Rangokorrelation
SpearmanRangkorrelation:MaßfürdenZusammenhangderRängevonzwei(mind.)ordinalen Variablen. Robust gegenüber Ausreißern
Last changed6 months ago