Auswertungsmethoden zweidimensionaler Daten
wenn zwei Merkmale wie zb Geschlecht und Einkommen betrachet werden und da einen möglihen zusammenhang finden wollen benutzen wir die
bivariate Analyse
wichtig welches Skalenniveau die beiden Merkmale aufweisen
zu unterscheiden
zwei nominalskalierte Merkmale
zwei ordinalskalierte Merkmale
zwei kardinalskalierte Merkmale
zwei verschieden skalierte Merkmale
3.1 Kontingenzanalyse
Zwei nominalskalierte Merkmale
grundsätzlich werden die Merkmale mit A und B gekennzeichnet
diese beiden Merkmale können unterschiedliche Merkmalsausrpägungen annehmen
zb Merkmalsauspr. A mit A unten 1, A unten 2 … A unten groß i,
bei B - B unten 1,……B unten J
Merkmal A hat I versch. und B J versch. Merkmalsausprägungen
I und J müssen aber nicht identisch sein
Kontingenztabelle
Kontingenztabelle für Absolute H. bildet Pendant zur Häufigkeitstabelle im univeraten Fall
Aufbau im Skript
Erster Schritt der Datenanalyse: erhobenen Daten zugeschnitten auf Frage komprimieren
absolute H. n unten ij für einzelne Ausrpägungen (A unten j, B unten j) in Kontingenztabelle zusammenfassen
Berechnung des korrigierten Kontingenzkoeffizienten
quantifiziert Zusammenhang zwischen zwei Merkmalen
mindestens eins nominalskaliert
ist eine konrete Maßzal namens korrigierter Kontingenzkoeffizient
4 Rechenschritte notwendig
Schritt 1:
sogennante erwartete Häufigkeiten (absolute Häufigkeiten) werden unter deskriptiver Unabhängigkeit bestimmt
das sind die absoluten H für die die beiden Merkmale in keinerlei Zusammenhang stehen
beispiel und rechnung skript
Schritt 2
Berechnung der Abstände zwischen den absoluten und erwarteten Häufigkeiten
prüfen wie weit die tatsächlcih absoluten H von den erwarteten entfernt sind.
je weiter die tatsächlichen von den erwarteten H entfernt sind desto stärker muss der Zusammenhang sein
um Entfernung zu müssen wird X hoch 2 berechnet
formel im skript
Schritt 3
Schritt 3:
Berechnung des Kontingenzkoeffizienten
Kontingenzkoeffizient K wird berechnet
er kann ausschlißlich werte zwischen 0 und 1 annehmen
Schritt 3 :
in diesem Schritt wird er korigiert
es entsteht K*
Funktion min = eine Minimumfunktion - wählt kleinere Zahl der Spalten
Interpretation Schritt 3
Im skript
3.2 Rangkorrelationsanalyse
Zusammenhang zwischen zwei ordinalskalierten Merkmalen
beiden Merkmale werden mit X und Y gekennzeichnet
für jeden Merkmalsträger i in Stichprobe existiert eine Beobachtung x unten i des Merkmals X
und eine Beobachtung y unten i für das Merkmal Y
für jeden Merkmalsträger gibt es ein Punktepaar
Monotonie
entweder gleichgerichteten oder einen entgegengesetzten Zusammenhang verstehen
Beobachtungen werden durch Ränge ersetzt
Merkmalsträger bekommen Rangplätze
der mit bester Auspräung bekommt Rang 1
mit schlechtester bekommt Rang n
Ränge für Beobachtungen xi des Merkmals X werden mit r unten i bezeichnet
Ränge für Beobachtungen yi des Merkmals Y heissen s unten i
Maßzahl die auf den bestimmten Rängen basiert und Aussage über Monotonen Zusammenhang zulässt heißt:
Rankorrelationskoeffizient von Spearmen:
wird für den Zusammenhang zwischen 2 Merkmalen verwendet,
beide mindestens ordinalskaliert
r unten groß S
Interpretation des Ergebnisses aus dem Skript
r unten S kann nur Werte zwischen -1 und +1 annehmen
wir erhalten positive Werte wenn monoton wachsender Zusammenhang zwischen beiden Merkmalen vorliegt
liegt r S im negativen Bereich dann gilt monoton fallender bzw entgegengesetzter Zusammenhang
Für r S = 0 gibt es keinen Zusammenhang mit dem ergebnis ist sicher das kein monotoner Zusammenhang besteht
Einteilung zur Interpretationshilfe
im Skript Seite 82
Interpretation
wichtig:
beide Wörter und umgekehrt erwähnen
3.3 Korrelationsanalyse
Zusammenhang zwischen wei Kardinalskalierten Merkmalen
auch hier kardinalskalierte Merkmale werden mit X und Y bezeichnet
einzelne Beobachtungen der Merkmalsträer i werden mit x unten i und y unten i bezeichnet
auch hier Punktepaar für jeden einzelnen Merkmalsträger
(x unten i , y unten i) für i = 1,….n
Streudiagramm
visualisiert den Zusammenhang zwischen zwei kardinalskalierten Merkmalen
zuerst Streudiagramm zeichnen
Streudiagramm - Koordinationssystem indem beide Merkmale Achsen bilden
x - Achse wird durch Merkmal X
y - Achse durch Merkmal Y
Punktepaare der einzelnen Personen -werden als Punkte, Kreise, Sternchen eingezeichnet
anhand Anordnung der Punkte in Gesamtheit lässt sich erkennen ob positiv oder negatier Zusmmenhang
Streudiagramm interpretation
hilfreich beiden Mittelwerte zu berücksichtigen
x oben Strich senkrecht
y oben Strich horizontal in Diagramm eintragen
es entstehen 4 Quadranten im Skript S. 85
4 Quadranten
die Merkmalsträger die hohen Wert annehmen
differenzen zum Mittelwert sind positiv
die Merkmalsträger enthalten die bzgl. X unter dem Durchschnitt
und Y über dem Durchschnitt liegen
differenzen zum Mittelwert sind negativ
für Y ergeben sich posiitve Differenzen
liegen unter dem Durchschnitt
überdurchschnittlich hoher Wert bezüglich X
bezüglih Y unterdurchschnittlich hohen Wert
für Merkmal X also positive differenzen zum Mittelwert
für Y negative Differenzen
Korrelationskoeffizient von Bravais - Person
r unten x,y
erfordert von beiden Merkmalen ein kardinales Skalenniveau
anställe von Rängen (beim Rangkorrelationskoeffizienten von Spearman) werden Merkmalsausrpägungen genutzt
Zähler bezeichnet man als Kovarianz
Kovarianz
misst Zusammenhang zwischen zwei kardinalskalierten Variablen
ist nicht normiert auf einen bestimmten Bereich
Kovarianz entscheidet über das Vorzeichen von r unten x,y
sind meissten Beobahtungen in 1 und 3 Quadranten - wird Kovarianz r unten x,y positiv
ist größter teil der Beobachtungen in 2 und 4 dann negative Kovarianz
genau wie r unten S kann r x,y Werte zwischen -1 und +1 annehmen
wenn Koeffizient positiv - besteht positiv linearer Zusammenhang zwischen beiden Merkmalen X und Y
Wenn das eine Merkmal große Werte annimmt tut es das andere auch
negativer Wert für r x,y falls ein negativer linearer Zusammenhang zwischen beiden Variablen
beide Variablen verhalten sich entgegengesetzt zueinander
r x,y = 1 wäre perfekter , postiv linearer Zusammenhang
alle Punkte lassen sich dann auf eine gerade verbinden im Streudiagramm
r x,y = - 1 perfekter negativ linearer Zusammenhang (alle punkte lassen sich wieder verbinden nur in anderer Richtung)
r x,y = 0 kein linearer Zusammenhang
also unkorreliert
kann aber zb quadratischer oder exponentieller zusammenhang sein
punkte lassen sich verbindne aber nicht linear
3.4 Zusammenhangsmaßzahlen bei verschiedenen Skalenniveaus
zwei Merkmale mit verschiedenen Skalenniveaus
zb Geschlecht (Nominalskala) und Einkommen (Kardinalskala) schauen ob Abhängigkeit besteht
schauen welches das schwächere von beiden ist
hier zb Nominalskala
dann Analysemethode wählen die man für zwei schwächere Skalenniveaus nehmen würde
hier der korrigierte Kontingenzkoeffizient K*
Tabelle im Skirpt s 95
Probleme bei Interpretation von Korrelationen
Korrelationen sind symmetrischer natur
X und Y oder A und B sind gleichberechtigt
wir können am Ergebnis einer Zusammenhangszahl nicht ablesen das eine Variable die andere beeinflusst und nicht umgekehrt
oft Schlussfolgerung aus hohen Korrelationen das beide Varianten voneinander abhängen
oft Scheinkorrelationen - 3 te Variable ist oft für hohe Korrelation verantwortlich
Nonsenskorrelation
hohe Korrelation mit zwei Sachfremden Variablen sollte man keine Beachtung schenken
besonders bei beiden Korrelationskoeffizienten nach Spearman und Bravais Pearson -
KOrrelation in Höhe 0 steht dafür, das kein monotoner bzw linearer Zusammenhang besteht
kann aber ein anders gearteter Zusammenhang bestehen
also nie pauschal sagen dass kein Zusammenhang besteht
Zuletzt geändertvor einem Jahr