Einführung
3. AUSWERTUNGSMETHODEN ZWEIDIMENSIONALER DATEN
zwei Merkmale
möglichen Zusammenhang aufzudecken, dann bedienen wir uns der bivariaten Analyse. Man spricht auch davon, dass zweidimensionale Daten ausgewertet werden
entscheidender Bedeutung, welches Skalenniveau
zwei nominalskalierte Merkmale,
zwei ordinalskalierte Merkmale
zwei kardinalskalierte Merkmale und
zwei verschieden skalierte Merkmale.
3.1 Kontingenzanalyse
zwei nominalskalierter Merkmale.
Ziel: herauszufinden, ob ein Zusammenhang zwischen diesen beiden Merkmalen existiert.
zu untersuchenden Merkmale mit Aund Bbezeichnet. Diese beiden Merkmale können verschiedene Merkmalsausprägungen annehmen. Die Ausprägungen des Merkmals Awerden mit A1, A2, …, AI i = 1, …, I und die des Merkmals Bmit B1, B2, …, BJ j = 1, …, J gekennzeichnet. Das Merkmal Ahat demnach Iverschiedene und das Merkmal Bhat Jverschiedene Merkmalsausprägungen. Iund Jkönnen, müssen aber nicht identisch sein.
ni = Summe der absoluten Häufigkeiten der Zeile
nj = Summe der absoluten Häufigkeiten der Spalte
n = Gesamtanzahl der Involvierten Personen
Sowohl Merkmal Aals auch Merkmal Bbesitzen I = 2bzw. J = 2Merkmalsausprägungen. In welcher Reihenfolge man die Ausprägungen (erst weiblich und dann männlich oder umgekehrt) anordnet, ist unwichtig.
Das Ziel der bivariaten Analyse ist, die beiden Merkmale gemeinsam zu betrachten. Bei gemeinsamer Betrachtung ergeben sich I · J verschiedene Merkmalsausprägungen
Die Kontingenztabelle für absolute Häufigkeiten bil- det das Pendant zur Häu- figkeitstabelle im univa- riaten Fall
Berechnung des korrigierten Kontingenzkoeffizienten
Der korrigierte Kontin- genzkoeffizient quantifi- ziert den Zusammenhang zwischen zwei Merkma- len, von denen mindes- tens eins nominalskaliert ist
Schritt 1 – Berechnung der erwarteten Häufigkeiten
Schritt 2 – Berechnung der Abstände zwischen den absoluten und erwarteten Häufig- keiten
Schritt 3 – Berechnung des Kontingenzkoeffizienten
Schritt 4 – Berechnung des korrigierten Kontingenzkoeffizienten
Schritt 1
erwarteten Häufigkeiten bzw. die absoluten Häufigkeiten unter deskriptiver Unabhängigkeit bestimmt.
sind diejenigen absoluten Häufigkeiten, für die die beiden Merkmale in keinerlei Zusammenhang stehen.
Es würde bedeuten, dass der Anteil an Raucherinnen unter den Frauen exakt dem Anteil der Rau- cher unter den Männern entspräche. Die erwartete Häufigkeit für die Merkmalsausprägun- gen Ai und Bj wird mit nij bezeichnet und durch
Um zu zeigen, dass die beiden Merkmale in irgendeiner Form abhängig voneinander sind, muss für mindestens ein Paar Ai, Bj nij ≠ nij gelten.
Schritt 2
Schritt 2 – Berechnung der Abstände zwischen den absoluten und erwarteten Häufigkeiten
wie weit die tatsächlichen absoluten Häufigkeiten von den erwarteten entfernt sind
Je weiter also die tatsächlichen von den erwarteten Häufigkeiten entfernt sind, desto stärker muss der Zusammenhang in der vorliegenden Situation sein.
Entfernung
wird also die erwartete Häufigkeit von der absoluten abgezogen.
Differenz wird quadriert, da einige Abstände negativ und andere positiv sein können, wodurch sie sich gegenseitig zu einer 0 aufheben könnten. Schließlich wird nochmals durch die erwartete Häufigkeit geteilt, um die Relation der Abstände deutlich zu machen.
Besteht die Kontingenztabelle aus zwei Zeilen und zwei Spalten (beide Merkmale haben jeweils zwei Ausprägungen), so lässt sich χ2durch
kann zwischen Null und Unendlich liegen
Falls χ2 = 0, so besteht deskrip- tive Unabhängigkeit zwischen den beiden Merkmalen, da alle absoluten Häufigkeiten gleich ihren erwarteten Häufigkeiten sind.
Je größer χ2 ist, desto größer ist die Abhängigkeit, wobei keine Einschät- zung vorgenommen werden kann, ab welchem Wert eine starke oder sehr starke Abhän- gigkeit besteht.
Schritt 3
Interpretieren werden wir dieses Ergebnis jedoch noch nicht; es erfolgt noch ein letzter Rechenschritt.
Schritt 4 + Interpretation
Interpretation
• 0,4 < K* ≤ 0,6: mittlerer Zusammenhang / mittlere Abhängigkeit, • 0,6 < K* ≤ 0,8: starker Zusammenhang / starke Abhängigkeit, • 0,8 < K* ≤ 1: sehr starker Zusammenhang / sehr starke Abhängigkeit.
vorliegenden Beispiel wäre es demnach egal, ob man zum weiblichen oder männlichen Geschlecht gehört. Die Tendenz, zu rauchen oder auch nicht, wäre bei beiden Geschlech- tern identisch. Je größer χ2 ist, desto größer ist die Abhängigkeit, wobei keine Einschät- zung vorgenommen werden kann, ab welchem Wert eine starke oder sehr starke Abhän- gigkeit besteht.
sicherlich keinen außerordentlich hohen Wert vor.
Zur Erläuterung: Begonnen wird mit der Anzahl an Zeilen (2) und Spalten (2) der Kontingenztabelle. Stehen diese beiden Zahlen in den geschwungenen Klam- mern, wählt man die kleinere Zahl von beiden. Da wir es hier zwei Mal mit der gleichen Zahl zu tun haben, ist die Entscheidung trivial. Hätten wir aber bspw. beim Rauchverhalten noch die Gelegenheitsraucher:innen berücksichtigt, so bestünde die Kontingenztabelle aus drei Spalten. Man würde demnach die klei- nere Zahl aus 2 und 3 wählen und damit auch die 2 berücksichtigen. Ist die 2 ausgewählt, so setzt man sie anstelle von M in die Formel für Kmax ein. Dadurch erhält man die obige 0,707, welche schließlich genutzt wird, um den Kontingenzkoeffizienten aus dem dritten Schritt in Höhe von 0,222 durch diese 0,707 zu teilen.
Wert 0 an, wenn deskriptive Unabhängigkeit besteht; die beiden Merkmale demnach in keinerlei Zusammenhang stehen. Je höher der Wert für K*, desto stärker ist der Zusam- menhang. Im Speziellen gilt folgende Einteilung für die Interpretation: • 0 ≤ K* ≤ 0,2: kein Zusammenhang / keine Abhängigkeit, • 0,2 < K* ≤ 0,4: schwacher Zusammenhang / schwache Abhängigkeit,
Last changed3 minutes ago