Buffl

3. AUSWERTUNGSMETHODEN ZWEIDIMENSIONALER DATEN

JE
by Johannes E.

Berechnung des korrigierten Kontingenzkoeffizienten




3.1 Kontingenzanalyse

3. AUSWERTUNGSMETHODEN ZWEIDIMENSIONALER DATEN

Der korrigierte Kontin-  genzkoeffizient quantifi-  ziert den Zusammenhang  zwischen zwei Merkma-  len, von denen mindes-  tens eins nominalskaliert  ist


Schritt 1 – Berechnung der erwarteten Häufigkeiten 

  • erwarteten Häufigkeiten bzw. die absoluten  Häufigkeiten unter deskriptiver Unabhängigkeit bestimmt.

    • sind diejenigen absoluten  Häufigkeiten, für die die beiden Merkmale in keinerlei Zusammenhang stehen.

    • Es würde  bedeuten, dass der Anteil an Raucherinnen unter den Frauen exakt dem Anteil der Rau-  cher unter den Männern entspräche. Die erwartete Häufigkeit für die Merkmalsausprägun-  gen Ai und Bj wird mit nij bezeichnet und durch 


 



 

wie weit die tatsächlichen absoluten Häufigkeiten  von den erwarteten entfernt sind

 

Je weiter also die tatsächlichen von den erwarteten  Häufigkeiten entfernt sind, desto stärker muss der Zusammenhang in der vorliegenden  Situation sein.

 

Entfernung

 

wird also die erwartete  Häufigkeit von der absoluten abgezogen.

 

Differenz wird quadriert, da einige  Abstände negativ und andere positiv sein können, wodurch sie sich gegenseitig zu einer 0  aufheben könnten. Schließlich wird nochmals durch die erwartete Häufigkeit geteilt, um  die Relation der Abstände deutlich zu machen.

 

Falls χ2 = 0, so besteht deskrip-  tive Unabhängigkeit zwischen den beiden Merkmalen, da alle absoluten Häufigkeiten  gleich ihren erwarteten Häufigkeiten sind.

 

kann zwischen Null und Unendlich liegen

 

vorliegenden Beispiel wäre es demnach egal, ob man zum weiblichen oder männlichen  Geschlecht gehört. Die Tendenz, zu rauchen oder auch nicht, wäre bei beiden Geschlech-  tern identisch. Je größer χ2 ist, desto größer ist die Abhängigkeit, wobei keine Einschät-  zung vorgenommen werden kann, ab welchem Wert eine starke oder sehr starke Abhän-  gigkeit besteht. 

 

sicherlich keinen außerordentlich hohen Wert vor. 

 

Schritt 3 – Berechnung des Kontingenzkoeffizienten 

 

Interpretieren werden wir dieses Ergebnis jedoch noch nicht; es erfolgt noch ein  letzter Rechenschritt. 

 

Schritt 4 – Berechnung des korrigierten Kontingenzkoeffizienten

 

Zur Erläuterung: Begonnen wird mit der Anzahl an Zeilen (2) und Spalten (2) der  Kontingenztabelle. Stehen diese beiden Zahlen in den geschwungenen Klam-  mern, wählt man die kleinere Zahl von beiden. Da wir es hier zwei Mal mit der  gleichen Zahl zu tun haben, ist die Entscheidung trivial. Hätten wir aber bspw.  beim Rauchverhalten noch die Gelegenheitsraucher:innen berücksichtigt, so  bestünde die Kontingenztabelle aus drei Spalten. Man würde demnach die klei-  nere Zahl aus 2 und 3 wählen und damit auch die 2 berücksichtigen. Ist die 2  ausgewählt, so setzt man sie anstelle von M in die Formel für Kmax ein.  Dadurch erhält man die obige 0,707, welche schließlich genutzt wird, um den  Kontingenzkoeffizienten aus dem dritten Schritt in Höhe von 0,222 durch diese  0,707 zu teilen. 

 

Wert 0 an, wenn deskriptive Unabhängigkeit besteht; die beiden Merkmale demnach in  keinerlei Zusammenhang stehen. Je höher der Wert für K*, desto stärker ist der Zusam-  menhang. Im Speziellen gilt folgende Einteilung für die Interpretation:  • 0 ≤ K* ≤ 0,2: kein Zusammenhang / keine Abhängigkeit,  • 0,2 < K* ≤ 0,4: schwacher Zusammenhang / schwache Abhängigkeit, 

 

• 0,4 < K* ≤ 0,6: mittlerer Zusammenhang / mittlere Abhängigkeit,  • 0,6 < K* ≤ 0,8: starker Zusammenhang / starke Abhängigkeit,  • 0,8 < K* ≤ 1: sehr starker Zusammenhang / sehr starke Abhängigkeit. 

Author

Johannes E.

Information

Last changed