Besteht ein Zusammenhang zwischen Variablen, dann gilt:
dass, wenn eine Variable vom Mittelwert abweicht, die andere ebenfalls von ihrem Mittelwert abweicht (Abweichung in gleiche oder entgegengesetze Richtung)
Was gilt bei der Berechnung des Zusammenhangsmaßes?
Sind beide Abweichungen positiv, ist das Produkt positiv
Ist eine Abweichung positiv und die andere negativ, ist das Produkt negativ
Sind beide Abweichungen negativ, ist das Produkt positiv
Kovarianz
= Gegenüberstellung zweier Variablen einer Untersuchungseinheit, mit diesem Maß
(Begriff der die Beziehung zwischen zwei zufälligen Variablen misst & angibt wie stark zwei Variablen gemeinsam variieren)
-> Die Kovarianz gibt an, wie stark die Abweichungen der einzelnen Beobachtungen von ihren Mittelwerten miteinander korrelieren
-> Bei großer Kovarianz, tendieren die Beobachtungen dazu, gemeinsam zu variieren. Wenn die Kovarianz nah bei Null liegt, gibt es keine starke Beziehung zwischen den beiden Variablen.
Graphische Darstellung der Kovarianz
-> Streudiagramm (scatter plot)
Variablenwerte separat auf der x-Achse & y-Achse aufgetragen
Für alle Untersuchungseinheiten werden, sich ergebenden Kreuzpunkte (x,y) im Graphen aufgetragen
positive Kovarianz
Weicht eine Variabale vom Mittelwert ab, weicht die andere in dieselbe Richtung ab
negative Kovarianz
Weicht eine Variable vom Mittelwert ab, weicht die andere in die entgegengesetze Richtung ab
Was ist der Unterschied zwischen Varianz & Kovarianz
Varianz = Abweichung einelner Werte vom Mittelwert
Kovarianz = Abweichung einzelner Werte zweier Variablen zum jeweiligen Mittelwert
In welchem Fall sind Kovarianzen nicht miteinander vergleichbar?
Wenn zwei Untersuchungen unterschiedlich quntifiziert sind
Quantifizierung = nicht-numerisches/ qualitatives Merkmal, wird in numerischen Wert umgewandelt
Die Kovarianz ist daher ein ungeeignetes Maß, wenn man davon ausgeht, dass zwischen zwei Merkmalen ein „_______“ Zusammenhang unabhängig von der ________________ der Merkmale existiert.
wahrer; Quantifizierung
Korrelationskoeffizient/ Produkt-Moment-Korrelation/ Pearson’s r
= Die Korrelation zweier Variablen entspricht der Kovarianz der z-transformieren Variablen
Was beschreibt der Korrelationskoeffizient (r)?
die enge des linearen Zusammenhangs (durch eine Zahl)
Was ist der Wertebereich des Korrelationskoeffizient? Und was bedeuten diese?
Der Wertebereich von r liegt im Intervall [-1;+1]
r = +1 perfekter positiver (linearer) Zusammenhang
r = -1 perfekter negativer (linearer) Zusammenhang
r = 0 kein (linearer) Zusammenhang
Was bewirkt die Fisher-Z Transformation?
Dass, höhere Korrelationen bei Mittelwertberechnungen stärker gewichtet werden als kleinere Korrelationen
Warum werden Korrelationskoeffizienten nach der Fisher Z-Transformation umgerechnet?
Um mehrere Korrelationskoeffizienten zu mitteln
Zur inferenzstatistischen Absicherung von Stichprobenkorrelation (da Z-Werte approximativ normalverteilt sind)
Kann der Korrelationskoeffizient direkt interpretiert werden?
Nein
Eigenschaften von r
Verhältnisse zwischen Korrelationskoeffizienten (Vgl. r-Werte) sind nicht interpretierbar (nur umgerechnet in Z-Werte)
Zuwachs im oberen Korrelationsbereich. ist bedeutsamer als im unteren
Tatsächliches Mittel mit der Fisher Z-Transformation berechnet (höhere Korrelationen höher gewichtet)
-> nur bei Ni = Nj
Korrelationen dürfen ________ Zusatzinformationen nicht _____________ interpretiert werden
ohne; kausal
Mögliche Interpretationen eines kausalen Zusammenhangs
x beeinflusst y kausal
y beeinflusst x kausal
x & y werden von einer dritte oder weiteren Variable kausal beeinflusst
x & y beeinflussen sich gegenseitig kausal
Was ist eine signifikante Beobachtung?
Eine "signifikante" Beobachtung ist also eine, die nicht einfach auf Zufall oder Stichprobenfehler zurückzuführen ist.
Kausalität bei Korrelation?
r liefert keine Information über die Richtung der Kausalität, wenn überhaupt kann man nur mit Mitteln der Logik einen Kausalnachweis führen
Vorraussetzungen für Pearson’s r
Intervallskalenniveau der Daten einzige Voraussetzung
-> r liefert deskriptives Maß für die Enge des (linearen) Zsh. zwischen zwei Merkmalen
Vorrazssetzungen für Pearson’s r
-> Wenn vom Stichprobenergebnis auf Grundgesamthit geschlossen werden
Muss Stichprobenkennwertverteilung normalverteilt sein
Beide Variablen sollten normalverteilt sein (Ausahme wenn eine von beiden dichotom ist)
Die Variablen müssen einer bivarianten Normalverteilung folgen (beiden Variablen normalverteilt sind und eine bestimmte Kovarianz zwischen ihnen haben.)
Choens’d Effektgröße
kleiner Effekt: qc = 0.10
Mittlerer Effekt: qc = 0.30
großer Effekt: qc= 0.50
Ab wann ist ein Effekt praktisch bedeutsam?
Bei einem Mittelgroßen qc (Effektgröße der Korrelation), der bei qc = 0.30 liegt
Für die Verallgemeinerung einer Korrelation auf eine Grundgesamtheit ist zu fordern, dass:
Eine Stichprobe zufällig ezogen wurde
Keine irgendwie geartete systematische Selektion getroffen wurde
Punktbiserale Korrelation (rpb)
Korrelation eines Intervallskalierten mit einem diskret dichotomen Merkmal
(Rheinfloge der Kodierung ist egal)
Bsp: Männliche Katzen streunen mehr als weibliche
Biserale Korrelation (rb)
Korrelation eines intervallskalierten mit einem kontinuierlich dichotomen Merkmal
Vergleich rpb mit rb
rb setzt Normalverteilung in beiden Merkmalen voraus
(dichotome vor Teilung)
Im Zweifelsfall sollte rpb verwendet werden
-> Zsh zweier normalverteilter Variablen durchrpb unterschätz
Last changeda year ago