Korrelation
Grundidee
Darstellung des Zusammenhangs zwischen zwei Variablen
Scatterplot
was ist das
Problem
=> Streudiagramm / Punktdiagramm
Graphische Zusammenfassung der Beziehung zwischen zwei Variablen
bei vielen Fällen / schwachen Zusammenhang unübersichtlich
Interpretation subjektiv, relativ ungenau
Das ist ein
Korrelationskoeffizienz (r)
Numerische Zusammenfassung der Beziehung zweier Variablen
Idee: Zusammenhang zwischen X mit Y -> wenn X vom MW abweicht, so weicht auch Y vom MW ab
Häufig: Pearson Korrelationskoeffizient (r)
linear Zusammenhang zweier Variablen
Mögliche Werte von -1 bis 1
Wie wahrscheinlich ist die errechnete Korrelation, wenn die wahre Korrelation in der Population 0 wäre
Interpretation von r
gering: r < 0.2, mittel: 0.2 < r 0.4, stark: r > 0.4
Determinationskoeffizient R²
Quadrieren von r ergibt R²
Prozentualer Anteil der Varianz einer Variable, den sie mit einer anderen Variable teilt
Bsp: r = 0.2 -> R² = 4%
Fallen bei der Intepretation von Korrelation
Unterschiedliche Korrelationskoefffizienten
Partielle und Semipartielle Korrelation
Korrelation vs Regression
Unterschiede zwischen Korrelation und Regression
einfache Regression (bivariat)
Gleichung
Interpretation der Regressionskoeffizienten
bo
b1
Standardisierte Regression
Goodness of fit
Wie gut passt die Regressionsgerade zu den Daten
Beurteilung durch R²
Anteil der Varianz der AV, der durch die UV erklärt wird
Bereich: 0 ( keine Erklärung) bis 1 (vollständige Erklärung)
Interpretiertbar als Prozentsatz der erklärten Varianz
Wurzel aus R² ergibt R => bei bivariater Regression R = r x,y
Inferernzstatistiken bei bivariater Regression
Mögliche Verzerrung durch Ausreißer
welche 4 Reaktionen bei Vorliegen von Ausreißern
Prüfen ob Eingabehler
Robuste statistische Verfahren
Berechnung mit und ohne Ausreißer
Löschen? (Gefahr valide Werte zu löschen)
Transparenz über vorlieren und vorgehen ist entscheidend
Multiple Regression
Idee
Vorteil
Graphische Darstellung
Vergleich der Stärken der Regressionskoeffizienten
Erklärung/ Vorhersage der AV durch mehrere UV’s
Gleichzeitige Berücksichtigung mehrerer Prädiktoren
Gegenseitige statistische Kontrolle des Einflusses der UVs
Flexible Anwendungen (z.B. kategoriale UVs, Moderation, Mediation)
Prinzipien der einfachen Regression gelten weiterhin
3 Arten multipler Regression
erkläre
R²
adjusted R²
ΔR²
Inferenzstatistiken bei multipler Regression
Annahmen der linearen Regressionsanalyse
Einschluss aller wichtigen Prädiktoren
Korrekte Spezifikation der Beziehung
Annahme: Lineare Beziehung zwischen UV and AV
Aber:
Möglichkeit der Abbildung nicht-linear Beziehungen in Regressionsanalyse
Homoskedastizität
Konstante Varianzen der Residuen bei allen Werten der UV
Heteroskedazität => Varianz verändert sich mit UV
Folge: Steigert die Standardfehler
Mögliche Lösung: AV transformieren (Log und Wurzel)
Unabhängigkeit der Residuen
Normalverteilung der Residuen
keine exzessive Multikollinearität
Zuletzt geändertvor einem Jahr