Nenne Arten von Regression und die Ausprägung der Variablen
Lineare Regression: UV kategorial/metrisch, AV metrisch
Logistische Regression: UV kategorial/metrisch, AV kategorial
Poisson Regression: UV kategorial/metrisch AV diskrete Häufigkeiten
Gamma Regression: UV kategorial/metrisch AV positiv, kontinuierlich
Welche Fragestellungen können Regressionsanalysen einnehmen?
Ursachenanalyse: Wie stark ist der Einfluss der UV auf die AV?
Wirkungsprognose: Wie verändert sich die AV bei einer Änderung der UV?
Welche Voraussetzungen müssen erfüllt sein?
Variableneigenschaften
Linearität
Homoskedastizität & Normalverteilung des Fehlers
Keine Autokorrelation
Keine Multikollinearität
Welche Variableneigenschaften müssen erfüllt sein?
AV = metrisch (Intervall- / Verhältnisskalen-niveau)
UV = metrisch oder kategorial (Nominal- / Odinalskalenniveau)
Was muss bei der Linearität beachtet werden?
Zusammenhang zwischen UV & AV muss linear verlaufen.
Bei multipler Regressionsanalyse nicht mehr in Koordinatensystem darstellbar. Linearität muss im Vorhinein theoretisch gut begründet werden.
Liegt keine Linearität vor, muss andere Analyse durchgeführt werden oder dies bei Interpretation berücksichtigt werden.
Was sind Hetero- und Homoskedastizität? Worauf muss dabei geachtet werden?
Beschreibt Ungleichheit / Gleichheit der Varianzen der Residuen. Sollten homogen sein. Bei Verletzung werden Schätzungen der Regression ungenau.
Überprüft Beziehung zwischen vorhergesagten Werten & standardisierten Residuen in einem Streudiagramm. Punkte sollten ausgeglichener Punktewolke folgen & zwischen -3.3 und +3.3 liegen.
Was beschreibt die Autokorrelation und warum sollte sie nicht vorliegen?
Korrelation der Residuen miteinander. Sollte nicht vorhanden sein, da die Residuen sonst eine Korrelation zueinander haben & Ergebnis verfälschen.
Mit Durbin-Watson-Statistik analysierbar. Kann Werte zwischen 0 und 4 annehmen. Werte zwischen 1.5 und 2.5 sprechen für das Nicht-Vorliegen einer Autokorrelation. Niedrige Werte = pos. Korrelation
Was beschreibt die Multikollinearität und warum sollte sie nicht vorliegen?
Zu hohe Korrelaltion beteiligter UVs. Bei Vorliegen kann die Gesamtanalyse signifikant werden, jedoch einzelne Regressionskoeffizienten nicht. Zu hohe Korrelationen müssen berücksichtigt werden & ggf. einzelne Prädiktoren eliminiert werden.
Toleranzwerte für einzelne Prädiktoren sollen über 0.25 liegen
Welche zwei Methoden werden als Hauptunterschied zur linearen Regression benutzt?
Einschluss: Alle ausgewählten UVs werden in das Modell mit aufgenommen.
Schrittweise: Kombi aus Vorwärts und Rückwärts. Bereits eingeschlossene Variablen können wieder eliminiert werden, wenn durch die Aufnahme anderer Variablen ihr Einfluss nicht mehr signifikant wird.
Was sieht man in der Tabelle der Korrelationen:
Alle UV korrelieren mit der AV
Beteiligte UVs (bis auf Anfangsgehalt und Ausbildung in Jahren) weisen niedrige Korrelationen auf. Erster Hinweis dass Voraussetzung der Nicht-Multikollinearität nicht verletzt ist.
Was sieht man in der Tabelle der Modellzusammenfassung:
R beschreibt den multiplen Korrelationskoeffizienten gebildet aus Korrelationen der UVs mit der AV.
Die Spalte R² und Korrigiertes R² beschreiben die Varianzaufklärungdurch die UVs an der AV. Korrigiertes R² berücksichtigt die vorliegende Stichprobengröße & Anzahl der Prädiktoren
Werte ab R² = .01 gelten als kleine, R² = .09 als mittlere und R² .25 als große Effekte
Was sieht man in der Tabelle der ANOVA:
Die Tabelle zeigt nochmal das Gesamtergebnis der drei Regressionsanalysen. Unter der TAbelle sind die jeweils berücksichtigten Prädiktoren der Modelle aufgeführt.
Alle drei Modelle weisen ein signifikantes Ergebnis auf. Das dritte Modell erreicht die größte Varianzaufklärung mit 55.7 %. Auch das korrigierte R² ist in Modell 3 am höchsten
F(3, 358) = 149.90, p < .01
Was sieht man in der Tabelle der Koeffizienten:
Stellt einzelne Prädiktoren der verschiedenen Modelle mit ihren nicht standardisierten & standardisierten Regressionsgewichten sowie einer jeweiligen Signifikanzprüfung (t-Test) dar
Wie prüft man die Regressionsanalyse auf Heteroskedastizität?
Betrachtung der Diagramme. Normalverteiltes Histogramm
Streudiagramm sollte keinem Muster sondern einer ausgeglichenen Punktewolke folgen & zwischen -3.3 und +3.3 liegen.
Last changed2 years ago