Was macht die Regressionsanalyse und welche arten gibt es?
Versucht die Beziehung zwischen abhängigen und unabhängigen Variablen
Bivariate
eine abhänige und unabhänige variable
multiple
eine abhänige und mehrere unabhängige Variablen
multivaraite
mehre abhänige und unabhängige Variablen
Aus welchem Grund werden bivariate Regressionen selten angewendet?
Monokausale Phänomene sind selten und auslassen von wichtigen Variablen kann zu irreführende Ergebnisse führen
Worin unterscheidet sich die Regression von der Korrelation?
Beide geben grundsätzlich die Beschaffenheit des Zusammenhanges an (Positiv oder Negativ)
Beide geben die Stärke der Beschaffenheit an
Die Regressions quantfiziert die Beschaffenheit des Zusammenhanges sowie die Richtung eines Zusammenhanges
Wann wird die Regerssion angewnedet?
Ursachenanalyse
Einfluss von X auf Y
Wirkungsanalyse
Wie verändert sich Y bei einer Veränderung von X
Zeitreihenanalyse
Wie verändert sich Y im Zeitverlauf
Testkonstruktion
Modellierung zur Überprüfung von Hypothesen
Was sind die Annahmen einer Regressionsanalyse?
Lineare Beziehung zwischen REgressand und Regressor
Residuen haben Erwartungswert = 0
Residuen und Y sind Nomalvertielt
Unabhängigkeit der Residuen von Regressor
Konstante Varianz der Residuen
Keine bzw. geringe Kollininearität
Welche Skalenniveaus sollte eine Regressiosnanalyse haben?
Grundsätzlich sollten es metrische Daten sein
Wenn Zielgröße ordnial skailiert ist -> Rangregression
Wenn Zielgröße nominal skaliert ist -> Logit und Probit Analyse
Wie ist zu handeln, wenn die Annahmen der linearen Regression verletzt werden?
Durch Plots und Test prüfen
OLS kann zu Schätzfehlern führen
Komplexere Regressionsmodelle anwenden
Wie ist der Output einer Regression zu interpretieren?
Grundsätzlich hängt es von der Skalierung ab, die einfachste Variante ist jedoch eine veränderung von einheit X würde Y um so und so Einheiten verringern
Intercepts
Vorsichtig zu interpretieren
Kann als Durchschnittswert wert interpretiert werden, wenn alle anderen Einflüsse abwesend sind
Kann aber auch ein theoretischer Wert sein
Was sagt das RQuadrat aus und welches Problem hat es?
Es gibt den prozentualen Anteil Wert der Varianz wieder, welcher durch die unabhänige Variable erklärbar ist. Sie sagt aus, wie gut sich die Regressionsfunktion an die emp. Punktverteilung anpasst.
Problem
Der Wert steigt wenn zusätzliche unabhängige Variablen in das Modell aufgenommen wird
Wie kann das Problem des RQuadrats behoben werden?
Division durch die Freiheitsgrade
Zuletzt geändertvor einem Jahr