Regression mit Dummy
Regression mit kategorialen unabhängigen Variablen
Kategorialer Prädikator mit mehr als 2 Kategorien (k > 2)
Dummy-Kodierung der kategorischen Variable (k-1 Dummies)
beide Dummies als Prädiktoren in die Regression nehmen
Interpretation der Regressionskoeffizienten:
b von D1: Mittelwertunterschied AV zw. D1 und Referenzkategorie
b von D2: Mittelwertunterschied AV zw. D2 und Referenzkategorie
Beispiel von Moderation am Beispiel Sonnenbaden
Moderation
konzeptionell vs statistisch
Moderierte Regression
Durchführung einer Moderationsanalyse
UV und Moderator zentrieren oder standardisieren
UV und Moderater multiplizieren => Interaktionsterm
Berechnung einer hierarchischen multiplen Regression
evtl Kontrollvariablen
UV und Moderater (Haupteffekte)
Interaktionsterm (Interaktionseffekt)
Signifikanten Interaktionsseffekt graphisch darstellen => Passung mit Hypothese erklären
Zentrale Sifnifikanztests
Effektstärke der Moderation
Bedenken
Zentrale Signifikanztests
Haupteffekte: Koeffizienten Schritt 2
Moderation: Koeffizient des Interaktionsterms (Schritt 3)
ΔR² in Schritt 3 (zusätzlich durch Interaktionsterm erklärte Varianz)
Interaktionen sind statistisch schwierig zu finden -> auch relativ kleine Werte für ΔR² sind u.U. bedeutsam
Vorsicht bei Interpretation der Haupteffekte
Schritt 2: Statistisch als Haupteffekte interpretiertbar, aber auch konzeptionell sinnvoll?
Schritt 3: simple effects (keine Haupteffekte) -> Effekt der UV bei Moderatorwert 0 (und umgekehrt)
Interaktionseffekt evtl auch ohne sig. Haupteffekte signifikant
Kurvilineare Regression
Kurvilineare Zusammenhänge
Durchführung
UV zentrieren
UV quadrieren -> kurvilinearer Term
Kontrollvariablen
UV (Haupteffekt)
Quadrierter Term (Kurvilinearer Effekt)
Signifikanten kurvilinearen Effekt graphisch darstellen -> Passung mit Hypothese klären
Effektstärke des kurvilinearen Effekts
HE: Koeffizient Schritt 2
NE: Koeffizient des quadrierten Terms (Schritt 3(
ΔR² in Schritt 3 (zusätzlich durch quadrierten Term erklärte Varianz
komplexere kurvilineare Zusammenhänge durch Hinzufügen weiterer Terme testbar (kubisch, X³) -> in der Praxis selten
Unterschied Moderation und Mediation
beeinflusst Beziehung zwischen UV und AV (Sonnenbaden und Sonnenbrand mit/ohne Sonnenmilch
Mediation
wird von UV beinflusst und beinflusst die AV (Zeitdruck -> Stressempfinden -> Krankheit
Statistische Berechnung der Mediation
klassisches Vorgehen (Baron & Kenny)
Kritik am klassischen Vorgehen
Sobel Test
Bootstrapping
weitere Formen der Regressionsanalyse
Logistische Regression
Multinomiale Regression
Count Regression
vorhersage / Erklärung einer dichotomen AV
Vorhersage der Wskt “zu einer Gruppe gehören” (1) oder nicht (0)
Verletzt zentrale Annahmen der “normalen” OLS Regression
Bsp:
Inwieweit hängt das Überleben eines Start Ups von der Erfahrung der Gründer ab
AV Überleben ja vs nein
bei kategorialer AV mit mehr als 2 Kategorien
bei Count Daten als AV -> Häufigkeiten
Bsp: Anzahl von Unfällen in Unternehmen
0 als absoluter Nullpunkt; ganzzahlig (0,1,2,3,…)
Null taucht meist übermäßig häufig auf (rechtsschief)
Konkrete Modelle
Poisson Regression
Negativ binomiale Regression
Zuletzt geändertvor einem Jahr