o Auf der Grundlage theoretischer Überlegungen wird eine Hypothese abgeleitet
o Anhand der Daten einer Zufallsstichprobe prüfen wir, ob die Hypothese von den Daten unterstützt wird
o → Hypothese wird akzeptiert oder verworfen
o → Hypothesen (Theorien) lassen sich niemals endgültig bestätigen, wir können nur daran scheitern sie zu widerlegen
o Wir geben an, wie sicher wir mit unserer Entscheidung sind
o Beispielfrage: Profitieren Männer stärker von Bildung als Frauen?
-Vermutung: Der Effekt von Bildung ist bei Männern größer als bei Frauen (z.B. wegen Erwerbsunterbrechungen, Teilzeit etc. von Frauen)
-Interaktion bedeutet Effektstärken variieren nach dem Einwirken von anderen Variablen
Anderes Beispiel
Mit steigender Arbeitszeit steigt (vermutlich) im Schnitt auch das zu erwartende Einkommen
• Außerdem wissen wir, dass Frauen im Schnitt etwas weniger als Männer verdienen
• Was wenn der Effekt den einezusätzliche Arbeitsstunde auf das Einkommen hat zwischen Männer und Frauen ungleich ist?
→Lohnt sich Arbeit für Männer mehr?
-Zwei separate Regressionsgeraden mit verschiedenen Koeffizienten
-𝛽1 Männer = 124 € > 𝛽1 Frauen = 99 €
-ABER: Können die Koeffizienten überhaupt direkt miteinander verglichen werden?
o Unterschiedliche Fallzahlen?
o Unterschiedliche SE?
o Ist der Unterschied der Effekte signifikant?
o Wie können weitere X-Variablen aufgenommen werden (bei denen keine Unterschiede nach Geschlecht vermutet werden)?
-Klassisches Modell:
o Y = 𝛽0+ 𝛽1X1 + 𝛽2X2 + 𝜀
o Einkommen = 𝛽0 + 𝛽1*Arbeitsstunden + 𝛽2*Geschlecht
-Interaktionsmodell (Gibt Interaktion als das Produkt von X1, X2 und einem neuen Koeffizienten an)
o Y = 𝛽0+ 𝛽1X1 + 𝛽2X2 + 𝛽3X1X2 + 𝜀
o Einkommen = 𝛽0 + 𝛽1*Arbeitsstunden + 𝛽2*Geschlecht +𝛽3*Arbeitsstunden*Geschlecht
==> Polynomregression ist quasi eine Sonderform der Interaktion! (Das Alter würde bspw. mit sich selbst interagieren)
-Interaktion: Der Effekt von X1 hängt von Werten von X2 ab
-Berücksichtigung einer Interaktion in einer gemeinsamen Modellspezifikation
o Verwenden die beiden Hauptterme in der Regression (X1 und X2)
o Füge einen Interaktionsterm hinzu: Das Produkt von X1 und X2 ("multiplikative Interaktion")
==> Nein! Female-Koeffizient gilt nur wenn Bildung auch = 0 ist – unrealistisch nach 3-4 Bildungsjahren: Männer sind damit dann wieder obenauf
==> darum immer: “unter Konstanthaltung!”
-𝛽1 ist die Differenz im mittleren Stundenlohn zwischen Frauen und Männern, wenn Bildung = 0 ist
-Bildung = 0 existiert in der Realität allerdings nicht
==> Daher: Zentriere Bildungsjahre: ceduyrs = eduyrs – mean(eduyrs) und verwende die zentrierte Variable in der Regression
Interpretation der Haupteffekte – Interpretation mit zentrierter X-Variable
o Y = 𝛽0 + 𝛽1female + 𝛽2ceduyrs + 𝛽3female*ceduyrs
o 𝛽0 = 15,46€: Stundenlohn für Männer (female = 0) mit durchschnittlicher Bildung (ceduyrs = 0)
o 𝛽1 = - 2,33€: Lohndifferenz von Frauen zu Männern (female = 1) bei durchschnittlicher Bildung (ceduyrs = 0)
o 𝛽2= 0,81 €: Erhöhung des Stundenlohns pro ein Jahr mehr Bildung als der Durchschnitt, für Männer (female = 0 und daher female*ceduyrs =0)
Interpretation des Interaktionseffekts – Interaktion mit zentrierter X-Variable
-E(Stundenlohn|X) = 𝛽0 + 𝛽1female + 𝛽2ceduyrs + 𝛽3female*ceduyrs
-𝛽2 +𝛽3=0,81-0,20=0,61€: Erhöhung des Stundenlohns pro ein Jahr mehr Bildung als der Durchschnitt, für Frauen
o Haupteffekt geschl: Frauen verdienen im Mittel rund 1013 Euro weniger als Männer (Frau aus Westdeutschland = 2988 – 1013 = 1975)
o Haupteffekt ost: Personen aus Ostdeutschland verdienen im Schnitt rund 699 Euro weniger als Personen aus Westdeutschland (Mann aus Westdeutschland = 2988 / Mann aus Ostdeutschland = 2988 – 699 = 2289)
o Interaktionseffekt 1. Interpretation: Der Effekt des Geschlechts ist in Ostdeutschland um 558 Euro weniger negativ / Interaktionseffekt 2. Interpretation: Der Effekt von in Ostdeutschland zu leben ist für Frauen um 558 Euro weniger negativ (Frau aus Ostdeutschland = 2988 – 1013 - 699 + 558 = 1834)
-Abhängige Variable ist der Lernerfolg; unabhängige Variable: Lernstunden; Interaktion mit Entspannungstechnik und Alkohol
-Unabhängig davon, ob eine Entspannungstechnik zum Einsatz kommt oder nicht oder ob Alkohol konsumiert wird oder nicht: Die Anzahl der Lernstunden wirkt sich positiv auf den Lernerfolg aus.
-Die Stärke dieses Zusammenhangs wird jedoch vom Einsatz einer Entspannungstechnik bzw. von Alkoholkonsum beeinflusst.
o Der Einsatz einer Entspannungstechnik verstärkt die positive Beziehung zwischen Lernstunden und Lernerfolg.
o Mit höherem Alkoholkonsum wird der Zusammenhang von Lernstunden und Lernerfolg jedoch schwächer.
-Zuerst: Mittelwertvergleich mit t-Test
-Einkommen und Geschlecht, abhängig von Wohnregion
-Oft hilfreich für die Interpretation: Berechne gruppenspezifische Erwartungswerte
-Y= 𝛽0+ 𝛽1female + 𝛽2east + 𝛽3female*east + 𝜀
-E(Y|X) = 2540 − 1023 ∙ female − 743 ∙ east + 734 ∙ female*east
-Wenn man einen (Kausal-)Effekt gefunden hat, kann man im nächsten Schritt fragen: Was ist der Mechanismus? = Wie, "auf welchem Weg" (Mediator), kommt der Zusammenhang zustande?
-Vorgehen bei Mediation
-Was wenn mein Modell nur zufällig funktioniert, aber in der Realität sagt es gar nichts aus?
-Hierfür gibt es den F-Test, der genauso funktioniert wie t-Tests und p-Werte
==> F-Tests
o Können auch verwendet werden, um zu prüfen ob Variablen gemeinsam das Modell verbessern
o Hilfreich bei der Bewertung von Interaktionseffekten
o Befehl: test Varlist
Zuletzt geändertvor 16 Tagen