-Wir können sicher nicht einfach die Variable mit den beiden Kategorien (West, Ost) in der Regression verwenden: Jede Einheit mehr Wohnregion ändert das Einkommen um 𝛽!1 Einheiten macht keinen Sinn!
-Ohnehin bedeutet die Codierung für die Wohnregion nichts anderes, als einen Unterschied anzuzeigen (es handelt sich um eine nominale Variable)
-WICHTIG: Kategoriale (nominal-, ordinalskalierte) Variablen können mit Hilfe einer sogenannte Dummy-Kodierung als unabhängige Variablen in Regressionsmodellen verwendet werden
-Eine Dummy-Variable nimmt den Wert 1 an, wenn eine bestimmte Eigenschaft vorliegt, sonst den Wert
-Beispiel der Wohnregion East
-Wenn man Bildung konstant hält, beträgt der Unterschied im erwarteten Einkommen zwischen Ost- und Westdeutschen -340 €
-Jedes Bildungsjahr erhöht das erwartete Einkommen um 106 €, unter Konstanthaltung der Wohnregion.
-In der Regel wie oben: k-1 Dummy-Variablen
-Unter der Annahme, dass das zugrundeliegende Merkmal metrisch ist und hinreichend viele Kategorien gegeben sind, ist eine "pseudo-metrische" Verwendung von ordinalen Variablen möglich
-Die Annahme, dass eine ordinale Variable pseudo-metrisch ist, muss begründet werden! (Stata rechnet alles....)
Last changed18 days ago