Wiederholung Linerare Regression
Ordinary least sqaures estimation
Wie interpretieren wir die Regressionskonstante und den Regressionskoeffizienten?
Können wir kategoriale Variablen in ein lineares
Regressionsmodell aufnehmen?
Ja, indem wir sie als sogenannte Dummy-Variable kodieren.
• Dummy-Variablen haben stets die Werte 0 ("Referenz") und 1
Der Effekt der Bildungsjahre auf die durchschnittliche Arbeitszeit
Was ist multiple Regression?
= (lineare) Regression mit zwei oder mehr Prädiktoren (X-Variablen)
Wie werden Koeffizienten der multiplen Regression berechnet?
• Der Effekt/Koeffizient βk einer unabhängigen Variablen (z.B. Xk) wird unter "Kontrolle" aller anderen unabhängigen Variablen geschätzt
Übung
Lösungen
• Interpretation der Konstante _cons: Die Referenzgruppe; für diejenigen für die female UND educ_years = 0 unser Modell schätzt für Männer mit 0 Jahren
Bildung im Mittel 38.70 Arbeitstunden pro Woche
• Interpretation des Koeffizienten female: Wenn man die Bildungsjahre konstant hält, arbeiten Frauen im Schnitt rund 5.86 Stunden pro Woche weniger als Männer
• Interpretation des Koeffizienten educ_years: Wenn man das Geschlecht konstant hält (also nur Männer und Frauen mit jeweils anderen Männern und Frauen vergleicht) erhöht jedes Jahr Bildung die durchschnittliche Arbeitszeit um rund 0.135 Stunden
Adjusted R Squared
• R2 wird immer größer werden je mehr Variablen wir in unser Modell einrechnen
• Das ist auch der Fall, wenn unsere Variablen nichts mit der abhängigen Variable zu tun haben
• Adjusted R2 rechnet das ein
• Dadurch ist es in der Regel kleiner als R2
3,55%
Übung#
R Squred: 20.91 der Gesamtvarianz können nach Variable happy erlärt werden = Wie viel Schwankungen von happy kamn diese 4 Varoablen erklärem?
Unten Konstante: Wnen man alle Variabken auf 0 bringt, erwartet man eiuneh Wert vin 2.923 auf der happy Skala
Wenn andere Werte konstant bkieben, steigt der Wert um ANgabe
Standartisierte OLS, Regression
Option STATA. beta
• Interpretation:
Wenn das Alter um eine Standard- abweichung steigt sinkt die Zeit im Internet im Mittel um 0.45 Standardabweichungen von internet_time
Wie stark sind die Effekte wirklich?
• Standardisieren für Effektstärken in Standardabweichungen auszudrücken
Wie werden Koeffizienten in der multiplen Regression interpretiert?
Vergleich der Koeffizienten der gleichen Variablen in einer einfachen (bivariaten) und einer multiplen Regression:
• Effektgrößen können zu- oder abnehmen
• Vorzeichen können sich ändern