-Eine Regression mit zwei oder mehreren Prädiktor-Variablen (X-Variablen)
-Angenommen, Sie möchten den Einfluss mehrerer unabhängiger Variablen auf das Berufsprestige untersuchen
o Berufsprestige = f(soziale Herkunft, Bildung)
o Vermutung 1: Die soziale Herkunft hat einen positiven Einfluss auf das Berufsprestige
o Vermutung 2: Bildung hat einen positiven Einfluss auf das Berufsprestig
-Wie stark ist der Einfluss von sozialer Herkunft auf den Beruf, unabhängig von der eigenen Bildung?
==>Wir halten Bildung konstant und betrachten den Beruf abhängig von sozialen Herkunft der Befragten
==>Oder umgekehert: Wie stark ist der Einfluss von Bildung, unabhängig von der sozialen Herkunft? (ohne Abb.)
-Der Effekt/Koeffizient 𝛽k einer unabhängigen Variablen (z.B. Xk) wird unter ”Kontrolle“ aller anderen unabhängigen Variablen geschätzt.
-Was heißt das? Mögliche Interpretationen:
o Wie ändert sich der bedingte Erwartungswert von Y, wenn Xk um eine Einheit zunimmt, wenn alle anderen Variablen im Modell aber gleich bleiben ? (= "ceteris paribus") ==> E(Y|X1; X2=x)
o Welchen Effekt hat Xk auf Y, unabhängig von den anderen Variablen?
-Bsp. Berufsprestige = f(soziale Herkunft, Bildung)
o Es besagt, welcher Anteil der Varianz von Y durch alle Regressoren zusammen erklärt wird
o Fügt man einen weiteren Regressor hinzu, so ist das Bestimmtheitsmaß des erweiterten Modells mindestens genauso groß wie zuvor
o Ist allerdings die Erklärungskraft der hinzugefügten Variable, gegeben die bereits im Modell enthaltenen Variablen, gering, so wird sich R2 nur minimal erhöhen
o Das Hinzufügen weiterer Variablen verbessert das Modell somit nur, wenn diese Variablen einen eigenständigen Erklärungsbeitrag leisten
==> Jede zusätzliche X-Variable erhöht R2
o je mehr Variablen desto höher die Erklärungskraft
o Verbesserung aber möglicherweise zufällig - man findet Evidenz, dass alles die Varianz von allem erklären kann - auch wenn kein logischer Zusammengang besteht
-adj. R2 nutze ich beim Vergleich eines Modells mit anderen Modellen - ist besser vergleichbar
-Der Vergleich der Größe der Koeffizienten ist wegen unterschiedlicher Größenordnungen (Skalierung) der X-Variablen nicht möglich
o Lösung: Standardisiere Y und X und berechne diese Regressionsgleichung ==> beta-Koeffizient
o 1. Wie ist der Einfluss der unabhängigen Variablen beschaffen: positiv oder negativ, um wie viele Einheiten ändert sich die abhängige Variable bei Änderung der unabhängigen Variable um eine Einheit → Interpretation der Koeffizienten
o 2. Welche unabhängigen Variablen haben einen signifikanten Einfluss auf die abhängige Variable? → t-Test der Koeffizienten
o 3. Ist der F-Test signifikant? → Auskunft darüber, ob unabhängige Variable(n) zur Erklärung der abhängigen Variable beitragen
o 4. Wie groß ist R2? → Anteil der Varianz der abhängigen Variablen, der durch die unabhängigen Variablen erklärt wird
Zuletzt geändertvor 18 Tagen