(==> Erinnerung: das Dach kennzeichnet einen Schätzwert)
-Die Parameter werden geschätzt, weil
o lediglich eine Stichprobe aus der Population vorliegt
o weitere (zufällige – aber nicht immer zufällige) Einflüsse nicht berücksichtigt werden, diese werden im Fehlerterm 𝜀 abgebildet
§ beobachtbare Faktoren (Ausbildungsberuf/Studienfach, Geschlecht) könnten später bei der multiplen Regression einbezogen werden
§ weitere unbeobachtete, zufällige Faktoren verbleiben im Fehlerterm
-Die (geschätzten) Parameter der Regressionsgleichung schätzen die Regressionsgerade der Population
Die Kleinst-Quadrate-Schätzung (Ordinary Least Squares, OLS)
-Prinzipiell lassen sich beliebig viele Geraden durch die Punkte legen
-Die (mathematisch) „beste“ Gerade ist die, bei der die Summe der quadrierten Abweichungen von den Punkten des Streudiagramms am geringsten ist
-Das Verfahren, das diese „beste“ Gerade liefert, nennt sich Kleinste (Abweichungs-) Quadrate-Schätzung (auch: OLS = ordinary least squares)
-Mathematisch wird dazu das Minimum der Summe der Abweichungsquadrate abhängig von 𝛽0 und 𝛽1 bestimmt
==> Gesucht werden die zwei Werte 𝛽!0 und 𝛽!1, für die die Summe der quadrierten Abweichungen minimal wird
o Die beiden geschätzten Minimierungsparameter werden mit 𝛽!0 und 𝛽!1 bezeichnet ("Dach")
==> kennen wir bereits
==> Interpretation der Regressionskoeffizienten und Vorhersagewert
o Interpretation Konstante: Wert von Y für X = 0
§ Hier: Bei 0 Bildungsjahren wird ein Berufsprestige von 19.7 Punkten erwartet
o Interpretation Steigung: Veränderung von Y, wenn sich X um eine Einheit verändert
§ Hier: Pro Bildungsjahr steigt das Berufsprestige um 1.92 Punkte
-Beachte: Linearitätsannahme bedeutet, dass der Effekt immer gleich ist
-Beispiel: Veränderung des Berufsprestiges ist bei einer Erhöhung von 12 auf 13 Bildungsjahre ist die gleiche wie bei einer Veränderung von 24 auf 25 Bildungsjahre, also jedes Mal 1.92 Punkte mehr
==> Bedingter Erwartungswert
o Regression legt fest, wie wir die bedingten Erwartungswerte ermitteln
o Die lineare Regression ermöglicht die Beschreibung der bedingten Verteilung metrischer Variablen mit nur zwei Zahlen: dem Achsenabschnitt 𝛽!0 und der Regressionssteigung 𝛽!1
o Durch die Annahme, dass bedingte Mittelwerte auf einer geraden Linie liegen (Linearitätsannahme), können auch bedingte Mittelwerte für Werte/Gruppen vorhergesagt werden, die nicht in den Daten repräsentiert sind.
o Beispiel: Wie hoch wäre der Berufsprestigewert für 16,35 Bildungsjahre? Antwort: 51,1 (= 19.7 + 16,35 *1.92)
o Wenn die Linearität allerdings nicht zutrifft, können diese Vorhersagen sehr weit von den "wahren" bedingten Mittelwerten entfernt sein.
-Wieviel "besser" ist die geschätzte Gerade im Vergleich zum Durchschnitt? = "Vergleiche die Streuung von Y mit der Streuung von Y|X"
-Gesamtstreuung = Erklärte Streuung + nicht-erklärte Streuung
-Die Streuungszerlegung wird dazu genutzt um zu bestimmen, welcher Anteil der Streuung von Y durch X erklärt wird
o R2 (erklärt soundsoviel Prozent der Gesamtvarianz) bezieht sich auf das gesamte Modell
==> Hohes R2 sagt nichts über die Erklärungskraft oder Richtigkeit eines einzelnen Koeffizienten aus
o Je mehr unabhängige Variablen, desto höher R2
o später: korrigiertes R2
In den Sozialwissenschaften ist R2 eher gering (soziale Prozesse sind nicht deterministisch
Zuletzt geändertvor 18 Tagen