Regressionsanalyse in den Sozialwissenschaften

by Tim S.

Just watch you idiot sandwich!

Erläutere die Bestandteile einer Linearen Modellspezifikation. Was kann ich nun ahand des Modelles feststellen?

(==> Erinnerung: das Dach kennzeichnet einen Schätzwert)

Wieso werden die Parameter nur geschätzt?

-Die Parameter werden geschätzt, weil

o lediglich eine Stichprobe aus der Population vorliegt

o weitere (zufällige – aber nicht immer zufällige) Einflüsse nicht berücksichtigt werden, diese werden im Fehlerterm 𝜀 abgebildet

§ beobachtbare Faktoren (Ausbildungsberuf/Studienfach, Geschlecht) könnten später bei der multiplen Regression einbezogen werden

§ weitere unbeobachtete, zufällige Faktoren verbleiben im Fehlerterm

Wofür sind nun die geschätzten Parameter der Regressionsgleichung vonnöten?

-Die (geschätzten) Parameter der Regressionsgleichung schätzen die Regressionsgerade der Population

Wie werden die (Schätz)Parameter 𝛽!0 und 𝛽!1ermittelt?

Erläutern Sie das OLS-Prinzip. Was steht am Ende als Ergebnis?

Die Kleinst-Quadrate-Schätzung (Ordinary Least Squares, OLS)

-Prinzipiell lassen sich beliebig viele Geraden durch die Punkte legen

-Die (mathematisch) „beste“ Gerade ist die, bei der die Summe der quadrierten Abweichungen von den Punkten des Streudiagramms am geringsten ist

-Das Verfahren, das diese „beste“ Gerade liefert, nennt sich Kleinste (Abweichungs-) Quadrate-Schätzung (auch: OLS = ordinary least squares)

-Mathematisch wird dazu das Minimum der Summe der Abweichungsquadrate abhängig von 𝛽0 und 𝛽1 bestimmt

==> Gesucht werden die zwei Werte 𝛽!0 und 𝛽!1, für die die Summe der quadrierten Abweichungen minimal wird

o Die beiden geschätzten Minimierungsparameter werden mit 𝛽!0 und 𝛽!1 bezeichnet ("Dach")

==> kennen wir bereits

Just watch you idiot sandwich!

Wie werden die Koeffizienten einer einfachen lineare Regression interpretiert?

==> Interpretation der Regressionskoeffizienten und Vorhersagewert

o Interpretation Konstante: Wert von Y für X = 0

§ Hier: Bei 0 Bildungsjahren wird ein Berufsprestige von 19.7 Punkten erwartet

o Interpretation Steigung: Veränderung von Y, wenn sich X um eine Einheit verändert

§ Hier: Pro Bildungsjahr steigt das Berufsprestige um 1.92 Punkte

-Beachte: Linearitätsannahme bedeutet, dass der Effekt immer gleich ist

-Beispiel: Veränderung des Berufsprestiges ist bei einer Erhöhung von 12 auf 13 Bildungsjahre ist die gleiche wie bei einer Veränderung von 24 auf 25 Bildungsjahre, also jedes Mal 1.92 Punkte mehr

Wie kann ich anhand einer Zufallsvariablen (E(Y)) einen Erwartungswert (E(Y!)) ermitteln? Welches zentrale Konzept hilft hier, was ist aber die Gefahr?

==> Bedingter Erwartungswert

o Regression legt fest, wie wir die bedingten Erwartungswerte ermitteln

o Die lineare Regression ermöglicht die Beschreibung der bedingten Verteilung metrischer Variablen mit nur zwei Zahlen: dem Achsenabschnitt 𝛽!0 und der Regressionssteigung 𝛽!1

o Durch die Annahme, dass bedingte Mittelwerte auf einer geraden Linie liegen (Linearitätsannahme), können auch bedingte Mittelwerte für Werte/Gruppen vorhergesagt werden, die nicht in den Daten repräsentiert sind.

o Beispiel: Wie hoch wäre der Berufsprestigewert für 16,35 Bildungsjahre? Antwort: 51,1 (= 19.7 + 16,35 *1.92)

o Wenn die Linearität allerdings nicht zutrifft, können diese Vorhersagen sehr weit von den "wahren" bedingten Mittelwerten entfernt sein.

Wie kann ich die Gesamtstreuung eines Modells ermitteln?

-Wieviel "besser" ist die geschätzte Gerade im Vergleich zum Durchschnitt? = "Vergleiche die Streuung von Y mit der Streuung von Y|X"

-Gesamtstreuung = Erklärte Streuung + nicht-erklärte Streuung

Erläutern Sie das Bestimmtheitsmaß R2.

-Die Streuungszerlegung wird dazu genutzt um zu bestimmen, welcher Anteil der Streuung von Y durch X erklärt wird

o R2 (erklärt soundsoviel Prozent der Gesamtvarianz) bezieht sich auf das gesamte Modell

==> Hohes R2 sagt nichts über die Erklärungskraft oder Richtigkeit eines einzelnen Koeffizienten aus

o Je mehr unabhängige Variablen, desto höher R2

o später: korrigiertes R2

In den Sozialwissenschaften ist R2 eher gering (soziale Prozesse sind nicht deterministisch

Join Course

Preview

Author

Tim S.

Information

Last changed
2 years ago

Report course

Bivariate Regression

Just watch you idiot sandwich!

Erläutere die Bestandteile einer Linearen Modellspezifikation. Was kann ich nun ahand des Modelles feststellen?

Wieso werden die Parameter nur geschätzt?

Wofür sind nun die geschätzten Parameter der Regressionsgleichung vonnöten?

Wie werden die (Schätz)Parameter 𝛽!0 und 𝛽!1ermittelt?

Erläutern Sie das OLS-Prinzip. Was steht am Ende als Ergebnis?

Just watch you idiot sandwich!

Wie werden die Koeffizienten einer einfachen lineare Regression interpretiert?

Wie kann ich anhand einer Zufallsvariablen (E(Y)) einen Erwartungswert (E(Y!)) ermitteln? Welches zentrale Konzept hilft hier, was ist aber die Gefahr?

Wie kann ich die Gesamtstreuung eines Modells ermitteln?

Erläutern Sie das Bestimmtheitsmaß R2.

Author

Tim S.

Information