Regressionsanalyse in den Sozialwissenschaften

by Tim S.

Wie werden Ergebnisse einer Regression verallgemeinerbar, die auf Basis von 1 Zufallsstichprobe berechnet wurden?

==> Mit welcher (Un-)Sicherheit (confidence) können wir das Ergebnis aus einer Stichprobe verallgemeinern? Mit welcher (Un-)Sicherheit können wir Vorhersagen treffen?

==> Verschiedene Zufallsstichproben liefern verschiedene Parameter – wir benötigen Statistische Inferenz (Stichprobenkennwerteverteilung)

Welche drei EIgenschaften beeinflussen den Standardfehler des Steigungskoeffizienten?

-Drei Eigenschaften beeinflussen den Standardfehler des Steigungskoeffizienten

o Streuung entlang der Regressionsgraden: SD(e)

o Streuung von X: SD(X)

o Stichprobenumfang: n

Was ist der zentrale Grenzwertsatz für den Schätzer ß! ?

Wie muss nun die Teststatistik für ß1 lauten?

-Wir testen in der Regel die Nullhypothese: H0: 𝜷𝟏 = 0

o (d.h. H0: Es gibt keinen Zusammenhang von X und Y / H1: Es gibt einen Zusammenhang von X und Y)

o Und damit erhalten wir als Teststatistik:

Ist jeder statistisch-signifikanter Koeffizient inhaltlich relevant? Kann man die Antwort verallgemeinern?

o Signifikant ("Sternchen") bedeutet nicht "relevant"

o Ausschließlicher Blick auf Signifikanz verursacht erhebliche Probleme!

o Auch wenn in Wirklichkeit kein relevanter Effekt vorliegt, so werden von 100 Forschern irrtümlicherweise 5 einen „signifikanten“ Effekt finden und genau diese 5 „signifikanten“ Effekte werden publiziert

o Und/oder: nicht-signifikante Ergebnisse werden nicht publiziert (s.nächste Folie)

Folge: viele publizierte Ergebnisse sind zufällig zustande gekommen (also falsch, obwohl sie „signifikant“ sind)

-Auch nicht-signifikante Ergebnisse sind möglichweise aufschlussreich

-Betrachtung und Interpretation von

o R2 bzw. adj. R2

o Effektrichtung (Vorzeichen) • Effektstärke (𝛽" und beta)

o Signifikanz

o Konfidenzintervall

-Und vor allem: Theoriegeleitete Forschung statt Variablenauswahl anhand von Signifikanztests

Wie finde ich heraus ob das Modell einen signifikant von 0 verschiedenen Anteil der Gesamtstreuung? Mit welcher Irrtumswahrscheinlichkeit?

Mit anderen Worten: Ist das Modell brauchbar? Bringt das Modell eine Verbesserung gegenüber der einfachen Schätzung des arithmetischen Mittels bringt? Weist wenigstens eine der im Modell verwendeten X-Variablen einen Zusammenhang mit Y auf?

==> F-Test für das Gesamtmodell

Welche Variablen soll man warum in einem Regrssionsmodell berücksichtigen? Erkläre an folgendem Stata-Output.

==> Modell wird von m2 auf m3 sogar schlechter

Erläutern Sie nochmal das Grundprinzip der Hypothesentests und die Signifikanzniveaus. Was ist dabei der p-Wert?

-der p-Wert

• Das kleinste Signifikanzniveau, auf dem H0 gerade noch so verworfen werden kann

• Entspricht dem Quantilswert der Teststatistik in der

Standardnormalverteilung

• Wie Prozent aller zufälligen Stichproben hätte genauso starke oder sogar noch stärkere Abweichung von H0?

Join Course

Preview

Author

Tim S.

Information

Last changed
2 years ago

Report course

Inerferenz