==> Verschiedene Zufallsstichproben liefern verschiedene Parameter – wir benötigen Statistische Inferenz (Stichprobenkennwerteverteilung)
-Drei Eigenschaften beeinflussen den Standardfehler des Steigungskoeffizienten
o Streuung entlang der Regressionsgraden: SD(e)
o Streuung von X: SD(X)
o Stichprobenumfang: n
-Wir testen in der Regel die Nullhypothese: H0: 𝜷𝟏 = 0
o (d.h. H0: Es gibt keinen Zusammenhang von X und Y / H1: Es gibt einen Zusammenhang von X und Y)
o Und damit erhalten wir als Teststatistik:
o Signifikant ("Sternchen") bedeutet nicht "relevant"
o Ausschließlicher Blick auf Signifikanz verursacht erhebliche Probleme!
o Auch wenn in Wirklichkeit kein relevanter Effekt vorliegt, so werden von 100 Forschern irrtümlicherweise 5 einen „signifikanten“ Effekt finden und genau diese 5 „signifikanten“ Effekte werden publiziert
o Und/oder: nicht-signifikante Ergebnisse werden nicht publiziert (s.nächste Folie)
Folge: viele publizierte Ergebnisse sind zufällig zustande gekommen (also falsch, obwohl sie „signifikant“ sind)
-Auch nicht-signifikante Ergebnisse sind möglichweise aufschlussreich
-Betrachtung und Interpretation von
o R2 bzw. adj. R2
o Effektrichtung (Vorzeichen) • Effektstärke (𝛽" und beta)
o Signifikanz
o Konfidenzintervall
-Und vor allem: Theoriegeleitete Forschung statt Variablenauswahl anhand von Signifikanztests
==> F-Test für das Gesamtmodell
==> Modell wird von m2 auf m3 sogar schlechter
-der p-Wert
• Das kleinste Signifikanzniveau, auf dem H0 gerade noch so verworfen werden kann
• Entspricht dem Quantilswert der Teststatistik in der
Standardnormalverteilung
• Wie Prozent aller zufälligen Stichproben hätte genauso starke oder sogar noch stärkere Abweichung von H0?
Zuletzt geändertvor 18 Tagen