-Hypothesentest einer fixen Erwartung: Wir testen, ob eine Schätzung basierend auf unserer Zufallsstichprobe signifikant von einem fest erwarteten Populationsparameter abweicht.
-Auf der Grundlage theoretischer Überlegungen wird eine Hypothese abgeleitet, z.B.
o "X hat sich zwischen t0 und t1 verändert" (Beispiel: Mittleres Einkommen im Jahr 2019 im Vergleich zum mittleren Einkommen im Jahr 2021)
o "X ist in Gruppe A höher als in Gruppe B." (Beispiel: Geschlechtsspezifische Unterschiede bei den Arbeitszeiten)
o "X hat einen positiven Effekt auf Y." (Beispiel: Bildung der Eltern beeinflusst den Bildungsstand des Kindes)
-Anhand der Daten von 1 Zufallsstichprobe prüfen wir, ob die Hypothese von den Daten unterstützt wird ==> wir akzeptieren die Hypothese oder wir verwerfen sie – wenn wir sie (H0) verwerfen, schlussfolgern wir H1
-Hypothesen (Theorien) lassen sich niemals endgültig bestätigen, wir können nur daran scheitern sie zu widerlegen – siehe Popper und das Prinzip des logischen Schließens
-Wir geben an, wie sicher wir mit unserer Entscheidung sind
o Alle Hypothesentests folgen einer Grundlogik
o H0 wird mittels einer Zufallsstichprobe getestet
o Der p-Wert gibt die Wahrscheinlichkeit des Ergebnisses der Zufallsstichprobe an, unter der Annahme, die H0 sei korrekt, z.B. P(𝑥̅ |H0) , P(𝛥|H0) P(Chi2|H0) , ...
o Ist diese Irrtumswahrscheinlichkeit p < 0.05 , gehen wir davon aus, dass das Ergebnis systematisch und nicht (nur) zufällig von der H0 abweicht
o Entsprechend des p-Werts lehnen wir die H0 ab -- oder behalten sie bei
o Wenn wir die H0 abgelehnt haben, bleibt uns dann nur übrig anzunehmen, dass die H1 stimmt.
o Nur das Verwerfen von H0 ist statistisch abgesichert (Fehler 1. Art)
==> D.h. H0 könnte mit 5%-Wahrscheinlichkeit noch gelten
==> Wenn Teststatistik gleich dem Quantil ist, liegt ein Kippwert vor – wenn das Quantil größer ist, dann bleibt H0 da keine signifikante Abweichung vorliegt
-Wir könnten dies explizit mit einem einseitigen Test überprüfen
o H0: Das durchschnittliche Haushaltseinkommen im Jahr 2021 ist mindestens gleich hoch wie 2019 (oder vielleicht sogar höher...)
o H1: Das durchschnittliche Haushaltseinkommen im Jahr 2021ist niedriger als im Jahr 2019
-Wenn der statistische Test zeigt, dass wir H0 verwerfen können, nehmen wir an, dass H1 gilt – zeigt uns damit ob es sich um Zufallsschwankungen oder signifikante Unterschiede handelt
-Hypothesentest H0: μ2021 ≥ μ2019 vs. H1: μ2021 < μ2019
==> Teststatistik in Verteilungsfunktion eintragen – nur 0.24% der Stichproben geben einen wert von -2.82 oder extremer an und damit nur 0.24%ige Wahrscheinlichkeit, dass H0=H1
==> Irrtumswahrscheinlichkeit bezieht sich darauf, eine H0 fälschlich zu verwerfen = Testentscheidung auf Basis der Stichprobe gegen H0, obwohl H0 in der Population gilt
==> P-Wert ist auch der kritische Wert
o Nullhypothese (H0): μ2019 = μ2021
Das durchschnittliche Haushaltseinkommen hat sich nicht verändert, d.h. das durchschnittliche Haushaltseinkommen im Jahr 2019 (bekannter Populationsparameter von 2019) ist das gleiche wie im Jahr 2021 (unbekannter Populationsparameter von 2021)
o Alternativhypothese (H1): μ2019 ≠ μ2021
Das durchschnittliche Haushaltseinkommen im Jahr 2019 (bekannter Populationsparameter von 2019) hat sich im Vergleich zu 2021 (unbekannter Populationsparameter von 2021) tatsächlich verändert
-Ein statistischer Test soll entscheiden, ob
o Das Ergebnis aus der Stichprobe 𝑥̅ gegen H0 sprechen („H0 ist zu verwerfen")
o oder nicht („H0 ist beizubehalten")
o H0 behauptet dabei immer das Gegenteil von H1 um möglichst praktikbabel verworfen werden zu können
-Wir ziehen immer ZUFÄLLIGE Stichproben
o Das führt zu Stichprobenvariabilität und somit zu Ungenauigkeit
o Jede Stichprobe hat eine zufällige Abweichung
o Problem: Was wenn unser Schätzwert nicht real existiert sondern nur aus Zufall enstanden ist?! – eben darum müssen wir sichergehen, dass unser Ergebnis real ist
-Wenn 𝑥̅ sehr groß wäre (z. B. 4.500 €) oder sehr klein (1.400 €), kämen wir wohl ohne viel Statistik-Tamtam zu einem Ergebnis...
-Aber wie können wir fundiert entscheiden, ob der beobachtete Wert 𝑥̅ aus 1 Stichprobe
o lediglich eine Abweichung aufgrund von Zufälligkeit und Stichprobenvariabilität ist (und die Nullhypothese immer noch gilt: H0: μ2019 = μ2021)?
o ODER handelt es sich um eine signifikante Abweichung vom Mittelwert der Grundgesamtheit (und H0 muss verworfen werden und die Alternative gilt: H1: μ2019 ≠ μ2021)?
==> Mittels Srichprobenverteilung
-Der (eine) Stichproben-Mittelwert gehört zu einer Stichprobenverteilung (von Mittelwerten von vielen Stichproben, "somewhere over the rainbow")
-Die Stichprobenverteilung ist normalverteilt mit N (μ, 𝑺𝑬)
-μ ist der Erwartungswert der Population, aus der die Stichprobe gezogen wurde (here: μ2021)
-SE (Standardfehler) ist die Standardabweichung der Population dividiert durch √n
-Zweiseitige/ungerichtete Alternativhypothese: Eine H1 ist zweiseitig, wenn lediglich auf systematische Abweichung, egal in welche Richtung größer oder kleiner) von der H0 getestet wird (zweiseitiger Hypothesentest)
-Einseitige/gerichtete Alternativhypothese: Eine H1 ist einseitig, wenn wir eine Abweichung von der H0 in eine bestimmte Richtung (größer/kleiner) vermuten (einseitiger Hypothesentest)
==> bei einseitigen/gerichteten Tests sind Vorzeichen relevant
-Konfidenzintervalle und (zweiseitige Tests) stehen in einem direkten Verhältnis.
-Legt man ein Konfidenzintervall um die Teststatistik, so lässt sich aus dem Intervall das Testergebnis ablesen:
o Umschließt das Intervall den Wert 0, führt der Test zur Akzeptanz der H0
o Umschließt das Intervall nicht den Wert 0, führt der Test zu einer Ablehnung von H0
-t-Verteilung zur Bestimmung des kritischen Werts wird verwendet, wenn
o der Standardfehler mithilfe der Streuung der Stichprobe geschätzt wird -- das ist fast immer der Fall!
o kleine Stichproben vorliegen
-Das ist aber kein Problem, da die t-Verteilung gegen die Normalverteilung konvergiert
==> kleinstes Signifikanzniveau auf dem H0 gerade noch so verworfen werden kann – siehe Beispiel oben
o Entspricht dem Quantilswert der Teststatistik in der Standardnormalverteilung
o Fragt danach, wie viel Prozent aller zufälligen Stichproben genauso starke oder sogar noch stärkere Abweichung von H0 hätte?
o Höchstes mögliches Signifikanzniveau (maximale Sicherheit), d.h. Wenn H0 gelten WÜRDE: Wie viel Prozent aller zufälligen Stichproben würden einen Wert erzeugen, der genauso oder noch extremer vom Mittelwert abweichen würde?
Der p-Wert entspricht dem Quantilwert der Teststatistik in der Standardnormalverteilung𝜙(Teststatistik) oder eines Quantils einer anderen dem Test angemessenen Verteilung, z.B. t-Quantildfs
-Statistische Signifikanz entspricht nicht der alltagssprachlichen Verwendung des Begriffs im Sinne von „bedeutsam“.
-Die inhaltliche Bedeutsamkeit wird nicht durch den Hypothesentest beantwortet!
o Irrelevante Ergebnisse, z.B. geringfügige Unterschiede, können signifikant sein
o Bei sehr großem Stichprobenumfang n wird alles signifikant, da n in die Berechnung des Standardfehlers eingeht
o Die Größe des p-Werts sagt nichts über die Bedeutsamkeit eines Ergebnisses
o ABER: In riesigen Datenmengen finden sich immer irgendwelche Zusammenhänge, die Stata erkennen wird auch wenn sie eigentlich gar nichts sind
-Dennoch werden häufig (nur) signifikanten Ergebnisse veröffentlicht ("publication bias")
-PublicationBias/Publikationsbias: Verzerrung von veröffentlichten Studien, wenn positive bzw. signifikante Befunde häufiger publiziert werden als nicht-signifikante Ergebnisse
-Wie könnte er verhindert werden?
o Der Publikationbias kann durch Veröffentlichung nicht signifikanter Ergebnisse verhindert werden. Eine andere Möglichkeit ist die Vorregistrierung aller Studien, bevor sie tatsächlich durchgeführt werdenen.
Last changed5 months ago