-Was wäre, wenn wir eine andere Stichprobe gezogen hätten?
-Weiter Stichprobe 𝜋"Sample 3= 0,46 ... und noch eine und noch eine
-In der Regel wird jede einzelne dieser Stichproben einen anderen Schätzwert liefern, d.h. 𝜋"Sp i ≠ 𝜋"Sp j – sind alle unterschiedlich
o Jeder Schätzer ist eine Realisierung einer Zufallsvariablen "Anteil männlicher Studierenden in einer Stichprobe von n= 100 Studierenden".
==> Zum Untersuchungsgegenstand werden nun nicht mehr die Personen und ihre Geschlecht, sondern der Anteil der Männer in einer Stichprobe
==> In der Realität allerdings i.d.R. Ziehung nur einer einzigen Stichprobe
o z.B. einmalige Stichprobenziehung in Kooperation mit dem Studierendensekretariat, ARD-Deutschlandtrend mit n= 1004, ESS8 mit n=2852
==> Wie können wir auf Basis einer einzigen Stichprobe verallgemeinern? ... mit Hilfe der Anwendung von Normalverteilungen
wahrscheinlich normalverteilt
==> je größer die Stichproben sind, desto eher gleich das Ganze einer Normalverteilung
-wenn oft genug große Stichproben analysiert werden, kommen wir dem wahren Wert immer näher
==> Die Stichprobenverteilung des Stichprobenkennwerts konvergiert zu einer Normalverteilung für n ==> ∞ EGAL, wie die Verteilung der Ausgangsvariablen ist (je größer der Umfang n der Zufallsstichprobe)
-Kein klassischer Fehler, er sagt nur etwas über die (Stichproben-)Variabilität aufgrund unterschiedlicher Stichproben aus. Ein besserer Begriff wäre "Stichprobenvariabilität"
-Die Standardabweichung der Stichprobenverteilung besagt, wie weit einzelne Schätzungen 'in typischer Weise' vom wahren Wert abweichen
-Diese Stichprobenverteilung...
o Konvergiert gegen eine Normalverteilung
o Der Erwartungswert der Verteilung ist der entsprechende Populationsparameter (was wir eigentlich bei einer Vollerhebung hätten)
o Die Streuung ist der sogenannte Standardfehler (der u.a. von n abhängt)
==> So viele verschiedene Stichproben aber sind unrealistisch
o Das Gedankenexperiment führt uns aber zu einer wichtigen Einsicht
o Wir haben zwar nur eine Stichprobe und einen Kennwert.
o Aber: Wir kennen Eigenschaften der Verteilung der Kennwerte von (vielen, hypothetischen) Stichproben (aka Stichprobenverteilung) (u.a. aufgrund der Normalverteilung
-Aufgrund der Zufälligkeit der Stichprobe und Einmaligkeit wird der Punktschätzer nicht genau mit dem Populationsparameter übereinstimmen, daher "erweitern" wir ihn um ein Intervall, d. h. 0,59 ± ...
-Das Intervall sollte den unbekannten Populationsparameter mit hoher Wahrscheinlichkeit (Konfidenz) abdecken
-Zur Berechnung des Intervalls verwenden wir unser Wissen über die Stichprobenverteilung von hypothetischen Stichproben, die wir nicht kennen - die wir aber auch nicht brauchen!
-Tatsache ist: Es ist nur eine Stichprobe vorhanden
-p = 0.59 = 𝜋"
-Wir wissen:
o Die Verteilung der Anteile einer großen Anzahl von (hypothetischen) Stichproben, die Stichproben- verteilung, konvergiert gegen eine Normalverteilung 𝑁(π; 𝑆𝐸π)
-Außerdem kennen wir Normalverteilungen, z.B.
o Standardisierung in 𝑁(0; 1)
o Quantile der Standardnormalverteilung (b.w.)
-Punktschätzer ± 1,96 * SE (Fehlertoleranz)
-Die Fehlertoleranz hängt ab von
o Konfidenzniveau (z.B. 90%, 95%, 99%) bzw. dem entsprechenden z-Quantil der Standardnormalverteilung (z.B. 1.64, 1.96, 2.58) (unsere Entscheidung)
-Standardfehler (SE), der abhängt von
o Stichprobenumfang n
o Standardabweichung in der Population (die man ebenfalls mit vorliegenden Daten schätzen kann, b.w.)
-Fehlertoleranz/Schwankungsbreite: Der kritische Wert multipliziert mit dem Standardfehler. Von einem Konfidenzintervall: das Ausmaß des Intervalls jeweils auf einer Seite des Punktschätzers.
-Ob ein einzelnes konkretes KI den Populationsparameter überdeckt oder nicht, kann prinzipiell nicht festgestellt werden
o denn: den Populationsparameter kennen wir ja normalerweise nicht!
-Die Wahrscheinlichkeitsaussage von Konfidenzintervallen beziehen sich auf die Intervalle, nicht auf den Populationsparameter.
-Ob ein einzelnes konkretes KI den Wert der Population überdeckt oder nicht, wissen wir nicht. Es gibt lediglich eine hohe Wahrscheinlichkeit, dass dies der Fall ist.
-Je größer das Konfidenzniveau (z.B. 90%, 95%, 99%), desto größer das Konfidenzintervall (trade off: "Sicherheit gegen Präzision")
o 95%Konfidenzintervall: Intervall, das mit einer Zuverlässigkeit von 95% den wahren Populationswert überdeckt.
-Je größer der Umfang n der Stichprobe, desto kleiner das Konfidenzintervall (trade off: "Kosten der Datenerhebung gegen Präzision" (teurer Studie, aber mehr Präzision)
Zuletzt geändertvor 5 Monaten