Sampling error
verschiedene Stichproben -> verschiedene Populationsschätzungen
Rückschlüsse auf die Population haben immer einen sampling error
Wird durch standardfehler berechnet
Sampling error formel
Warum kein Standardfehler?
basieren auf der Berechnung einer einzelnen zufälligen Stichprobe -> Fehler würde unterschätzt
wäre nur angebracht wenn between school variance = 0
dann wäre auch egal woher die schüler im zweiten Zug gezogen werden ABER in Deutschland z.b. erklärt die between school variance 97% der varianz
Warum Replikationsmethoden?
Formeln für Standardfehler finden zu komplex bei ILSA Stichproben
um die Unsicherheit der Parameterschätzungen durch Stichprobenziehung zu quantifizieren
Was ist das Vorgehen bei Replikationsmethoden
eine Statistik wird für große Anzahl leicht verschiedener Datensätze berechnet (immer versch. Teile der originalen Daten)
Variablität zwischen den Schätzwerten
Jackknife
PSU
primary sampling unit -> Schulen
Sampling variance Formel Jackknife for two-stage sampling
Jackknife Type 1: Stratified samples (TIMSS bis 2011)
Schulen / Bundesländer etc. —> Strata
ähnliche Schulen z.B. nach Größe sortiert werden einem Pseudo stratum zugeteilt (meistens 2 Schulen)
Jackknife Verfahren wie für unstratifizierte innerhalb des Pseudo Stratums
eine Schule pro Pseudo stratum erhält das Gewicht 2, das andere 0
Jackknife Type 2: Stratified samples (TIMSS 2015)
unterschied zu vor 2015: jede Schule hat in mindestens einer Replikationsschätzung ein Gewicht von 0 und in einer anderen ein Gewicht von 2 erhält, was eine gleichmäßigere Verteilung über die Replikationen ermöglicht.
Balanced Repeated Replication
Jackknife: nur eine Schule wird für jede Replikation entfernt
BRR: in jedem Pseudo Stratum eine Schule mit weight von 0 und eine Schule mit weight von 2
Nachteil BRR
nur die halbe Stichprobe wird in jeder Replikation berücksichtigt
kann zu Schätzfehlern in Subpopulationen führen
Fay’s modification
wird in PISA benutzt
Faktor k wird eingeführt (bei PISA k= 0.5)
weights low: 0 + k
weights high: 2 - k
Bootstrapping
Ziehen mit Zurücklegen
Erzeugt viele Replikationen zur Schätzung der Verteilung einer Statistik
Sampling variance Jackknife Type 1, 2, BRR with Fay’s Factor, bootstrap
Factor A:
1 für Jackknife Type 1
2 für Jackknife Type 2
Bei BRR mit Faktor k = 0.5
Bei Bootstrap:
Last changed2 months ago