Zufallsgesteuerte Auswahlverfahren
Höhere Repräsentativität -> höhere externe Validität
1. Uneingeschränkte Zufallsauswahl
2. Geschichtete Zufallsauswahl
3. Mehrstufige Zufallsauswahl
4. Klumpenauswahl
Homogenere Merkmalsverteilungen in den Teilpopulationen implizieren kleinere Streuung und einen kleineren Standardfehler und somit eine präzisere Schätzung.
Nichtzufallsgesteuerte Auswahlverfahren
Geringe Repräsentativität
Quotenauswahl
Ad hoc-Auswahl
Theoriegeleitete Auswahl
Uneingeschränkte Zufallsauswahl
– Die Stichprobe wird komplett zufällig aus der Population
gezogen
– Nachteil: „Zentralregister“ notwendig
Geschichtete Zufallsauswahl
Die Stichprobe wird zufällig aus einer Teilstichprobe gezogen → für die Untersuchung relevante Merkmale werden analog zur Population geschichtet
– z. B. Schichtung nach Alter bei einer Teilstichprobe von Studierenden
– Vorteil: präzisere Schätzung
Unterschied zur Quotenauswahl: wir wissen bereits, dass das das Kriterium nach welchem ausgewählt wird Einfluss nimmt
Mehrstufige Zufallsauswahl
Aus der Gesamtpopulation werden stufenweise Teilpopulationen bestimmt
– Unterschied zur geschichteten Zufallsauswahl: die Teilpopulationen unterscheiden sich nicht bedeutsam
Aus der letzten ausdifferenzierten Gruppe werden einzelne zufällig für die Stichprobe ausgewählt
– Nachteil: Nur sinnvoll, wenn die Teilstichprobe der
Gesamtpopulation entspricht/ähnelt
Klumpenauswahl
Zufallsauswahl
Spezialfall der mehrstufigen Zufallsauswahl: letzte Teilstichprobe wird komplett erhoben (Klumpen)
Zufall da die Stufen davor zufällig ausgewählt wurden
Schichtung der Stichprobe nach relevanten Merkmalen (z. B. Alter, Bildung)
– Aber: keine wissenschaftlichen Erklärungen, die auf den Einfluss der Merkmale hinweisen (Zb Wahlprognose)
– Die ersten Personen, die einem über den Weg laufen, werden
genommen → „Gelegenheitsstichprobe“ (z. B. Umfrage bei Fernsehbeiträgrn)
Faktoren wie Uhrzeit und Ort können Ergebnis verzerren
Durch Vorüberlegungen werden sehr typische/untypische Fälle ausgewählt
– Vorteil: hilft, neue Ideen zu finden/überprüfen
Man wird beispielsweise aufgrund einer Krnakheit ausgewählt, um über diese neue Erkenntnisse zu erlangen
Anforderungen an ein Schätzmaß
Erwartungstreue
unbiased estimation; keine Verzerrung bei Vorhersage, keine systematische Verzerrung
• Konsistenz
Präzision der Schätzung steigt mit steigendem N
• Effizienz
Möglichst kleiner Standardfehler (/Streuung)
• Exhaustivität
Daten aller Versuchspersonen sollen in die Berechnung des Schätzers mit eingehen
Punkt- und Intervallschätzung
Punktschätzung: ein Stuchprobenkennwert
Intervallschätzung: Neben dem Kennwert noch ein Konfidenzintervall
Konfidenzintervall
Das Konfidenzintervall gibt an, in welchem Bereich um den
Stichprobenkennwert sich der Populationskennwert mit einer festgelegten Wahrscheinlichkeit befindet.
Bzw.: in welchem Bereich um den Populationskennwert sich der Stichprobenkennwert mit einer festgelegten Wahrscheinlichkeit befindet.
Dieses Intervall soll im Zuge einer präzisen Schätzung möglichst klein sein
→Mit zunehmender SP wird das Intervall möglichst klein
(bei einer Schätzung von der SP auf die Population)
Anders als beider deskriptiven Statistik, geht es bei der Stichprobentheorie (und Inferenzstatistik) auch um die Schätzung auf die Population Je exakter die Schätzung, desto geringer der Vorhersagefehler (Parameter Standartfehler)
Je kleiner der Standardfehler ist, desto geringer der Vorher- sagefehler, desto kleiner das Konfidenzintervall, desto exakter die Schätzung.
Ox: Standartfehler des Mittlewerts (Streuung der Mittelwerte)
4 Möglichkeiten der Schätzung
qualitative Merkmale (relative Häufigkeiten)
Schätzung des Intervalls für den Populationsparameter π Schätzung des Intervalls für einen Stichprobenparameter p
quantitative Merkmale (Mittelwerte)
Schätzung des Intervalls für den Populationsparameter μx Schätzung des Intervalls für einen Stichprobenparameter x ̄
Mutungsintervall
Bei der Schätzung eines Populationsparameters von einem Stichprobenparameter aus wird von einem Mutungsinvervall (Vermutungsintervall) gesprochen. Bei qualitativen Merkmalen
p=Stichprobenkennwert
Bei Intervallschätzung mit kleinen Stichproben (N < 30, besser auch schon bei N < 100) sollte statt der Standardnormalverteilung (z-Werte) die Verteilung der t-Werte zur Definition des Intervalls zugrunde gelegt werden.
p±t95%,df ·sp (4)
Somit wird bei kleinen Stichproben durch die Verwendung des t-Werts anstelle des z-Werts konservativ (=vorsichtiges Vorgehen) ein größeres Intervall gewählt.
Konfidenzintervall + Standartfehler
Bestimmung eines Intervalls, in dem mit 95% Wahrscheinlichkeit der wahre
Populationswert liegt
Vertrauensintervall
Bei einer Schätzung von einem Populationsparameter auf Stichprobenparameter wird ein Vertrauensintervall geschätzt.
Bestimmung eines Intervalls, in dem mit 95% Wahrscheinlichkeit der wahre SP-Kennwert liegt
Überprüfung, ob eine Stichprobe in einer Population liegt
bei höherer Anzahl an Subjekten in der Stichprobe der Stichprobenmittelwert dem Populationsmittelwert annähert.
Zentraler Grenzwertsatz
Die Definition des Konfidenzintervalls für Mittelwerte bei quantitativen Merkmalen erfolgt nach dem Zentralen Genzwertsatzes.
Wird ein Populationsparameter geschätzt, kann diese Schätzung über zwei Vorgehensweisen verbessert werden:
1 Erhöhung des Stichprobenumfangs
2 Mittelung von vielen Stichprobenmittelwerten
Je mehr Stichproben erhoben werden und/oder je größer die Gesamtstichprobe ausfällt, desto sicherer ist die Schätzung.
Was ist die Bedeutung des Zentralen Grenzwertsatzes?
Die Größe des Standardfehlers sinkt, je mehr Beobachtungen in seine Bestimmung eingehen, das heißt, je größer die Gesamtstichprobe ist.
B√ei doppelter Stichprobengröße wird der Standardfehler nur um den Faktor 2 verringert.
Geht der Standardfehler der Mittelwerte gegen Null, so entspricht der Mittelwert der Stichproben x ̄j , x ̄, dem wahren Populationsparameter μx .
Mutungsintervall quantitativ
Vertrauensintervall quantitativ
Wichtige Schätzmaßen/Standartfehler und Vor und Nachteile
Last changeda year ago