Einleitung: Warum Stichproben?
(Ziel,Problem, Lösung, Frage)
Ziel: Aussage über eine gegebene Population , Bsp. Wohnbevölkerung in Deutschland
Deskriptiv: z.B Mittelwert des Einkommens
Erklärend: Trifft Hypothese XY für diese Poplulation zu?
Problem: Vollerhebung (Befragung aller Elemente in der Population = zu teuer & nicht immer praktikabel)
Lösung: Verwendung eines “verkleinerten Abbildes” der Population —> Stichprobe
Frage: Wie muss dieses “Abbild” zusammengestezt sein (Art& Größe)?
Definition Grundgesamtheit (3 Punkte)
Worum gehts? (Abbildung)
Grundgesamtheit (Population)
—> Alle Elemente die für die Untersuchung in Frage kommen; die Gruppe, über die man Aussagen treffen will
sollte vorab möglichst genau beschrieben werden
—> BSp. alle Erwachsenen, die in DE ständigen Whnsitz haben ; alle Studierenden eines BA-Studiengans an der Uni Köln
Befragung aller Mitglieder der Grundgesamtheit = Vollerhebung
Definition Stichprobe (3 Punkte)
Teikmeng der Population, die entweder rein willkürlich oder nach bestimmten Kriterien (z.B Zufallsauswahl) ausgewählt wurde
Ziel ist die Schätzung von Populationsparametern (z.B Mittelwerte, Anteile) aus den Ergebnissen in der Stichprobe
Auf der Basis einer Stichprobe sollen Aussagen über Grundgesamtheit gemacht werden
Vor-und Nachteile Stichproben
Vorteile:
Vollerhebungen sind bei goßen Grundgesamtheiten oft nur schwer durchfürbar
Stichproben wesentlich kostengünstiger
Stichproben ermöglichen komplexere. untersuchungsdesigns (z.B bei Experimenten)
Nachteile:
Schätzungen auf der Basis von Stichproben enthalten Fehler (= weil nicht Grundgesamtheit (Abweichungen entstehen)
Genauigkeit mit der Populationsparameter geschätzt werden hängt von der Stichprobenqualität und der Größr des Samples ab (je größer desto größer Varianz)
Populations & Stichproben Parameter (2 Punkte)#
Abbildung
Statistik: Populationsparameter (Werte in der Grundgesamtheit) durch griechische Kleinbuchstaben bezeichnet (Mittelwert & Streuung)
Schätzungen auf Basis der Stichprobe (Stichprobenparamter): Abkürzung mit lateinischen Buchstaben (Mittelwert: m, Streeung (Standardabweichung) s)
Wer gehört dazu/ wer nicht? Abbildung
Auswahlverfahren (2 Punkte)
Abbildung Übersicht Auswahlverfahren
zentrale Frage: Wie kann sichergestellt werden, dass Populationsparamter möglichst unverzerrt geschätzt werden?
Verschiedene Auswahlverfahren
—> Willkürliche (nicht-l´kontrollierte Auswahl) BSp. Passantenbefragung, Schneeballstichprobe
—> Bewusste Auswahl (z.b Qoutenstichprobe)
Klumpenstichprobe
Zufallsauswahl ( Bedingung für Inferenzstatistik)
Willkürliche Auswahl (4Punkte)
Bsp: Passantenbefragung durch Reporter zu politishcen einstellungen
ODER
Befragung der Teilnehmer eines Excel Kurses an der VHS zu Weiterbildungsteilnahme
—> in beiden Fällen ist Grundgesamtheit nicht klar definiert, Selektivität der Stichprobe ungeklärt
—> Ergebnisse sind i.d.R wissenschaftlich wertlos (für Marktforschung u:U aber dennoch informativ) = keine Kosten
Willkürlich “Schneeballtechnik” (4 Punkte)
bei Studien zur Ursachen & Folge bestimmter Merkmale / Verhaltensweisen
Grundgesamtheit schlecht zu erreichen/ interessierende Merkmal selten oder nicht “sichtbar” bzw. registriert ist
Bsp: Obdachlose, illigale Einwanderer etc.
Vorgehen: Identifikation & Befragung einer Startperson, die weitere Betroffene nennen kann
Bewusste Auswahl: Quotenauswahl (3 Punkte)
Abbildung bewusste Quotenauswahl
Zufallsauswahl nicht praktikabel (zu teuer, zu aufwändig, oftmals kommerzielle Institute verwendet
in Quotenplan wird Interviewern vorgegeben, wie hich Anteil von Personen mit bestimmten sióziodemofrafischen Mrkmalen unter Befragten seij muss (oft Geschlecht, Alter, Bildung = Merkmalskombination)
Verteilung dieser Merkmale in der Grundgesamtheit ist bekannt & soll in der Stichprobe nachgebildet werden
Probleme Quotenauswahl (4 Punkte)
ausgewählten Merkmale (Geschlecht, Alter) orientieren sich an Machbarkeit & hängen oft nur gering mit dem zusammen, was interessant ist (z: politische Einstellung)
Willkür Interviewer, denen die Auswahl oft überlassen bleibt ( wählen eher kooperative Personen) Gefahr von unkontrollierbaren Verzerrungen (Abbild Grundgesamtheit fraglich/verzerrt
so lange kontaktiert, bis Quoten erfüllt sund. Vor allem die gut Erreichbaren in der Stichprobe (sytematische Verzerrungen)
Keine Zufallsauswahl! Keine Inferenzstatistik!
Klumpstichprobe (5 Punkte)
Abbildung (cluster sample)
Befragung aller Mitgleider einer Instituition/Gruppe
Klumpen nach Zufallsprinzip ausgewählt werden
(Bsp. Liste aller Gymnasien & deren 9. Kl einer Stadt, jede 4 Klasse ausgewählt)
Problem: befragten Schüler in einer Klasse ähneln sich möglicherweise stärker als zwischen versch. klassen (Streuung in einer Klasse < als zwischen Schülern versch. Klassen)
keine Zufallsstichprobe aller Schüler der 0 Kl an Gymnasien der Stadt
Ähnlichkeit innerhalb Gruppe kann bei bestimmten Fragen wünschenswert sein (z.B Effekte der Klassenzusammmensetzung untersuchen)
Zufalls bzw. Wahrscheinlichkeitsauswahl (3 Punkte)
Grundregel:
—> Jedes Element der Grundgesamtheit muss exakt der gleichen Wahrscheinlichkeit in die Stichprobe gelangen können
kann auch mehrstufig erfolgen
Nur diese Methode erlaubt den inferenzstatistischen Schluss von Stichprobe auf Grundgesamtheit
—> Fehlerwahrscheinlichkeiten & Vertrauensintervalle können bestimmt werden
(Wie nahe kann ich mit Stichprobe an Populationsparameter kommen?)
Einfache Zufallsstichproben (2 Punkte)
Kriterium a: Jedes Element der Grundgesamtheit hat genau gleiche, von null verschiedene Wahrscheinlichkeite´, in Stichprobe zu gealngen “equal probability selection method (EPSEM)
Kriterium b: Auswahl erfolgt direkt & “einstufig” (“simple random sampling” SRS)
Abbild:
Mehrstufige Zufallsauswahl
Abbildung:
Unterschiedliche Auswahlwahrscheinlichkeiten können durch Gewichtung korrigiert werden (Berücksichtigung der Wahrscheinlichkeiten)
in m-Persinenhaushalten ist die Auswahlwahrscheinlichkeit 1/m, Gewichtung durch reziproken Wert m/1
Geschichtete Stichprobe
Vorraussetzung: Schichtanteil muss bekannt sein & Zugehörigkeit der Untersuchungseinheitenn muss erkennbar sein
Vorteil: präzisere Schätzung, wenn due Schichten homigen subd (Schichtungseffekt) oder bei “seltenen Merkmalsträgern”
Disproportionale Schichtung
Disproprtional: nicht dem Größenverhältnis der Gruppen in der Grundgesamtheit entsprechend
disproportionale Schichtung wird z.B gewählt, für VErgleiche zwsichen alten & neuen Bundesländern eine hinreichend große Stichprobe aus den neuen Ländern zu haben
Disproportionale Schichtung ( 4 Punkte)
Gesamtdeutschland = Regel wird verletzt, dass jedes Element in DE der Grundgesamtheit, die gleiche Chance haben muss in die Stichprobe zu kommen
d.h ma kann mit den Daten zwar Aussagen über Ost-und Westdeutschland, aber nicht für Gesamthdeutschlabd machen
Auswahlverfahrne für Stichproben (5 Punkte)
Listenauswahl: Verzeichnis sämtlciher Untersuchungseinheiten (Einwohnerliste der Meldeämter vom Gemeinden, Liste aller Telefoneinträge) Register notwenig
RDD-Methode: Generierung v. Telefonnummern durch Random-Digit_dialing
Lotterieauswahl: Stichprobe wird aus “Lostrommel” gezogen
Gebietsauswahl: Random-Route-Verfahren
—> Zufallsauswahl d´von Gebiten (Gemeinden)
—> Auswahl von Startadressen
—> Begehungsanweisung zur Auswahl einer Adresse (z.B erste Strasse rechts, nächtse liunks,,,
Wahrschienlichkeitsauswahl innerhlab des Haushalts: z.b Geburtstagsmethode (letzter Geburstag in Haushalt)
Praktische Probleme bei Zufallsstichprobe
Zufallsauswahl bei unvollständigen Verzeichnissen
Respondenten für Umfargeforschung
—> Auswahl Telefonregister #
—> Internetumfargen (Selektion Haushalte mit Anschluss)
—> Lesebefragung, Befragungen von TV Zuschauern oder untetr Hörern bestimmter Sender
Bei Dokumenten
—> PAtentanmeldungen: Stellen keine Zufallsauswahl aus alles Erfindungen dar
—> Kriminalitätsstatistik: nicht alle Delikte finden den gleichen Niederschlag in Polizeistatistik
—> Problem selektiver Stichproben
Probleme bei Zufallsauswahl (Auswahl & Durchführung)
Interviewfälschung:
—> bei Random Route, personenuaswahl, Interviewfälschung
Nonresponse-Problem:
—> Auschöpfunhsquoten oft <30%
—> Nonresponse in der Regel nicht zufällig
nicht Befragbare: Kranke, Sprachproblelme
Schwer Erreichbare: ungewöhnliche Arbeitszeiten,Mobile
Verweigerer: Misstrauen, politische Einstellung
Item-Nonresponse: bei Einkommen etw 25%
Bsp. Einkommensfrage Bevölkerung (soziale Ungleichheit = schwirig zu ermitteln 7 Datenerfassunf)
—> Problem selektiver Stichproben (Mittelschichtbias)
Wann ist eine selektive Stichprobe problematisch und wann nicht?
Problematisch, wenn:
Schließen von Stichprobe auf Grundgesamtheit (z.B durchschnittliche Einkommen ermittlen)=
bestimmte Phänomene quantifizieren möchte (z.B Anteil der regelmäßigen Theatergänger in der Bevölerung ermitteln)
Nicht (so unbedimgt) problematisch.´, wenn
Zusammenhangshypothesen teseten wollen (Varianz abbilden wollen) z:B je jöjer Einkommen desto größer die Wohnung oder je höher Bildung desto häufiger Theaterbesuche
“qualitative” Studie mit wenigen Tiefeninterviews durchführen
Repräsentativität (3 Punkte)
Schluss auf Grundgesamtheit ist nur bei Zufallsstichproben zulässig
nur bei Zufallsstichproben können mit den Mittlen (Inferez´nz-oder TEst-) Statistik Wahrscheinlichkeiten für Übertragbarkeit von Kennwerten (z.B Mittelwerte, Prozentsätz..) & Vertrauensintervalee brechnet werden
Schlüsse sind umso weniger fehlerbehaftet je größer Stichprobe ist
Repräsentativität und Ausfälle ( 3 Punkte)
Repräsentativitätsnachweise ( zeigt, dass bestimmte soziodeographische Merkmale (Alter..) der Stichprobe, denen der Grundgesamtheit entsprechen)
sagen NICHTS (oder wenig) über Verteilung anderer MErkmale aus
können nicht Repräsentativität hinsichtlich der eigentlich interessierennden Merkmale & Konstrukte (Religiösität) belegen
Problem haben auch Quotenstichproben
Repräsentativität und Ausfälle (3 Punkte)
methodisch korrekt gezogene Stichprobe; Verzerrungen können durch Ausfälle bei BEfragung auftreten
Zufällige Ausfälle haben keine Folgen für Qualität der Stichprobe (neutrale Ausfälle)
Probklematisch sind systemische Ausfälle, Ausfallursache hängt mit Untersuchungsgegenstand zusammen
Ausschöpfungsquote wegen systematischen Ausfällen wenig aussagefähig
hängt such von Fragestellung ab, ob Ausfall als neutraler Ausfall oder als systematischer Ausfall gewertet wird
Anstregungen bei Verweigerern & schwer anzutreffenden Personen, denn Verzerrungen des Ergebnisses hier am ehesten
Beispiele für Ausfälle (unit nonresponse) plus Gegenmaßnahmen
nicht gefundene oder falsche Adressen
Nichterreichbarkeit der Zielperson
Weigerung der Zielperson teilzunehmen
Krankheit der Zielperson (Nichtbefragbarkeit)
Gegenmßnahmen
Sorgfalt bei Stichprobenziehung/ Adressverwaltung
Sorgfältige Interviewschulung (z.B bzgl Kontaktaufnahme zur Zielperson
Incentivierung & Bereitstellung v Infomaterial
Last changed10 months ago