Stichprobenziehung
Totalerhebung oder Zufallsstichprobe?
Totalerhebung
Mehrstufige Auswahlen
Geschichte Auswahlen
Klumpen Auswahl
aufwendig, teuer -> zb volkszählung
primary sampling units (Gemeinden); secondary sampling units (Haushalte)
Methode der Wahl bei großen Stichproben, Problem: Klumpeneffekte
Geschichte Auswahlen:
Informationen über Ausprägung v. Variablen existieren schon, hier werden stichpoben gezogen
Aus Pragmatik: natürliche Klumpen (PISA), Problem: bei niedriger Zahl von homogenen klumpen wird Präzisionder Schätzung geringer (besser:viele heterogene Klumpen)
Sampling error als Funktion der Populationsproportion
für jede stichprobe (k=100), größe von n=100)
unterschied zw. simulierten und wahren Proportionen am größten bei wahrer proportion von .05
Sampling error und stichprobenumfang (Formel)
Empfehlungen Stichprobenumfang
z.b. bei einer population von 100 000 brauch man eine stichprobe von 678 bei einem standardfehler von0.03 und einem ainteil von 0,8 bei dem zu interessierten merkmal
Anliegen und Funktionen v. Datenaufbereitung
Kodieren von qualitativen Daten
in quantitative
Umpolung
Umkodieren ovn negativ formulierten Items
Vermeiden von fehlerhaften Ergebnissen
Behandlung Extremwerte
Aggregierung
Berechnen von Skalen
Vermeidung von Schwierigkeinten bei Datenanalyse
Alle Werte, Labels, Schritte der Aufberetung dokumentieren
Vermeidung ethischer Probleme
Anonymisierug der Antworten bei Auswertung
Extremwerte
Fehlerquellen
Fehler in Erhebungsinstrument (falsche Antowrtkategorien
Reaktivität des Befragten
Irrtum durch Befragten
Interpretation des Fragebogens
Kommunikation zwischen Interviewer und Befragten
Bewusst falsche Auskunft von Befragten
Fälschung des Interviews durch interviewer
Technische Fehler bei Datenerfasung (z.b. einscannen)
Tippfehler bei Datenerfassung
Indentifikation von Fehlern
Wert außerhalb des gültigen Bereichs (z.b. alter: -21)
Wert außerhalb des realistischen Beriechs: Größe: 2,85m
Ungültiger fehlender Wert (keine Angabe im Pflichtfeld)
Inkonsisitenz innerhalb des Fragebogens (z.b. beim Einkommen: angabe persönlich und gesamtes Haushaltseinkommen unterschiedlich)
Ungültiger Wert trotz Filterführung (z.b. Angabe kinderlos, alter des Kindes: 9 J)
Widerspruch zu anderen Fällen (M: frau nimmt Pille, F: wir verhüten nicht)
Widerspruch gegenpber der Gesamtheit der Datenerhebung (Kidnergeldangabe)
Univariate Extremwerte (Turkey)
nach Turkey über Boxplot Kriterien indiziert:
Box= 25-75% (mittleren 50% der Daten) Perzentil der Verteilung (=Interquartilsbastand)
Whiskers= max. 1.5 Interquatilsabstand extremer als Box, jedoch oft bis zum letzten gültigen Wert
alles über 1.5: Ausreißer
Milde Ausreißer: 1.5-3.0
Extreme Ausreißer: >3.0
Ermöglciht visuelle Identifikation v. Ausreißern/Überblick Verteilung
Bivariate Extremwerte: Diagnostische Plots
Informationen in Residuen-Plots
Multivariate Extremwerte:
Mahalanobis-Distanzen
= Abstand zweier Punkte in einem n-dimensionalen Vektorraum on der SD-Metrik
Maß für multivariate Abweichungen wird Höhe des Zusammenhangs von Varibalen explizit berücksichtigt
Mathematisch = Entfernung eines Punktes von dem Centroiden geteilt durhc die Länge der Ellipse in der Richutng des Punktes
Punkte haben hohe Mahabolis Distanz, die weit außerhalb der Ellipse von Punkten liegen (Punkte die weit von den sonstigen wmpirischen Relationen abweichen= multivariate Ausreißer)
Behanldung von Extremwerten
Auschließen
sinnvoll wenn Wert außerhlab der gültigeni Ränge o. unplausibel ist
Trimmen
= spezialfall des Ausschließens
oberen und unteren X% der Verteilung werden vor Berechnung des Kennwertes ausgeschlossen
Winsorisieren
=Extremwerte auf Grenzen setzen (z.b. 95% KI)
sinnvoll wenn man exgrtemen Wert prinzipiell für valide und infromativ hält, aber nicht möchte dass er zu extrem ist (z.b. wegen Hebelwirkung o. Verletzung von Voraussetzung für Anaylse)
Fehlende Werte
Unit- und Item- Nonresponse & Response rate
Fomen Nonresponse:
Unit-Nonresposne: Person nimmt komplett nicht an Untersuhcung teil
Item-Nonresponse: Einzelne Items nicht beantwortet
Response Rate
proportion von Teilnehmern die aif Anfrage an Studie teilnehmen
Nicht Erreichbarkeit: Person wird wöhrend Feldphase nicht erreicht
Verweigerung: Perosn leht willkürlich ab teilzunehmen
wenn response rate sich zwischen soziodempgrafischen Gruppen untershciedet: evtl. Verzerrugen
Art der Befragung Auswirkungen auf response rate: face to face höher als telefon
teilnehmende mögen rationale kosten nutzen abwägungen vornehmen
Determinanten von Unit- Non-/Response
unter kontrolle der Forschenden
Thema
Adminsitrierung
Dauer
Aufbau/Design
Auswahlverfahren
Kontaktaufnahme
Auswahl/Eigenschaften der Interviewer
Vergabe Incentives
Außerhalb der Kontrolle
Umfrageklima Bevölkerung
Ökonomische Bedingungen
Charakterisitka Nachbarshcaft
Merkmale Haushalt
Urbanisierungsgrad
Item Nonresponse
oft nicht zufällig
Mögliche Gründe:
Kognitive Faktoren (z.b. Verständnis)
Motivationale Faktoren (Relevanz der Frage)
Sensitivität (zu privat)
Satisfycing (Fryagebogen wird nur bis zu gewissen Grad beantwrtet der als ausreichend erscheint)
Maßnahmen
Gut durhcdachter Gesamaufbau Fragebogen
Erläuterung dass keine Kontrollfragen gibt, allenfalls ähnliche Fragen zu bestimmten Themen
Bitte um vollständiges Ausfüllen, ausführung sonst schwierig o. incentives für vollständiges ausfüllen vergeben
einfache formulierungen
Verteilung fehlender Werte
Imputation fehlender Werte
Ziel Ersetzungen
so ersetzen dass sich Dichteverteilung von Varibalen untereinander nicht verändern
Korrelationen unter Variablen sollen sich nicht ändern
Methoden
u.a. multiple Regressionen auf Basis anderer Variablen; maximum Likelihood Imputation
Oft liefern Programme multiple Imputationen, sodass man geplante Analysen für alternative Imputaitonen durchfphren kann (k>20) und anschließend mittelt
Arbeit mit Gewichten
designgewichte
Auswhalgewichte werden angelegt, mit denen Strata gewichtet werden
typische Anwendung: Oversampling kleiner Strata (damit statistiken nicht von zu wenig Personen abhängen)
anschließend werden Statostiken dann runtergewichtet auf Populationsproportion
Bei stark ungleihcen Designgewichten resultieren große Standardfehler (zu starke unterschiede vermeidnen)
Wenn alle Auswahlgewochte gleich groß sind= slebstgewichtete Stichprobe
Nonresponse Gewichte
Annahme dass für Studienteilnahme 2 Stufen genommen werden müssne
1. studienteilnehmer mpssen erreicht werden, 2. überredet werden teilzunehmen
Formal: 2stufiges Selektionsvorgang, beoi dem Teilnahme über das Produkt von beiden Wahrscheinlichkeiten vorausgesgat werden
beide wahrscheinlichkeiten können unter bestimmten Annahmen geschötz werden
Kalibrierung
“Redressment”, “Benchmarking”
oft als 3. Schritt nach Anwenden von Desing und Nonresponse Gewichutngen vorgenommen
Ausgangslage/Informationsquelle sind Drittvariablen, deren verteilungen in Bevölkerung bekannt sind (z.b. Alter)
Verteilungen der Drittvariablen werden in Stichprobe automatisch schon wegen sampling eror abweihcen, selbst wenn andere gewichtungen erfolgeen
folgt dann eine weitere gewichtung mit dem ziel die verteilung der drittvariablen zu kompensieren
Effekte von Kalibierung
Wenn keine Nonresponse:
Kalibrierung gleicht zufallsschwankungen aus und verkleinert Schätzfehler
Wenn zusätzlich Nonresponse vorleigt:
Zusätzliche Korrektur analog Nonresponse-Gewichung
Bei Kalibrierung an vielen Benchmarks erhöht sich Varianz der Gewichte -> führt zu größerem Schätzfehler -> sparsam anwenden
Zuletzt geändertvor einem Jahr