Was ist eine Grundgesamtheit / Population?
=Objektmenge über die Aussagen getroffen werden sollen
=Menge aller statistischer Einheiten
Idealtyp: Vollerhebung —> idR nicht umsetzbar
Wichtig: Genaue Definition der Grundgesamtheit
Was ist eine Auswahlgesamtheit?
Für Stichproben zur Verfügung steheende Auswahlmenge
Was ist eine Stichprobe / Sample?
=Auswahl von Elementen der Grundgesamtheit
Teilerhebung aus forschungsökonomischen Gründen wichtig: Stichprobenziehung / Auswahlverfahren als systematisches Regelwerk
Auswahlverfahren:
zufällig (einfache und komplexe Zufallsauswahl)
bewusst
willkürlich
Was sind Erhebungseinheiten?
= Elemente der Population, die für die Stichprobe in Frage kommen
Fallzahl: N
Was sind Untersuchungs- bzw. Analyseeinheiten?
= Elemente der Population, um die es in der Studie geht
nicht immer identisch mit Erhebungseinheiten
z.B. Befragung von Arbeitskräften zu Arbeitsplätzen
Was sind Befragungspersonen, Befragte, Interviewteilnehmer im Rahmen einer Studie?
= Elemente der Stichprobe, die an der Studie teilnehmen
Fallzahl: n
Was wird unter der Repräsentativität von Stichproben verstanden?
Elemente der Grundgesamtheit müssen in der Stichprobe in derselben Zusammensetzung vertreten sein
Statistische Bedingung: Zufallsauswahl
Aber: Stichprobe kann niemals alle Merkmalsverteilungen einer Population repräsentieren
Statt “Repräsentativität” —> “Repräsentatives Abbild”
annäherndes Abbild der Population
Was sind Kennzeichen für die einfache Zufallsauswahl?
Auswahlwahrscheinlichkeit ist für alle Elemente der Grundgesamtheit größer als Null
—> Equal Probability Selection Method (EPSEM)
Auswahl erfolgt direkt in einem einstufigen Vorgang
Welche unterschiedlichen Formen im Rahmen der einfachen Zufallsauswahl gibt es?
Lotterieauswahl
Gebietsauswahl
Listenauswahl
Wie erfolgt die Lotterieauswahl im Rahmen der einfachen Zufallsauswahl einer Stichprobe?
Urne, Lostrommel
Systematisches Auswahlverfahren:
Zufallszahlenfunktion per Computer
Problem: ggf. keine Berücksichtigung von Mehrfachanschlüssen
Random Digit Dialing (RDD)
Problem: ggf. kein systematischer Aufbau
Wie erfolgt die Listenauswahl im Rahmen der einfachen Zufallsauswahl einer Stichprobe?
Spezielle Ausprägung der Lotterieauswahl
“Ziehe jedes n-te Element”
Wie erfolgt die Gebietsauswahl im Rahmen der einfachen Zufallsauswahl einer Stichprobe?
Listenauswahl per Einwohnermelderegister
“Random Walk” (random-route)-Verfahren:
= Zufallsweg nach Begehungsanweisung
Probleme Listenauswahl:
Aktualität der Register
Kooperation mit Gemeinden
Gebühren
Probleme Random Walk:
Ausgangsadresse nicht per Zufall
Gleichzeitige Adressermittlung und Befragung (bei standard random)
Was sind mögliche Probleme im Rahmen der Gebietsauswahl?
Was sind Kennzeichen für die komplexe Zufallsauswahl?
Auswahlwahrscheinlichkeit für alle Elemente der Grundgesamtheit NICHT identisch
Kein EPSEM
Bestimmte Form der Auswahl, die berücksichtigt werden
Welche verschiedenen Formen gibt es im Rahmen der komplexen Zufallsauswahl?
Klumpenauswahl
Geschichtete Auswahl (Schichtung)
Mehrstufige Auswahl
Was versteht man unter der Klumpenauswahl im Rahmen der komplexen Zufallsauswahl?
Zufällige Auswahl von Klumpen ("Clustern")
Ansammlung von Elementen der Grundgesamtheit
Verkleinerstes Abbild der Grundgesamtheit
Sinnvoll bei schwer erreichbaren bzw. unbekannter Grundgesamtheit
"Wie viel gibt es von dieser Art?"
Innerhalb der Klumpen Vollerhebung und Zufallsauswahl aller Elemente
Was versteht man unter der geschichteten Auswahl (Schichtung) im Rahmen der komplexen Zufallsauswahl?
Bewusste Selektierung und keine Zufallsauswahl
Zerlegung der Grundgesamtheit in Gruppen (=Schichten) anhand eines zentralen Merkmals der Fragestellung
Danach Zufallsauswahl für jede Gruppe —> Jedes Element gehört zu einer Schicht
Sinnvoll bei Fallzahlenproblemen kleinerer Gruppen
Was versteht man unter einer proportionalen bzw. disproportionalen Stichprobe im Rahmen der geschichteten Auswahl?
Proportionale Stichprobe
= anteilig zur Grundgesamtheit
Disproportionale Stichprobe
= nicht anteilig, mit Gewichtung arbeiten
Was sind Vorteile der geschichteten Auswahl im Rahmen der komplexen Zufallsauswahl?
Kostengünstig
Sehr genau
Was versteht man unter der mehrstufigen Auswahl im Rahmen der komplexen Zufallsauswahl?
Zufallsauswahl über mehrere Ebenen
1. Auswahl der Primäreinheiten
2. Auswahl der Sekundäreinheiten
3. Auswahl der Zielperson
Was sind Kennzeichen der bewussten Auswahl?
Subjektive Auswahl bestimmter Personen(gruppen)
Verallgemeinerung unmöglich und nicht angestrebt
Was sind Formen der bewussten Auswahl im Rahmen der Stichprobenziehung?
Auswahl typischer Fälle
Konzentrationsprinzip
Extremfälle
Schneeballauswahl
Quotenauswahl
Was versteht man unter der Auswahl typischer Fälle im Rahmen der bewussten Auswahl?
Auswahl nach relevanten Fällen für Fragestellung —> subjektiv
Was versteht man unter dem Konzentrationsprinzip im Rahmen der bewussten Auswahl?
Auswahl häufiger Fälle (in einem bestimmten Bereich)
Was versteht man unter der Auswahl von Extremfällen im Rahmen der bewussten Auswahl?
Ziel: Absteckung eines Merkmalsraums
Auswahl von Fällen, die Merkmale in extremer Form aufweisen
Was versteht man unter der Schneeballauswahl im Rahmen der bewussten Auswahl im Rahmen der Stichprobenziehung?
Startfall eröffnet ein weiteres Forschungsfeld
Verwendung:
Auswahl von Angehörigen seltenen Populationen / schwere Erreichbarkeit
Möglicherweise auch aufgrund mangelnder Charakterisika
Was versteht man unter der Quotenauswahl im Rahmen der bewussten Auswahl im Rahmen der Stichprobenziehung?
Auswahl aufgrund bestimmter Merkmale, die in der Stichprobe exakt (approximativ) in derselben Häufigkeit vorkommen wie in der Grundgesamtheit
Quoten entsprechen somit Merkmalsverteilung in Population
Fallauswahl durch Interviewer
Hauptanwendung in kommerzieller Marktforschung
Was sind Vorteile und Probleme der Quotenauswahl im Rahmen der Stichprobenziehung?
Vorteile:
Günstig
Schnelle Durchführung ohne großen Aufwand
Probleme:
Unbekannte Merkmalsverteilung in Population
Themenadäquate Quotierung ist unmöglich
Kaum Zufallsauswahl durch Interviewer
Weniger fälschungssicher
Was sind Kennzeichen der willkürlichen Auswahl im Rahmen der Stichprobenziehung?
Kennzeichen:
Merkmalsträger werden nach ihrer Verfügbarkeit ohne Systematik ausgewählt
Kein Zufall, kein Plan
Verallgemeinerung unmöglich bzw. nicht angestrebt
Was sind Probleme der willkürlichen Auswahl im Rahmen der Stichprobenziehung?
Fehler beim Design:
Objektivität, Reliabilität, Validität
Fehler beim Interview
Mangelnde Homogenität des Interviewers
Stichprobenausfälle:
Undercoverage / Overcoverage
Non-Response
Selektionsbias
Was versteht man unter “Undercoverage” im Rahmen von Stichprobenausfällen?
Untersuchungspopulation < / > Zielpopulation
bestimmte Elemente erscheinen nicht in einer Liste (bei Listenauswahl), obwohl sie erscheinen sollten (Undercoverage)
Elemente erscheinen obwohl sie nicht zur Grundgesamtheit gehören (Overcoverage)
Was ist ein Problem von Under- / Overcoverage im Rahmen von Stichprobenausfällen?
Nicht jedes Element hat gleiche Chance in die Zufallsauswahl zu gelangen
Was versteht man unter “Non-Response” im Rahmen von Stichprobenausfällen?
Ausfall durch Verweigerung und Nichterreichbarkeit
Ausschöpfungsquote normalerweise 50%-70%
Unit-non-Responsequote —> Gegenteil von Ausschöpfungsquote
Wie berechnet man die Ausschöpfungsquote im Rahmen der Stichprobenziehung?
Was versteht man unter “Selektionbias” im Rahmen von Stichprobenausfällen?
Zusammenhänge zwischen Variablen
z.B. bestimmte gesellschaftliche Gruppen sind bereiter für ein Interview als andere
Eher Verzerrungen bei Mittelwerten und Anteilen (Prozente)
Welche Lösungen gibt es um den Selektionbias im Rahmen von Stichprobenziehungen zu verringern?
Mehr Kontaktversuche
Bezahlungen
Geschenke
Gewichtung
Welche Arten von Gewichtungen gibt es um Rahmen der Gewichtung als Korrekturverfahren für die Stichprobenverzerrung?
1. Designgewicht aufgrund Stichprobenplan
2. Nachgewichtung (Redressment)
z.T. Kaschierung systematischer Verzerrungen
3. Gewichtung aufgrund von Hypothesen
Welches Verfahren wird oftmals angewendet um Stichprobenverzerrungen auszugleichen?
Panels stellen häufig gewichtete und ungewichtete Daten bereit
Last changed2 years ago