Buffl

(2) Datenstruktur, -aufbereitung und -bereinigung

MM
by Marceline M.

Gewichtung und Imputation

  • Gewichtung: Bei einer Gewichtung werden Ungleichheiten, die bei der Stichprobenziehung entstanden sind mathematisch wieder ausgeglichen, sodass die Stichprobe möglichst genau die Grundgesamtheit abbildet

    • Bsp.: Für den ALLBUS werden mehr Ostdeutsche interviewt, als es dem Bevölkerungsanteil entspricht – dies wird mathematisch so ausgeglichen, dass Ostdeutsche heruntergewichtet und Westdeutsche hochgewichtet warden

  • Imputation: Wenn Daten fehlen (Stichwort fehlende Werte) kann man versuchen diese Daten zu schätzen. Wenn das Einkommen nicht angegeben wurde, man aber weiß, dass das Alter, Geschlecht, die Bildung und die Berufserfahrung relevant für das Einkommen sind und man diese Angaben hat – dann kann man auf der Grundlage dieser Merkmale eine Schätzung über das Einkommen anstellen.

  • Sowohl Gewichtung als auch Imputation sind nicht unumstritten. Gerade bei der Imputation von Daten muss man sich immer vor Augen halten, dass man mit seiner Schätzung ja auch falsch liegen könnte und einen Wert einträgt, der gar nicht der Realität entspricht. Wenn man dieses Verfahren bei einer großen Anzahl von Fällen anwendet, kann es also möglicherweise zu größeren Abweichungen zwischen der Stichprobe und der Grundgesamtheit kommen

  • Die Gewichtung von Daten ist ein recht übliches Verfahren, aber auch hier gibt es KritikerInnen. Wenn man beispielsweise eine Telefonumfrage unter 1000 Personen durchführt und nur 5 Personen unter 30 interviewt (obwohl es gemessen am Bevölkerungsanteil 50 sein müssten), kann man die Antworten dieser Personen mit dem Faktor 10 gewichten – die Antwort eines unter 30- jährigen zählt dann 10 mal so viel. Aber sind die 5 Personen unter 30 die einen Festnetzanschluss haben überhaupt repräsentativ für die unter 30-jährigen?


Author

Marceline M.

Information

Last changed