-Grundgesamtheit (Population): Menge aller Untersuchungseinheiten, über die Aussagen getroffen werden sollen. Die Grundgesamtheit (GG) ist vor einer Untersuchung festzulegen
o Beispiele: Student:innen der UzK; Teilnehmer an der Statistik 1-Vorlesung, alle Personen mit deutscher Staatsbürgerschaft, alle europäischen Länder, Parteiprogramme deutscher Parteien
-Untersuchungseinheiten/statistische Einheiten: Objekte (kann alles sein), über die Daten erhoben werden (werden auch in der GG festgelegt)
Beispiel: Individuen, Nationen, Organisationen, Firmen, Städte, etc
-Merkmale: interessierende Eigenschaften der Untersuchungseinheiten
o Beispiel: Geschlecht, Alter, Einkommen, Anzahl der Kinder im Haushalt,...
-Stichprobe (oder Auswahl/ Sample): Teilmenge der Grundgesamtheit (nötig da sonst zu teuer oder unpraktikabel)
o Die Verwendung von Stichproben ist in den Sozialwissenschaften üblich
o Beispiel: Wahlprognose auf Basis einer Stichprobe von 1.000 Wählern.
o Manchmal ist die Teilerhebung zwingend erforderlich. Beispiel: Crashtests bei PKWs
-Wer: Fall i (irgendeiner)
o Oder auch: Untersuchungseinheit, Beobachtung - Das, worüber wir Aussagen machen wollen: z.B. Menschen, Länder, Tweets . . .
-Anzahl der (Gesamt-)Fälle: n
-Was: Variable X
o Eigenschaft der Fälle, die sich über die Fälle unterscheidet: z.B. Bildungsabschluss, Einkommen, Alter, links/rechts, Bevölkerungsdichte . . .
-In welcher Einheit: a
o z.B. Jahre, Euro, 0 - .. Jahre, Zustimmung von 0 bis 10, Menschen pro km2
-Welche Ausprägung: xi
o Ausprägung der Variablen X für Person i
==> Valide Prozente sind dagegen Prozente ohne Missings (gilt auch für Angaben in ganzen Zahlen)
- einfach alle Werte auflisten ist keine gute Idee
-Daher: Komplexitätsreduktion mittels Kennziffern und Visualisierungen der Verteilung einer Variablen
==> Wie kann man wesentliche Gesichts- punkte einer Variablen und ihrer Verteilung knapp und einleuchtend verdeutlichen?
-Variablen mit vielen Ausprägungen können nicht ohne Weiteres als Häufigkeitstabelle dargestellt werden
==> Zusammenfassung in Klassen
-ABER:
o Klassierung von Variablen bedeutet Informationsverlust
o Wahl der Klassengrenzen kann Ergebnisse beeinflussen und sollte begründet sein
§ Entscheidung: nach Ähnlichkeit der Ausprägungen
§ Entscheidung: gleiche Klassenbreite oder Abgrenzung nach benötigter Genauigkeit?
§ Entscheidung: beobachtete oder theoretisch Minimal- und Maximalwerte?
Zuletzt geändertvor 5 Monaten