==> je kleiner die Stichprobe, desto unsicherer sind die Ergebnisse
-Inferenz = Verallgemeinerung von Stichprobenkennwerten auf die Population
==> Mit welcher Sicherheit (confidence) können wir diese Verallgemeinerung auf Basis einer Stichprobe treffen?
-Populations-Parameter: „wahrer“ Wert in der Gesamtpopulation/Grundgesamtheit (unbekannt!)
-Schätzer: geschätzter Wert des Populationsparameters anhand einer Stichprobe
-Mögliches Vorgehen – aber sind diese wirklich repräsentativ?
o Hinweis auf die Studie auf der WiSo-Website? Vermutlich verzerrt, wenn nur die besonders interessierte, meinungsfreudige und/oder gelangweilt-surfende Studierenden teilnehmen
o Befragung von Freund:innen oder der heute anwesenden Statistik1–Teilnehmer:innen? Vermutlich verzerrt, da ihr Freundeskreis oder die heute Anwesenden nicht alle Gruppen von Studierenden abdecken
o Verwendung der Liste des sowi-baNewsletters? Vermutlich verzerrt, da erneut bestimmte Teilgruppen nicht erfasst sind
==> Alle eher ungünstig, da sie auf sogenannten Convenience-Stichproben beruhen
-Verzerrte Stichprobe liefern nicht zutreffende Ergebnisse für die Grundgesamtheit!
-SEHR häufig: Ergebnisse von verzerrten Stichproben in Medienberichten!!
==> Stichprobenziehung über das Studierendensekretariat
-Verfahren benötigen Auswahl aus der GG
-Das Studierendensekretariat führt eine Liste aller Studierenden
==> "Systematischer" Zufall zur Gewinnung einer repräsentativen Stichprobe
-Auch die Ergebnisse von unverzerrten Stichproben können fehlerhaft sein.
-Zum Beispiel bei Umfragen
o Nicht-Teilnahme (aka Unit-Nonresponse), z. B. vielbeschäftigte Manager
o fehlende Antwortbereitschaft (aka Item-Nonresponse), z.B. Einkommen, Alkoholkonsum
o Ungeeignete Fragen, z. B. altmodische Messung von Geschlechterrollen
o Fehlerquelle kann auch bei den Fragen liegen
-Andere Daten wie Registerdaten, Webdaten, ... können andere praktische Probleme haben, z. B. erfassen die Registerdaten der Bundesagentur für Arbeit zum Einkommen keine Beamten und Selbstständigen
o Zufallsstichprobe mit Hilfe eines systematischen Zufallsvorgangs
§ Alle haben die gleiche Wahrscheinlichkeit gezogen zu werden (Es reicht sogar, wenn jede/r der Population oder eine angebbare Wahrscheinlichkeit hat, Teil der Stichprobe zu werden) z.B. eingeschriebene Studierenden durchs Studierendensekretariat
§ Ziehung erfolgt nach einer ganz bestimmten Vorschrift z.B. jede 5. Person auf der Liste
o keine Personen oder Teilgruppe mit spezifischen Merkmalen wird systematisch ausgeschlossen
o Willkür: Bestimmte Leute haben bessere Chancen in unserer Stichprobe zu landen als andere (Beispiel: Internetbefragung – bspw. jüngere Leute) – stellt ein Problem dar
o Wenn jeder die gleiche Chance hat dann werden sich unsere Stichproben mehr oder weniger unterscheiden (mal hatten vielleicht mehr Frauen, mal mehr Männer das “Glück“ in der Stichprobe zu landen
o Manchmal werden für gleich Verteilungen Quoten vorgegeben. Das ist aber nicht unbedingt nötig – dann muss in der jeweiligen Gruppe jedes Element die gleiche Wahrscheinlichkeit haben in die Stichprobe zu gelangen
o Daher wird jede Stichprobe zu einem unterschiedlichen Stichprobenkennwert kommen – geben nicht immer den genau gleichen Wert an – Stichprobenvariabilität
==> Verschiedene Stichproben = verschiedene Kennwerte
-15 Stichproben, 15 verschiedene Anteile?!? - Ist das ein Problem? Jein:
o Dank des Zufalls gibt es keine systematische Verzerrung
o Aber wir müssen davon ausgehen, dass unsere Ergebnisse (zufällig) andere sind als in einer anderen Stichprobe
-Lösung:
o Der systematische Zufallsvorgang erlaubt es, Wahrscheinlichkeiten für bestimmte Kennwerte anzugeben (wie wahrscheinlich ist Stichprobenvarietät?)
-Eine Zufallsvariable nimmt Werte an, die das Ergebnis eines zufälligen (und theoretischen) Ereignisses sind
o i.d.R. werden sie mit Großbuchstaben bezeichnet, z.B. X
o Ein bestimmter Wert einer Zufallsvariablen wird mit dem entsprechenden Kleinbuchstaben bezeichnet, in diesem Fall x.
-Es gibt zwei Arten von Zufallsvariablen:
o Diskrete Zufallsvariablen können nur eine bestimmte Anzahl von Werten annehmen.
§ Beispiel: Würfelexperiment: 1,2,3,4,5,6
o Kontinuierliche Zufallsvariablen können einen beliebigen Wert (in einem bestimmten Intervall) annehmen
§ Beispiel: menschliche Körpergröße, prinzipiell 0-∞
-Die Wahrscheinlichkeit eines Ereignisses ist seine langfristige (n ==> Unendlich) relative Häufigkeit
-"Relative Häufigkeiten „stabilisieren“ sich bei „vielen“ Wiederholungen"
-Gilt für alle Zufallsprozesse
-"Qualitativ hochwertige Stichproben mit ausreichender Fallzahl sind ein gutes Abbild der Grundgesamtheit."
-Aber:
o Wir können nicht aus den Ergebnissen der Vergangenheit auf zukünftige Ergebnisse schließen
o Wahrscheinlichkeiten für bestimmte Ereignisse bleiben immer gleich ==> Beispiel: Lottogewinn wird nicht "fällig"
relative Häufigkeiten „stabilisieren“ sich bei vielen Wiederholungen
-ABER : All das gilt nur wenn unsere Stichprobe gut ist (ausreichend groß, zufällige Ziehung und keine Fehler)
-Praktisch kommt es oft zu Fehlern zum Beispiel wegen sogenannter “sozialer Erwünschtheit“, oder anderen technischen/praktischen Problemen
o Bspw. Misstrauen gegenüber Umfragen-Instituten bei Trump-Wählern
Praktische Implikationen des Gesetz der großen Zahl
Nicht-Implikationen des Gesetz der großen Zahl
-Das Gesetz der großen Zahlen bedeutet jedoch nicht, dass wir aus den Ergebnissen der Vergangenheit auf zukünftige Ergebnisse schließen können!
-Es gibt keinen kurzfristigen Ausgleich für frühere Abweichungen vom erwarteten Muster. Selbst wenn wir 999 Mal hintereinander Lotto gespielt und nichts gewonnen haben, erhöht sich die Wahrscheinlichkeit der "richtigen Zahlen" in der folgenden Woche nicht! Der Gewinn ist nicht "fällig"
-Wenn Sie jedoch tatsächlich unendlich lange spielen, wird Ihr Gewinn mit Sicherheit eintreten (P=1)
==> markierte Fläche sagt aus, wie wahrscheinlich es ist, dass bestimmte Werte in dem markierten Bereich auftauchen
-68-95-99,7-Regel: Die Flächen unter der Normalverteilung eine, zwei, bzw. drei Standardabweichungen nach links und rechts vom Mittelwert umfassen circa 68, 95 und 99,7 Prozent der Gesamtfläche unter der Normalverteilung
-Normalverteilung: Einenützliche, symmetrische, glockenförmige Wahrscheinlichkeitsfunktion, die durch ihren Mittelwert und ihre Standardabweichung eindeutig definiert ist.
-Standardnormalverteilung: Jede Normalverteilung N (𝛍,σ2) lässt sich eine Standardnormalverteilung (N(0,1) transformieren
-Jede Normalverteilung kann in eine sogenannte Standardnormalverteilung N(0,1) überführt werden mit
andere Darstellung:
Last changed5 months ago