Skalenniveaus: Was ist eine quasi-metrische Variable!?
• Eine Ordinalskalierte Variable die wir so behandeln als wäre sie metrisch
• Wird häufig bei Likert-Skalen verwendet
Wiederholung:
• Die Wahrscheinlichkeit eines Ereignisses ist seine langfristige (n ∞) relative Häufigkeit
• Relative Häufigkeiten "stabilisieren" sich bei "vielen" Wiederholungen • Gilt für alle Zufallsprozesse
Was ist eine Stichprobenkennwerteverteilung?
• Unsere Stichproben sind das Ergebnis von ZUFALLSPROZESSEN
• Verteilung der Stichproben-Kennwerte (Punktschätzer) von verschiedenen Stichproben
• Die "Stichprobenverteilung" nähert sich der Normalverteilung, je größer der Umfang n der einzelnen Zufallsstichproben
Was besagt der zentrale Grenzwertsatz?
Eigenschaften der Stichprobenverteilung von Anteilen
der Erwartungswert der Stichprobe ist der Anteil der Population
die erwartete Varianz ist = Populationsvarianz
Die Wurzel daraus nennt man STANDARDFEHLER
die Verteilung der Anteile kovergiert gegen eine Normalverteilung für n —-> ♾️ EGAL, wie die Ausgangsvariabke X verteilt ist
= Zentraler Grenzwertsatz
Standardfehler
• Der Standardfehler der Stichprobenverteilung besagt, wie weit einzelne Schätzungen "in typischer Weise" vom wahren Wert abweichen
Standardfehler hängt von der Streuung der Popilation und der Stichprobengröße ab
Formel:
Wir haben nur eine Stchprobe aus der Grundgesamtheit vorliegen
Idee: Punktschätzer um ein Intervall "erweitern"
• Das Intervall (=Konfidenzintervall) soll den unbekannten Populationsparameter mit hoher Wahrscheinlichkeit (Konfidenz) abdecken
Wie berechnet man ein Konfidenzintervall?
95%-Konfidenzintervall:
Abbildung Formel:
Abildung Konfidenzniveau & Standardfehler
Abbildung:
Wie interpretiert man ein Konfidenzintervall?
• Das Konfidenzintervall überdeckt mit einer Wahrscheinlichkeit von 95% den wahren Populationsparameter
• Aber: Eine Wahrscheinlichkeit von 5% besteht dafür, dass der wahre Populationsparameter außerhalb des Intervalls liegt
• Irrtumswahrscheinlichkeit
Wahrscheinlichkeitsinterpretation bezieht sich auf das Intervall
Konfidenzintervalle bei Stata:
Veränderung der Parameter und Auswirkung auf Konfidenzintervall
Die Standardabweichung der X-Variable wird größer.
• Breite des Konfidenzintervalls: Wird größer
• Begründung: Eine größere Standardabweichung führt zu einem größeren Standardfehler, was wiederum zu breiteren Konfidenzintervallen führt.
Der Standardfehler wird kleiner.
• Breite des Konfidenzintervalls: Wird kleiner
• Begründung: Ein kleinerer Standardfehler bedeutet weniger Unsicherheit über den geschätzten Mittelwert, was zu einem engeren Konfidenzintervall führt.
Die Stichprobengröße steigt.
• Begründung: Eine größere Stichprobengröße führt zu einem kleineren Standardfehler, was zu engeren Konfidenzintervallen führt.
Die gewählte Irrtumswahrscheinlichkeit wird von 5% auf 10% vergrößert.
• Begründung: Eine höhere Irrtumswahrscheinlichkeit (größeres α) führt zu einem kleineren kritischen Wert (z- oder t-Wert), was das Konfidenzintervall enger macht.
Die Grundgesamtheit (Population) wird größer.
• Breite des Konfidenzintervalls: Bleibt gleich
• Begründung: Die Größe der Grundgesamtheit hat keinen direkten Einfluss auf die Breite des Konfidenzintervalls, solange die Stichprobengröße und die Standardabweichung konstant bleiben.
Regressionskoeffizient für Gruppen
• Wie sieht der Effekt des Alters auf internetnutzung zwischen den Geschlechtern aus?
• Variable female: 0 = männlich, 1 = weiblich
Stata: Konfidenzintervall im Gruppenvergleich
Welches Konfidenzintervall ist besser?
90%, 95% oder 99%?
• Ob ein einzelnes konkretes KI den Wert der Population überdeckt, wissen wir nicht. Es gibt lediglich eine hohe Wahrscheinlichkeit, dass dies der Fall ist.
• Je größer das Konfidenzniveau (90%, 95%, 99%), desto größer das Konfidenzintervall (Sicherheit vs. Präzision)
• Je größer der Umfang der Stichprobe, desto kleiner das Konfidenzintervall (Kosten vs. Präzision)
Zusammenfassung
Zuletzt geändertvor 4 Monaten