Welche Aussage ist falsch?
A. Der zu schätzende Parameter der Grundgesamtheit ist unbekannt.
B. Der zu schätzende Parameter der Grundgesamtheit ist eine konstante Größe.
C. Die Schätzfunktion ist eine Zufallsvariable, deren Realisation abhängig ist von
der Stichprobe.
D. Das Konfidenzintervall ist ein Bereich, das den zu schätzenden Parameter mit
Sicherheit enthält.
E. Um eine erwartungstreue Schätzung zu ermöglichen, muß eine repräsentative
Stichprobe vorliegen
D (diese Aussage ist falsch!)
Man erhält (bei einer Irrtumswahrscheinlichkeit von 5%) nur mit 95%-iger Wahrscheinlichkeit aus der Stichprobe ein Konfidenzintervall, das den zu schätzenden Parameter enthält.
Welche der folgenden Aussagen bzgl. eines Konfidenzintervalls für μ ist richtig?
A. Je größer der Stichprobenumfang n ist, um so größer ist das Konfidenzintervall.
B. Je größer n ist, um so kleiner ist das Konfidenzintervall.
C. Die Breite des Konfidenzintervalls ist unabhängig von n.
D. Jedes Konfidenzintervall, das aus einer repräsentativen Stichprobe ermittelt
wird, enthält μ.
E. Der Stichprobenmittelwert ist unerheblich für die Bestimmung der Intervallgrenzen.
Lösung: B (je größer n, desto kleiner das Intervall)
großes n = präzisere Schätzung = ein kleines Konfidenzintervall
(Hinweis zu E: basierend auf dem Mittelwert werden die Intervallgrenzen berechnet.)
Wie muß der Stichprobenumfang n geändert werden, um den Standardfehler des Mittelwerts zu halbieren?
A. n muß ebenfalls halbiert werden.
B. n muß verdoppelt werden.
C. n muß vervierfacht werden.
D. Dazu ist ein Stichprobenumfang von der Wurzel aus 2n erforderlich.
E. n muß nicht gerändert werden, da der Standardfehler des Mittelwerts unabhängig von n ist.
Lösung: C (n muß vervierfacht werden)
Der Standardfehler des Mittelwerts ist
Dieser Fehler wird halbiert, indem man den Nenner verdoppelt. Weil der Stichprobenumfang unter einer Wurzel steht, ist 4n (statt n) erforderlich.
Mit Hilfe der t-Verteilung soll ein 2-seitiges Konfidenzintervall für den Erwartungswert μ gebildet werden. Welcher Parameter wird dafür nicht benötigt?
A. der Stichproben-Mittelwert x
B. die empirische Standardabweichung s
C. der Stichprobenumfang n
D. das Quantil n− 1;1− α / 2 der t-Verteilung
E. die Standardabweichung σ der Grundgesamtheit
Lösung: E (σ ist nicht notwendig)
Ein Blick auf die Formel (Julia welche Formel?) zeigt, dass alle Parameter, die unter A–D genannt werden, zur Bestimmung des Konfidenzintervalls notwendig sind.
σ der Grundgesamtheit (der ja meist unbekannt ist), wird durch die empirische Standardabweichung s geschätzt. Das ist der Vorteil der t-Verteilung!
Wovon ist die Breite eines Konfidenzintervalls für μ nicht abhängig?
A. vom Stichprobenumfang n
B. vom Stichproben-Mittelwert x
C. von der Irrtumswahrscheinlichkeit α
D. von der Variabilität der Meßwerte
E. davon, ob das Intervall 1-seitig oder 2-seitig ist
Lösung: B (Mittelwert)
Mittelwert = Mitte des Konfidenzintervalls, beeinflußt nicht die Breite (s. auch irgend ne andere Formel?)
Hinweise:
A/B: je größer n und je größer α, desto kleiner ist das Konfidenzintervall
D: je größer die Variabilität, desto größer das Intervall (Variabilität der Meßwerte wirkt sich aus auf σ bzw. s)
E: 1-seitige Intervalle sind unendlich breit, 2-seitige nicht
Wir nehmen an, daß die Körpergröße X erwachsener Frauen normalverteilt ist mit der Standardabweichung σ= 5 cm . Aus einer Stichprobe von 25 Frauen ergibt sich ein Mittelwert x = 168 cm . Damit läßt sich als 2-seitiges Konfidenzintervall zur Irrtumswahrscheinlichkeit α = 0,05 ermitteln:
A. [163cm ;173cm]
B. [158 cm ;178 cm]
C. [164 cm ; ∞[
D. [166 cm ;170 cm]
E. Dieses Intervall kann nicht bestimmt werden, da die empirische Standardabweichung nicht angegeben ist.
Lösung: D [166 cm ;170 cm]
ausnahmsweise ist σ der Grundgesamtheit bekannt
ergibt ungefähr 2; demnach ergeben sich die Grenzen 166cm und 170cm.
Hinweis: C = 1-seitiges Intervall
Der Erwartungswert einer Grundgesamtheit soll geschätzt werden. Welche Aussage
trifft zu?
A. Bei schief-verteilten Merkmalen ist die Schätzung über den empirischen Median
nicht erwartungstreu.
B. Bei symmetrisch verteilten Merkmalen ist die Schätzung durch den Median
zwar erwartungstreu, aber nicht konsistent.
C. Bei normalverteilten Merkmalen ergeben der Mittelwert und der Median einer
Stichprobe stets denselben Schätzwert.
D. Der Median liefert stets einen Schätzwert, dessen Abstand zum Erwartungswert
größer ist als der Abstand zwischen Mittelwert und Erwartungswert.
E. Der Median ist ebenso wie der Mittelwert erschöpfend
Lösung: A (Median ist bei schiefen Verteilungen nicht erwartungstreu)
Bei schiefen Verteilungen stimmen Mittelwert und Median nicht überein; deshalb wäre die Schätzung über den Median verzerrt.
Hinweis:
B: Nur bei symmetrischen Verteilungen ist diese Schätzung erwartungstreu und auch konsistent.
C: unsinnig, da zu großer Zufall
D: der geschätzte Median liegt nicht stets weiter weg vom Erwartungswert als der Mittelwert
E: weniger effizient als die Schätzung über den Mittelwert
A. Bei der Berechnung der empirischen Varianz wird durch n − 1 dividiert, damit die Schätzung erwartungstreu ist.
B. Die Schätzung der Standardabweichung durch die Wurzel aus der empirischen Varianz ist nicht erwartungstreu.
C. Bei der Berechnung der empirischen Varianz wird durch n − 1 dividiert, damit die Schätzung konsistent ist.
D. Die Schätzung der Standardabweichung durch die Wurzel aus der empirischen
Varianz ist konsistent.
E. Je größer der Stichprobenumfang n ist, desto genauer ist die Schätzung der Varianz.
Lösung: C (diese Aussage ist falsch)
Es wird nur wegen der Erwartungstreue, nicht wegen der Konsistenz durch n–1 dividiert (konsistent wäre die Schätzung auch bei der Division durch n).
In Beispiel 8.4 (Seite 196) erhält man für den Anteil weiblicher Medizinstudenten aus einer Stichprobe einen Schätzwert von pˆ= 0,435 und als 95%-Konfidenzintervall
[0,311; 0,559]. Was besagt dieses Intervall bezüglich des Anteils weiblicher Medizinstudenten in der Grundgesamtheit?
A. Dieser Anteil liegt mit Sicherheit zwischen den Werten 0,311 und 0,559.
B. Der Anteil liegt mit 95%-iger Wahrscheinlichkeit zwischen 0,311 und 0,559.
C. Der „weibliche“ Anteil ist mit einer Wahrscheinlichkeit von 2,5% geringer als
0,311.
D. Dieser Anteil ist mit einer Wahrscheinlichkeit von 2,5% größer als 0,559.
E. Es ist letzten Endes unbekannt, ob der zu schätzende Anteil innerhalb des Konfidenzintervalls liegt. Man weiß nur, daß das angewandte Verfahren – sofern seine Voraussetzungen erfüllt sind – mit 95%-iger Wahrscheinlichkeit ein Konfidenzintervall erzeugt, das den Anteil der Grundgesamtheit enthält.
Lösung: E
Man kann niemals sagen, daß ein Parameter „mit Sicherheit“ oder einer bestimmten Wahrscheinlichkeit innerhalb oder außerhalb des Konfidenzintervalls liegt. Dem Parameter haftet nämlich nichts zufälliges an; zufällig sind dagegen die Stichprobe und auch das aus ihr berechnete Konfidenzintervall. Richtig ist deshalb nur die Aussage E.
Bei Überlebensstudien treten oft zensierte Beobachtungen auf. Diese können mit einem Verfahren nach Kaplan und Meier ausgewertet werden. Welche Aussage ist richtig?
A. Die Gründe, die eine Zensur notwendig machen, sollten in keinem Zusammenhang zu den Endereignissen stehen.
B. Zensierte Beobachtungen haben keinerlei Einfluß auf das Ergebnis der Studie.
C. Bei der Kaplan-Meier-Methode werden zensierte Daten vollständig eliminiert.
D. Zensierte Beobachtungen sind vollkommen unproblematisch, solange der
Stichprobenumfang genügend groß bleibt.
E. Bei den Schätzungen nach der Kaplan-Meier-Methode werden zu jedem Beobachtungszeitpunkt gleich viele Beobachtungseinheiten berücksichtigt.
Lösung: A
Wenn zensierte Daten auftreten, hat man darauf zu achten, daß die Gründe in keinem Zusammenhang mit den kritischen Endereignissen stehen
B und D: Zensierte Daten sind problematisch, weil Information verloren geht und weil sie die Ergebnisse einer Studie verzerren können
C: Die Kaplan-Meier-Methode wertet soviel Information wie möglich aus
E: Leider reduziert sich der Stichprobenumfang mit wachsenden Zeitwerten
Zuletzt geändertvor 2 Monaten