Was ist die Stichprobenkennwerteverteilung?
Wahrscheinlichkeitsverteilung von Stichprobenkennwerten aus zufällig gezogener Stichprobe der Größe n
Was wird als Standardfehler bezeichnet?
Standardabweichung von Stichprobenkennwerteverteilung
• Bezieht sich auf Abweichung des Mittelwertes der gesamten Stichprobe im Gegensatz zur Standardabweichung, die sich auf die einzelnen Datenpunkte und deren Abweichung vom Mittelwert bezieht
° Formel: Standardabweichung / Wurzel aus n
Wie beeinflusst die größe der Stichprobe den Standardfehler?
Je größer die Stichprobe, desto kleiner der Standrdfehler (genauere Schätzung)
Theoretische Stichprobenkennwerteverteilung - Formerln Erwartungswert und Standardfehler
Was besagt der zentrale Grenzwertsatz?
Stichprobenkennwerteverteilung der Mittelwerte nähert sich mit zunehmender Stichprobengröße der Normalverteilung an, unabhängig davon, wie das Merkmal in der Population verteilt ist
Nenne die 4 Gütekriterien der Parameterschätzung
Erwartungstreue
Konsistenz
Effizienz
Suffizienz
Wann ist das Kriterium “Erwartungstreue” gegeben?
Erwartungstreue ist gegeben, wenn der Erwartungswert der Stichprobenkennwerteverteilung dem Parameter entspricht
Wann ist das Kriterium der “Konsistenz” gegeben?
… wenn sich der Stichprobenkennwert mit wahsender Stichprobengröße dem Parameter nähert
Wann ist das Gütekriterium der “Effizienz” gegeben?
… wenn der Stichprobenkennwert den geringsten Standardfehler aller erwartungstreuen Schätzer aufweist
Wann ist das Kriterium der “Suffizienz” gegeben?
… wenn der Stichprobenkennwert alle in den Daten erhaltenen Informationen hinsichtlich des Parameters berücksichtigt
Was ist die Annahme der Nullhypothese?
Annahme, dass in der Population kein Effekt (z.B. Gruppenunterschied) besteht (nach Fisher)
Was sind potenzielle Fragestellungen für den Nullhypothesentest?
Wie wahrscheinlich wäre es, bestimmte Effekte in Stichproben (mit bestimmter Größe) empirisch zu finden?
(—> Stichprobenkennwerteverteilung )
Welche empirisch gefundenen Effekte wären so unwahrscheinlich, dass sie GEGEN die Nullhypothese sprächen?
(—> Entscheidung anhand eines Signifikanzniveaus)
Was ist der p-Wert?
Wahrscheinlichkeit, ein empirisches Ergebnis (oder ein noch stärker gegen die Nullhypothese sprechendes Ergebnis) unter der Nullhypothese zu finden.
Je kleiner die Wahrscheinlichkeit p, desto eher spricht das Ergebnis gegen die Nullhypothese.
Heißt auch “Überschreitungswahrscheinlichkeit”
Zwei mögliche Fehlinterpretationen des p-Wertes?
Wahrscheinlichkeit, mit der die Nullhypothese wahr ist
—> nicht p-Wert sondern A Priori Wahrscheinlichkeit P (H0)
Wahrscheinlichkeit für die Gültigkeit der Nullhypothese, gegeben die Beobachtung eines bestimmten empirischen Ergebnisses
—> nicht p-Wert, sondern A Posteriori Wahrscheinlichkeit
Was bedeutet die Irrtumswahrscheinlichkeit Alpha?
Wahrscheinlichkeit, mit der ein Test ein “signifikantes” Ergebnis zeigt, obwohl in Wirklichkeit die Nullhypothese zutrifft
(Auch “Fehler erster Art”)
definiert als Flächenanteil unter der H0-Kennwerteverteilung
A Priori von Forschenden festgelegt
Was ist ein Konfidenzintervall?
Bereich um einen geschätzten Populationsparameter, für den gelten soll, dass er mit einer Wahrscheinlichkeit von 1-alpha den Stichprobenparameter enthält (überdeckt)
Wird anhand des (geschätzten) Standardfehlers berechnet
Was besagt der Konfidenzkoeffizient (1 - alpha) von 0.95 ?
wenn man (unendlich) viele Zufallsstichproben gleicher Größe aus der Population ziehen würde und
für jede Stichprobe das KI berechnen würde
in 95% aller KI der unbekannte Populationsparameter zu finden ist
in 5% der KI hingegen nicht
Was sind 4 Unterscheidungsmerkmale statistischer Tests?
Exakte vs. asymptotische Tests
Parametrische vs. nonparametrische (verteilungsfreie) Tests
Robuste Verfahren
Resampling Verfahren
Was unterscheidet einen exakten und einen asymptotischen Test?
Exakter Test
Prüfgröße folgt exakt der zugrundeliegenden Verteilung
Asymptotischer Test
Prüfgröße folgt der zugrunde gelegten Verteilung asymptotisch, Verteilung nähert sich also mit zunehmender Stichprobengröße an
Je kleiner die Stichprobe desto größer der zu erwartende Fehler
Beispiel: t-Test für unabhängige Stichproben
Was sind Voraussetzungen für t-Test für unabhängige Stichproben?
2 unabhängige Stichproben
normalverteilte Variablen in den zugrundeliegenden Populationen
Varianzen der Variablen innerhalb der beiden Populationen sind gleich (# Homoskedastizität)
Was unterscheidet parametrische und non-parametrische Tests?
Parametrische Tests
setzen Voraus, dass das Merkmal in der Population in spezifischer weise verteilt ist (und die Verteilung anhand entsprechender Parameter beschrieben werden kann)
Non-parametrische Tests
erfordert nicht, dass eine konkrete Verteilung des Merkmals bekannt ist
Was sind robuste Verfahren?
Verfahren, deren Ergebnisse nicht oder nur wenig von Ausreißern beeinflusst werden
Sinnvoll, wenn Ausreißer nicht eindeutig auf Fehler zurückgeführt oder ausgeschlossen werden können
Verfahren, die auf dem Median basieren sind robuster als Verfahren, die auf dem Mittelwert basieren!
Achtung! Robustheit eines Verfahrens ist was anderes:
(= das Verfahren reagiert nicht stark auf Verletzungen seiner Annahmen)
Was sind Resampling verfahren?
aus vorliegender Stichprobe werden erneut Stichproben gezogen
Ziel: Verteilung der Prüfgröße oder Stichprobenkennwerde empirisch bestimmen
erfordert leistungsfähige Computer
2 Ansätze: Bootstrapping + Rerandomisierung
Non-parametrisches Bootstrapping
Bootstrapping ist ein statistisches Verfahren, bei dem aus einer Stichprobe erneut viele Stichproben gezogen werden, von denen Statistiken, wie beispielsweise Mittelwert oder Standardabweichung, berechnet werden. Dies erlaubt es uns, die Präzision von Schätzungen für Parameter zu bestimmen. Es ist besonders bei kleinen Stichproben nützlich.
Bootstrapping gehört zu einer größeren Klassen von Verfahren, die empirische Verteilungen durch die erneute Stichprobenziehung aus dem ursprünglichen Datensatz aufstellen, die Resampling Methoden. Wichtig ist, das meist mit Zurücklegen gezogen wird, d.h. in einer Stichprobe kann ein Wert mehr als einmal vorkommen, wie in der Abbildung unten.
Parametrisches Bootstrapping
hier sit der Verteilungstyp in der Population bekannt, nicht aber die Parameter der Verteilung
Man erzeugt also eine simulierte Population mit geschätzten Parametern und führt Bootstrapping durch
Wie funktioniert die (Re-)randomisierung mit Monte-Carlo-Schätzer?
Hat man z. B. 30 Personen in jeder
Therapiebedingung, erhält man ( nach Gleichung F 7.4 )
schon 118.264.581.564.861.424 mögliche Aufteilungen.
In einem solchen Fall reduziert man den Rechenaufwand,
indem man den p-Wert anhand einer Zufallsstichprobe
aller möglichen Aufteilungen schätzt. Dies
ist ein sog. Monte-Carlo-Schätzer, auf den auch bei
anderen exakten Tests zurückgegriffen wird, wenn die
betrachteten Kombinationsmöglichkeiten zu groß sind.
Fehlende Werte: Missing Completely at Random (MCAR)
Ob der Wert fehlt oder nicht hängt weder von der betrachteten Variablen selbst (Y) noch von anderen erfassten variablen (X) ab.
Am wenigsten Problematisch, weil komplett unsystematisch
Fehlende Werte: Missing at Random (MAR)
schon problematischer als MCAR, lässt sicher aber noch angemessen berücksichtigen
Fehlende Werte: Missing Not at Random (MNAR)
problematisch, mit gängigen Verfahren nicht in den Griff zu bekommen
Was ist ein Stichprobenfehler?
Ein Fehler, der dadurch zustande kommt, dass man eine Stichprobe zieht, die nicht alle Elemente der Population enthält
Wie verlaufen inhaltliche Auswahlstrategien statistischer Tests?
Fragestellungen:
Wie viele Variablen werden betrachtet?
Werden ungerichtete oder gerichtete Zusammenhänge betrachtet?
Werden nur manifeste oder auch latente Variablen betrachtet?
Welches Skalenniveau haben betrachtete Variablen?
Last changed10 months ago