Parameter vs Statistik
Parameter
EIgenscahft der Population (MW, Zusammenhang)
unbekannt
Statistik
Eigenschaft der Stichprobe (MW, Zusammenhang)
Dient als Schätzer für entsprechende Populationsparameter
Stichprobenfehler
Statistiken weichen vom Parameter ab
Stichprobenfehler = Ausmaß dieser Abweichung
Stichprobenfehler bedeutet nicht, dass ein Problem mit der Stichprobe vorliegt
Unvermeindlich durch zufällige Unterschiede zwischen Sample und Population
Stichprobenfehler bedeutet nicht,…
Stichprobenverteilung
Definition: Verteilung der Statistiken vieler gleichartiger Stichproben aus der gleichen Population
Gehört zu den wichtigsten Konzepten der Inferenzstatistik
Entscheidend für Schätzung und Hypothesentest
Jeder Parameter hat eine Stichprobenverteilung!
Grenzwerttheorem
Stichprobenverteilung eines Parameters ergibt sich aufgrund des zentralen Grenzwerttheorems:
Multiple Stichproben -> symmetrische Stichprobenverteilung - unabhängig von ursprünglicher Verteilung
Mit steigender Stichprobengröße nähert sich die Stichprobenverteilung einer Normalverteilung an
Standardfehler (SE)
SE = Standardabweichung der Stichprobenverteilung
gibt an, mit welcher Streuung beim Ziehen multipler Stichproben zu rechnen ist
Abhängig von Stichprobengröße und Variabilität in der Population
kleine Stichproben bzw große Variabilität -> größerer SE
Prinzipiell unbekannt, kann aber auf Basis des Samples geschätzt werden (für jede Kennzahl)
textliche Darstellungsmöglichkeit
Mean value was 57,3 ( SE = 4,98)
survival rate was 71,3 % ( SE = 5,3%)
Grapfische Darstellung
Was bildet das ab?
den Standardfehler
Punkt vs Intervallschätzung
Schätzen
Ableiten eines wahrscheinlichen Werts für seinen Parameter aus einer Statistik (Schätzer)
Punktschätzung
Stichprobenstatistik als wahrscheinlicher Wert für den Parameter
Aber: Wegen Stichprobenfehler i.d.R. inkorrekt
Intervallschätzung
Berechnung eines symmetrischen Intervalls um den Schätzer, in dem der Parameter in einem vorgegebenem Prozenzsatz der Stichproben liegt (Konfidenzintervall)
Konstruktion von Konfidenzintervall
Wie bestimmt man die Endpunkte?
mit welchem Faktor muss SE multipliziert werden
Festlegung eines Konfidenzniveaus (Wie treffsicher soll Intevall sein, i.d.r. liegt wahre Parameter in 95 von 100 Intervallen)
Berechnung der Statistik sowie des Standardfehlers
Standardfehler mit einem bestimmten Faktor multiplizieren
Resultat von der Statistik subtrahieren bzw zu ihr addieren
Mit welchem Faktor muss der SE multipliziert werden?
Hängt vom gewünschten Niveau ab
Standardnormalverteilung: Schätzer liegt bei 95% der Fälle zwischen -1,96 und 1,96
Also -> Schätzer +-1,96 -> Enthält Parameter in 95% der Fälle
Ausnahme: Werte aus dem äußeren Bereich -> 5% der Fälle
Übertragung in jede andere Verteilung: 1,96 * SE
95% Konfidenzintervall für Mittelwerte: CI95 = x +- 1,96 * SE
Konfidenzintervalle
Einflussfaktoren auf die Breite des Intervalls
Stichprobe größer -> Intervall schmaler => verringert SE
Konfidenzniveau höher -> Intervall weiter => erhöht multiplikator
Was verringert den SE?
Hypothesentest
Prinzip
Grundprinzip vom Signifikanztest
Prinzip: Null hypothesis testing (H0)
Test ob die Schätzung mit einer unterstellten Hypothese vereinbar ist
typische Ho => Effekt/Beziehung/Unterschied = 0
Wenn Schätzung nicht mit H0 vereinbar -> signifikante Abweichung -> Effekt ist nicht 0
Grundprinzip
Stichprobenverteilung lässt sich verwenden, um die bedingte Wskt für das Auftreten einer Stichprobenstatistik bei gegebenen Populationsparameter zu berechnen
Grundüberlegung beim Signifikanztest
H0 = 0 -> H0 annehmen -> nicht signifikant
H0 nicht 0 -> H0 ablehnen -> signifikant
Grundlegende Schritte beim
Signifikanztest
Schritt 1 Ho bilden
Aussage über den Wert des Populationsparameters als Testgrundlage (Zusammenhang / Unterschied = 0; Nullhypothese muss nicht Null sein
Schritt 2 H1 bilden
Alternativhypothese formulieren (formal identisch zu Ho, Wert muss aber anders sein
Alternativhypothese kann gerichtet (größer/kleiner) oder ungerichtet (ungleich) sein
H1 ist die inhaltliche / theoretische Hypothese
Ablehnung H0 -> Unterstützung H1
Schritt 3 Signifikanzniveau
Ablehnung Ho wenn der Wert des Schätzers bei wahrer Ho sehr unwahrscheinlich ist -> sehr unwahrscheinlich = Ho < 5%
Signifikanzniveau wird selbst festgelegt, muss nicht 5% sein
je kleiner Signifikanzniveau, desto schwieriger ist es, die Ho zu verwerfen
Schritt 4 Berechnung
Berechnung der relevanten Statistik (MW, Cor, Regressionskoeffizient,..)
Berechnung zugehörigen Prüfwerts (Prüfstatistik) -> genutzt um Ho zu testen, in Praxis erledigt von Software
Je nach Analyseart verschiedene Prüfstatistiken mit anderer Prüfverteilung => Klassiker: Chi Quadrat, t, F
Schritt 5 Bewertung Signifikanz
Signifikanztest wird beurteilt -> Beurteilung der Auftretenswskt der Prüfstatistik auf Basis der Prüfverteilung
Schritt 6 Annahme / Ablehnung
Ho verwerfen, wenn θ im Bereich der Zurückweisung fällt ( θ|Ho < Signifikanzniveau) -> H1 gilt dann als unterstützt
Merksatz: If p ist low, the 0 must go
Signifikanzniveau Fehler 1. und 2. Art
Einsieitge vs zweiseitige Test
Statistische Power (Teststärke)
allgemeines
Anwendungsmöglichkeiten: A priori vs post hoc
Fähigkeit eines Tests, die Ho zurückzuweisen, wenn sie falsch ist
Inhaltlich: Ist ein in er Population vorhandener Effekt auffindbar?
1 - Betafehler
Konvention: Power sollte > 90 sein (Betafehler < 20%
Hängt ab von Effektstärke, Stichprobengröße, Signifikanzniveau
Anwendungsmöglichkeiten
Welche Fallen gibt es beim Signifikanztest
Nenne 3 große Kritikpunkte am Signifikanztest
Was passiert mit SE, wenn Stichprobe größer wird
Was passiert mit SE, wenn Stichprobe kleiner wird
Stichprobe größer -> Intervall schmaler -> Se kleiner
Stichprobe kleiner -> Intervall größer -> SE größer
Zuletzt geändertvor einem Jahr