undefined

Buffl

Emp. Manag. Forschung

by Felix S.

Parameter vs Statistik

Parameter

EIgenscahft der Population (MW, Zusammenhang)
unbekannt

Statistik

Eigenschaft der Stichprobe (MW, Zusammenhang)
Dient als Schätzer für entsprechende Populationsparameter

Stichprobenfehler

Statistiken weichen vom Parameter ab
Stichprobenfehler = Ausmaß dieser Abweichung
Stichprobenfehler bedeutet nicht, dass ein Problem mit der Stichprobe vorliegt
- Unvermeindlich durch zufällige Unterschiede zwischen Sample und Population

Stichprobenfehler bedeutet nicht,…

Stichprobenfehler bedeutet nicht, dass ein Problem mit der Stichprobe vorliegt
- Unvermeindlich durch zufällige Unterschiede zwischen Sample und Population

Stichprobenverteilung

Definition: Verteilung der Statistiken vieler gleichartiger Stichproben aus der gleichen Population
Gehört zu den wichtigsten Konzepten der Inferenzstatistik
- Entscheidend für Schätzung und Hypothesentest
Jeder Parameter hat eine Stichprobenverteilung!

Stichprobenverteilung

Grenzwerttheorem

Stichprobenverteilung eines Parameters ergibt sich aufgrund des zentralen Grenzwerttheorems:

Multiple Stichproben -> symmetrische Stichprobenverteilung - unabhängig von ursprünglicher Verteilung
Mit steigender Stichprobengröße nähert sich die Stichprobenverteilung einer Normalverteilung an

Standardfehler (SE)

SE = Standardabweichung der Stichprobenverteilung

gibt an, mit welcher Streuung beim Ziehen multipler Stichproben zu rechnen ist
Abhängig von Stichprobengröße und Variabilität in der Population
- kleine Stichproben bzw große Variabilität -> größerer SE
- Prinzipiell unbekannt, kann aber auf Basis des Samples geschätzt werden (für jede Kennzahl)
textliche Darstellungsmöglichkeit
- Mean value was 57,3 ( SE = 4,98)
- survival rate was 71,3 % ( SE = 5,3%)
Grapfische Darstellung

Was bildet das ab?

den Standardfehler

Punkt vs Intervallschätzung

Schätzen

Ableiten eines wahrscheinlichen Werts für seinen Parameter aus einer Statistik (Schätzer)

Punktschätzung

Stichprobenstatistik als wahrscheinlicher Wert für den Parameter
Aber: Wegen Stichprobenfehler i.d.R. inkorrekt

Intervallschätzung

Berechnung eines symmetrischen Intervalls um den Schätzer, in dem der Parameter in einem vorgegebenem Prozenzsatz der Stichproben liegt (Konfidenzintervall)

Konstruktion von Konfidenzintervall

Wie bestimmt man die Endpunkte?
mit welchem Faktor muss SE multipliziert werden

Wie bestimmt man die Endpunkte?

Festlegung eines Konfidenzniveaus (Wie treffsicher soll Intevall sein, i.d.r. liegt wahre Parameter in 95 von 100 Intervallen)
Berechnung der Statistik sowie des Standardfehlers
Standardfehler mit einem bestimmten Faktor multiplizieren
Resultat von der Statistik subtrahieren bzw zu ihr addieren

Mit welchem Faktor muss der SE multipliziert werden?

Hängt vom gewünschten Niveau ab
Standardnormalverteilung: Schätzer liegt bei 95% der Fälle zwischen -1,96 und 1,96
Also -> Schätzer +-1,96 -> Enthält Parameter in 95% der Fälle
Ausnahme: Werte aus dem äußeren Bereich -> 5% der Fälle
Übertragung in jede andere Verteilung: 1,96 * SE
95% Konfidenzintervall für Mittelwerte: CI95 = x +- 1,96 * SE

Konfidenzintervalle

Einflussfaktoren auf die Breite des Intervalls

Stichprobe größer -> Intervall schmaler => verringert SE
Konfidenzniveau höher -> Intervall weiter => erhöht multiplikator

Was verringert den SE?

Hypothesentest

Prinzip
Grundprinzip vom Signifikanztest

Prinzip: Null hypothesis testing (H0)

Test ob die Schätzung mit einer unterstellten Hypothese vereinbar ist
typische Ho => Effekt/Beziehung/Unterschied = 0
Wenn Schätzung nicht mit H0 vereinbar -> signifikante Abweichung -> Effekt ist nicht 0

Grundprinzip

Stichprobenverteilung lässt sich verwenden, um die bedingte Wskt für das Auftreten einer Stichprobenstatistik bei gegebenen Populationsparameter zu berechnen
Grundüberlegung beim Signifikanztest
- H0 = 0 -> H0 annehmen -> nicht signifikant
- H0 nicht 0 -> H0 ablehnen -> signifikant

Grundlegende Schritte beim

Signifikanztest

Schritt 1 Ho bilden

Aussage über den Wert des Populationsparameters als Testgrundlage (Zusammenhang / Unterschied = 0; Nullhypothese muss nicht Null sein

Schritt 2 H1 bilden

Alternativhypothese formulieren (formal identisch zu Ho, Wert muss aber anders sein
Alternativhypothese kann gerichtet (größer/kleiner) oder ungerichtet (ungleich) sein
H1 ist die inhaltliche / theoretische Hypothese
Ablehnung H0 -> Unterstützung H1

Schritt 3 Signifikanzniveau

Ablehnung Ho wenn der Wert des Schätzers bei wahrer Ho sehr unwahrscheinlich ist -> sehr unwahrscheinlich = Ho < 5%
Signifikanzniveau wird selbst festgelegt, muss nicht 5% sein
je kleiner Signifikanzniveau, desto schwieriger ist es, die Ho zu verwerfen

Schritt 4 Berechnung

Berechnung der relevanten Statistik (MW, Cor, Regressionskoeffizient,..)
Berechnung zugehörigen Prüfwerts (Prüfstatistik) -> genutzt um Ho zu testen, in Praxis erledigt von Software
Je nach Analyseart verschiedene Prüfstatistiken mit anderer Prüfverteilung => Klassiker: Chi Quadrat, t, F

Schritt 5 Bewertung Signifikanz

Signifikanztest wird beurteilt -> Beurteilung der Auftretenswskt der Prüfstatistik auf Basis der Prüfverteilung

Schritt 6 Annahme / Ablehnung

Ho verwerfen, wenn θ im Bereich der Zurückweisung fällt ( θ|Ho < Signifikanzniveau) -> H1 gilt dann als unterstützt
Merksatz: If p ist low, the 0 must go

Signifikanzniveau Fehler 1. und 2. Art

Einsieitge vs zweiseitige Test

Statistische Power (Teststärke)

allgemeines
Anwendungsmöglichkeiten: A priori vs post hoc

Fähigkeit eines Tests, die Ho zurückzuweisen, wenn sie falsch ist
Inhaltlich: Ist ein in er Population vorhandener Effekt auffindbar?
- 1 - Betafehler
- Konvention: Power sollte > 90 sein (Betafehler < 20%
Hängt ab von Effektstärke, Stichprobengröße, Signifikanzniveau
Anwendungsmöglichkeiten