Was ist der beta Fehler? (Fehler 2. Art)
Der beta Fehler, ist die Wahrscheinlichkeit (beta), die Null Hypothese fälschlicherweise beizubehalten, obwohl sie in der Population falsch ist.
Was ist der alpha Fehler? (Fehler 1. Art)
Der alpha Fehler, ist die Wahrscheinlichkeit (alpha), die alternativ Hypothese (H1) fälschlicherweise anzunehmen, obwohl in der Population die null Hypothese Gilt (H0)
Was ist Power inhaltlich?
Einfache Def:
Power ist die Wahrscheinlichkeit (1 - beta) die H0 uz verwerfen, wenn sie tatsächlich falsch ist.
also ist Power die Wahrscheinlichkeit, das unser Test einen bestimmten, in der Population vorhandenen Effekt auch findet.
Nuanced Def:
Power ist die theoretische Wahrscheinlichkeit (1 - beta), bei einer real existierenden Abweichung von H0 die richtige Entscheidung zu treffen — also H0 zu verwerfen.
Visuelle Def:
Die Power ist die Fläche unter der H1 Kurve, die in den Ablehnungsbereich von der H0 fällt (also außerhalb der kritischen Grenzen).
Wieos ist es falsch die inhaltliche Definition von Power über eine bestimmte H1 zu formulieren?
Der häufige Fehler ist, Power nur in Bezug auf eine spezifische H1 zu formulieren.
In der Realität gibt es jedoch, unendlich viele mögliche Alternativhypothesen (z.B basierend auf anderen Effekten), die alle zur Ablehnung von H0 führen könnten.
Der Test in der Praxis prüft: Passt unsere Stichprobe eher zu H0 oder zu einer bestimmten erwarteten Abweichung (oft formuliert als H1)?
Die Power hingegen beschreibt im Gedankenexperiment, wie oft wir insgesamt (über unendlich viele hypothetische Stichproben) eine korrekte Ablehnung von H0 erreichen würden, wenn tatsächlich ein Effekt in der Population existiert.
Sie umfasst dabei alle möglichen Werte der Teststatistik, die zur Ablehnung von H0 führen — nicht nur den einen Wert, der exakt unserer spezifischen H1 entspricht.
Power ist die theoretische Wahrscheinlichkeit, bei einer real existierenden Abweichung von H0 die richtige Entscheidung zu treffen — also H0 zu verwerfen.
Was ist der Kritische Wert alpha inhaltlich?
Der kritische Wert alpha, ist der Wert ab dem wir die H0 ablehnen und uns für die alternativ Hypothese (H1) entscheiden.
Welche Faktoren beeinflussen die Power? (5)
das alpha-fehler Niveau (signifikanzniveau)
bigger alpha = bigger power
die Effektgröße
bigger effekt size = bigger power
Stichprobengröße (N)
higher N = higher power
Varianz (sigma^2)
higher varianz = lower power
Richtung der Hypothese
one sided tests have more power than two sided
Wieso/Wie beeinflusst das Signifikanzniveau (alpha-Fehler Niveau) die Power?
Unser Kritischer-Wert wird anhand des alpha-Niveas festgelegt.
Beta ist die Fläche der H1 Verteilung, die links von dem Kritischem-Wert unter der H0 ist. Wenn alpha verändert wird, beeinflusst das also die Größe von beta, welches die Gegenwahrscehinöichkeit der Power (1-beta) ist.
ein kleineres alpha = ein größeres beta = kleinere Power (1 - beta)
größere Alpha = kleineres beta = größere Power (1 - beta)
Wieso/Wie beeinflusst die Effektstärke (d) die Power?
Die Effektst’rke d ist so zu sagen, wie weit die H1 und H0 Verteilungen auseinander sind. Wenn der Effekt größer ist, also die Mittelwerte der H0 und H1 Verteilungen weit auseinander sind, überlappen sich die Verteilungen weniger als bei einer kleineren Effektgröße.
Ein größerer d führt deswegen zu einer größeren Power.
Was ist die Effektgröße inhaltlich? und wie berechnet man sie?
die standartisierte Abweichung des Mittelwerts vom Hypothetischen Erwartungswert (mü0)
d gibt an wie groß in der Grundgesamtheit die Differenz von mü zum unter der H0 vorliegendem Wert mü0 in Einheiten der Standardabweichungen ist.
Wieso/Wie beeinflusst die Varianz (sigma^2) die Power?
Die Varianz beiinflusst wie breit die Verteilung verteilt ist. Eine kleinere Varianz bedeutet eine dünnere Verteilung, und daurch eine größere Power. Eine höhere Varianz bedeutet eine breitere Verteilung, und dadurch eine kleinere Power.
Varianz can durch die Stichprobengröße beeinflusst werden (mehr n = weniger Varianz)
Eine größere Varianz bedutet geringere Power
Eine kleinere Varianz bedeutet höhere power
Wie beeinflusst die Stichprobengröße (N) die Power?
Die Stichprobengröße beeinflusst wie breit die Verteilung ist.
Eine größere n bedeutet eine kleinere Varianz, da
Kleinere varianz, oder mehr n, bedeutet dünnere Verteilungen, und daher auch weniger Überlappung der Verteilungen, und größere Power.
Mehr n = Mehr Power
Was ist die Varianz Formel?
Wieso beeinflusst die Richtung der Hypothese die Power?
Beim ungerichteten Test wird die Teststärke geringer als beim gerichteten Test (bei gleichem α Niveau), weil die kritischen Bereiche auf beide Seiten verteilt werden (α/2 vs. α).
wenn alpha kleiner ist, wird beta größer, welches die Power kleiner macht, weil power = 1 - beta
Gerichtete Hypothesentests haben größere Power als ungerichtete.
Was bedeutet es dass die Fehler des ALMs paarweise unkorreliert, oder linear unabhängig sind?
Die Störung eines Datenpunkts liefert keine Information über die Störung eines anderen Datenpunkts.
Wie sind die Fehler des ALM verteilt?
“die Fehler sind multivariatnormalverteilt, haben Erwartungswert 0, und sind linear unabhängig, mit Varianzhomogenität”
Die Fehler des ALM sind multivariate normalverteilt, mit Erwartungswert 0, und der Varianz Sigma^2 * die Einheitsmatrix
dies sagt uns das die Variablen aller Fehlervariablen sigma^2 betragen, und dass die Kovarianzen aller Fehlervariablen Paar-weise Null sind
Damit haben wir die Varianzenhomogenität als auch die Paar-weise stochastische unabhängigkeit der Fehlervariablen ausgedrückt
Was bedeutet es dass die Fehler des ALMs Varianzhomogenität haben?
Die Streuung der Fehler ist für alle Beobachtungen gleich.
Welcher Wert hat die Power bei einer Effektstärke von 0? (+explanation)
bei einer Effektstärke von null (oder auch unter der H0) entspricht die Power dem alpha-Fehler Niveau (Alpha).
With an effect size of d = 0, the mean of the H1 curve, lies on top of the mean of the H0 curve. Beta ist the area of the H1 curve that is to the left of alpha, and the power is 1-beta (or the area of the curve right of beta). If the H1 mean lies on top of the H0 mean, the area right of beta (1-beta or power) is equal to alpha.
Was ist die ALM Formel? Und was sind die Variablen Inhaltlich?
𝑌
Y: Vektor der abhängigen Variablen (Beobachtungen)
𝑋
X: Designmatrix (enthält die Werte der unabhängigen Variablen)
𝛽
β: Parametervektor (unbekannte Koeffizienten, die wir schätzen wollen)
𝜀
ε: Fehlerterme (zufällige Abweichungen)
Was sind Schritte 1 bis 3 der 7 Schritte?
(0) Habe eine inhaltliche Forschungsfrage und Hypothese.
(1) Formuliere das ALM zur Fragestellung, und gebe die Designmatrix X und den Parametervektor beta an
(2) Passe das ALM an die Daten der Stichprobe an, d.h ermittle den Vektor der Parameterschätzer b.
(3) Formuliere das statistische Hypothesenpaar über eine Linearkombination von beta.
Was sind Schritte 4 und 5 der 7 Schritte?
(4) 1. Schreibe das Hypothesenpaaar in Form von psi.
gebe die Zahl psi0 konkret an
gebe den Koeffizientenvektor c an
c = (c1, … , cp)’ in psi = c1 beta1 + …. + cp betap
(5) Bereche den Schätzer psi Dach aus den Parameterschätzern b aus Schritt 2
Welche der 7 Schritte können/sollten vor der Datenerhebung vollzieht werden?
(1) Formuliere das ALM zur Fragestellung, und gebe die Designmatrix X und den Parametervektor beta an.
Wie (mit welcher Formel) wird Parameterschätzer b berechnet?
und wie berechnet man demzufolge Y-Dach (Hat Matrix)?
da
ist die Hat Matrix (plug in for b)
Was sind Schritte 6 und 7 der 7 Schritte?
(6) Stelle die Teststatistik t psi-Dach auf, und berechne Ihren Wert
(7) Bestimme den kritischen Wert
und wende die Entscheidungsregel an.
Wie schätzt man beta-Dach und Y-Dach in R?
solve() : berecnet die Inverse (z. B X^-1)
t(): transponiert die Matrizen (z.B X’)
%*% Matrix multiplication
Was ist der p-Wert Inhaltlich?
Der p-Wert, ist die Wahrscheinlichkeit das ein in der Stichprobe beobachtes Ergebniss durch Zufall entstanden ist.
Der p-Wert ist die Fläche unter der Verteilung der Teststatistik (z.B. T-Test) unter der H0 ab dem beobachteten Wert, oder extremer.
Was ist die Entscheidungsregel bei p-Werten?
verwirf die H0 falls p < alpha
Was ist ein Unterraum von Vektoren?
Der Raum der aus allen möglichen Linerkombinationen der von unseren Vektoren aufgespannt wird.
Was ist die t-Bruch Formel für psi Dach?
Was Bedeutet das H0~ t n-p am Ende der T-Bruch Formel
Unter der Annahme, dass die Nullhypothese wahr ist, folgt unsere Teststatistik der Student-t-Verteilung mit n−p Freiheitsgraden.
Das ist entscheidend, weil wir aus dieser Verteilung dann die kritischen Werte oder p-Werte ableiten, um zu entscheiden, ob wir H0 verwerfen.
Wie berechnet man die Teststatistik t?
Im t-Test nehmen wir unseren geschätzen Wert - den Erwartungswert unter der H0 / den geschätzten Standard Fehler (SE)
psi dach and psi 0 could also be written as mean of x - mü
Wie berechne ich die Teststatistik t psi-Dach?
(Wie berechnet man die Teststatistik t)
(Was ist der geschätzte Standardfehler von psi-Dach)
(Wie sieht die Formel am Ende aus?)
also, wir wissen wir den T-Test so berechnen
Wir nehmen unseren geschätzten Wert - den Erwartungswert unter der H0 und teilen es durch den geschätzen Standardfehler.
Psi-Dach ist unser geschätzer Wert, und beseht aus der Linearkombination c’b = c1b1 , … , cpbp
Die Geschätze Varianz von Psi-Dach:
Da der geschätzte Standard Fehler dir quadratwurzel von der geschäzten Varianz is, ist das unsere Formel um t psi-Dach zu berechnen:
Wann verwendet man eine T-Verteilung?
Wenn mann die Varianz/ den Schätzfehler nicht weiß oder man eine kleine Stichprobe hat.
Heißt eine Kovarianz von Null immer gleich null Korrelation?
Im algemeinen bedeutet 0 Kovarianz oder die unkorreliertheit, nicht die stochastische Unabhängigkeit.
Dies gilt nur, wenn die zwei Zufallsvariablen zusammen Normaverteilt sind!
Was ist die Verteilungsannahme von Y?
Was macht der Fehlervektor?
pg 49
Er gibt die Abweichung des Wertes jeder Person in der Stichprobe vom idealen ALM X β an
Was ist meine Forchungsfrage?
Wie wirken sich die Anzahl der besuchten Vorlesungsstunden und die Anzahl der eigenständig gelernten Stunden unabhängig voneinander auf die Punktzahl in der Statistikprüfung aus?
Was sind meine hypothesen?
H1:
Der Einfluss einer zusätzlichen Vorlesungsstunde auf die Prüfungsnote ist größer als der Einfluss einer zusätzlichen Stunde Lernen.
H0:
Der Einfluss einer zusätzlichen Vorlesungsstunde auf die Prüfungsnote unterscheidet sich nicht von dem Einfluss einer zusätzlichen Stunde Lernen
Modellgleichung und Modellannahme des ALM erklären:
Dass ist die Grundform des ALMs
wobei Epsilon aus unendlich großen Grundgesamtheiten von fiktiver “Personen“ besteht die dieselben Prädiktorwerte besitzen wie die i-te Person unserer Realen Stichprobe.
Der Fehlervektor epsilon ordnet jeder denkbaren Zufallsstichprobe von n Personen (w1,…,wn)
einen n-Dimensionalen Zahlenvektor zu, der die Abweichung des Wertes jeder Person in der Stichprobe vom idealen ALM X beta an.
Der Fehlervektor Epsilon ist ein Zuffalsvektor, der Multivariat Normalverteilt ist, mit Erwartungswert 0 und Kovarianzmatrix (Varianz) sigma^1 mal die Einheitsmatrix.
welches die Varianzenhomogenität (Varianzen überall sigma^2) und paarweise stochastische unabhängigkeit (Kovarianzen = 0; = 0 Korrelation) ausdrückt
Die Herleitung von b
wir können b = (X’X)^-1 X’Y herleiten,
in dem wir die Vektorgeometrie des ALM und den Bedingungen für den erwartungstreuen Vorhersage Vektor Y-Dach = Xb erklären, ergibt sich der Vektor der Parameterschätzer b.
Der Vorhersagefehlervektor E liegt orthogonal zu der Designmatrix X.
etwas ist orthogonal, wenn dass skalarprodukt = <x,y> (=) x’y =0
dadurch wissen wir, dass das Skalaprodukt aud der Designmatrix und dem Vorhersagefehlervektor null ist:
X’ E = 0 | wir wissen das E = Y - Y-Dach
X’ (Y - Y-Dach) = 0 | wir wissen das Y-Dach = Xb
X’ (Y - Xb) = 0
X’Y - X’Xb = 0
X’Y = X’Xb | da mann nich durch matrizen Teilen kann machen wir * die inverse
(X’X)^-1 X’Y = b
Modellgleichung und Modellannahme des ALM (Formeln)
die 2. Bedingungen für den erwartungstreuen Vorhersage Vektor Y-Dach = Xb erklären
Bed. 1
“Wir schätzen E(Y) durch den Vektor Y-Dach, derart, dass Y-Dach im Unterraum liegt, der von den Spalten der Designmatrix X aufgespannt wird.”
Easy:
Y-Dach liegt im Unterraum der von den Spalten der Designmatrix aufgespannt wird.
(Y-Dach ist eine Linearkombination aus den Spalten der Designmatrix, und den Koeffizienten b)
Bed. 2
“der Vektor der Vorhersagefehler E = Y−Yˆ ist orthogonal zu dem Unterraum, der von den Spalten der Designmatrix X aufgespannt wird. Damit ist er auch orthogonal zu jeder einzelnen Spalte von X”
der Vektor der Vorhersagefehler E ist orthogonal zu diesem Unterraum, und dadurch auch zu allen Spalten von X
because <X, Y> = X’ * Y
Post Hoc Poweranalyse erklären bei einem nicht signifikanten Ergebnis
so sieht die Funktion der Posthoc Poweranalyse aus:
Bei einem nicht signifikanten Ergebnis:
Wenn unsere Power zu niedrig war:
kann es sein, dass unser Test nicht robust genug war um einen Tatsächlich Effekt aufzudecken, obwohl wir in dieser Studie die Ho vorläufig beibehalten
Wenn unsere Power hoch war:
Nehmen wir an, dass es unwahrscheinlich ist, dass ein Effekt dieser Größe tatsächlich in der Population vorhanden ist, und dass wenn ein Effekt vorhanden ist, wir annehmen können, dass er kleiner ist
Last changeda month ago