Definition: Teststärke
Die Wahrscheinlichkeit eines Tests, die Nullhypothese abzulehnen, wenn sie falsch ist.
Wenn die Alternativhypothese zutrifft, beträgt die Teststärke 1-ß.
Je größer Alpha desto größer die Teststärke.
Was ist die Teststaistik und was kann man über ihre Verteilung sagen?
Die Teststatistik ist ein statisitscher Kennwert, der eine Aussage über den interessierenden Populationsparameter ermöglicht und den wir zum Test einer Hypothese berechnen.
Das entscheidende Kriterium für eine geeignete Teststaistik ist, dass ihre Verteilung unter der Nullhypothese bekannt ist.
Nenne 3 Möglichkeiten um die Teststärke zu erhöhen und bewerte diese.
Alpha-Niveau anpassen: nicht gut, die Irrtumswahrscheinlihekti unter H0 wird erhöht.
Effektstärke/Hypothese anpassen: Unsere statistischen Hypothesen spiegeln unsere inhaltlich motivierte Erwartung wider. Im Idealfall folgt eine statistische Hypothese aus der inhaltlichen und steht somit fest. Die statistischen Hypothesen anzupassen, um eine bestimmte Teststärke zu erreichen, würde bedeutet, dass unser Test nicht mehr als Test der inhaltlichen Hypothese geeignet ist.
Stichprobengröße: Beste Lösung (Poweranalyse)
Was ist ein NAchteil an der bayesianischen Hypothesentestung mit dem Bayes Faktor?
Keine Langzeit-Fehlerkontrolle
Nennen Sie 3 Vorteile der bayesianischen Hyptohesentestung gegenüber NHST. Was könnte ein Grund sein, weshalb trotzdem häufiger NHST verwendet wird?
BH kann relative Evidenz für oder gegen H0 oder H1 angeben. P-Wert bei NHST kann nur Evidenz gegen H0 geben
Die bayesianische Statisitk erlaubt die Antwort auf unsere Frage “wie wahrschienlich meine Hypothese, gegeben meinen Daten?”, p-wert kann nie Evidenz für Hypothese geben.
In der bayesianischen Hypothesentestung geht es um die Wahrscheinlichkeit der beobachtetetn Daten unter beiden möglichen Hypothesen. Der p-wert ist jedoch definiert als die Wahrscheinlichkeit, die beobachteten oder extremen Daten zu erhalten, gegeben, dass die Nullhypothese wahr ist. Das bedeutet aber, dass der p-wert teilweise von Daten abhängt, welche nie beobachtet wurden.
—> NSHT wird häufiger verwendet, da sie schon länger etabliert ist und Langzeitfehlerkontrolle hat.
Erkläre die Grundidee von NHST
Beim NHST entscheiden wir, ob die H0 beibehalten werden kann oder verworfen wird. Der p-Wert ist das Hauptwerkzeug. Er ist die Wahrscheinlichkeit, die beobachteten Daten oder extremeren zu beobachten, wenn die H0 wahr ist. Ist dieser größer als das vorher festgelegte Signifikanzniveau, können wir H0 nicht ablehnen. Ist er kleiner, ist das Ergebnis signifikat und wir lehnen H0 ab. Wir interpretieren den p-Wert nicht. Wir schauen lediglich, ob der beobachtete Wert der Teststaistik im Rejektionsbereich liegt.
Was besagt der p-Wert?
Wahrscheinlichkeit den beobachteten Wert oder einen extremeren Wert unter der Nullhypothese zu erhalten.
Nennen Sie zwei zentrale Kritikpunkte des NHST
Modus Tollens: Das Eintreten eines Ereignisses, das unter der Nullhypothese unwahrschienlich ist, führt. nicht zwingend zum Schluss, dass die Nullhypothese falsch sein muss.
Für einen sinnvollen statistischen Hypothesentest ist es notwendig, neben der Nullhypothese auch eine Alternativhypothese zu beachten
Nennen Sie vier Komponenten, von denen der kritische Wert im NHST abhängt
Alpha
Ein-/zweiseitig testen
Standardabweichung
Stichprobengröße
Was ist ein Fehler 2. Art? Wie verändert sich die Wahrschienlichkeit eines solchen Fehlers in folgenden Situationen:
a.) Fehlerwahrscheinlichkeit 1. Art vergrößert sich
b.) Effektstärke verringert sich
c.) statt zweiseitig wird einseitig getestet
Fehler 2. Art = H0 ist falsch aber wird fälschlicherweise beibehalten
a.) Je größer Alpha festgelegt wird, desto kleiner der kritische Wert der Teststaistik, wodurch die Wahrscheinlichkeit eines Fehlers 2. Art ebenfalls sinkt.
b.) Wenn die Effektstärke, also der Unterchied zwischen H1 und H0, sinkt, vergrößert sich die Wahrscheinlichkeit eines Fehlers 2. Art
c.) Wenn einseitig getestet wird, wir dder kritische Wert kleiner. Dadurch sinkt die Wahrschienlichkeit eines Fehlers 2. Art
Berechnung kritischer Wert: Formel
Zuletzt geändertvor 2 Jahren