Defintion von Teststärke und wie sie sich durch verschiedene Variablen verändert?
Wahrscheinlichkeit eines Tests, die Nullhypothese abzulehnen, wenn sie falsch ist.
Wenn die Alternativhypothese zutrifft, beträgt die Teststärke 1-ß.
Je größer Alpha desto größer die Teststärke.
Was isr die Teststaistik und was kann man über ihre Verteilung sagen?
Die Teststatistik ist ein statistischer Kennwert, der eine Aussage über den interessierenden Populationsparameter ermöglicht und den wir zum Test einer Hypothese berechnen.
Das enscheidende Kriterium für eine geeignete Teststatistik ist, dass ihre Verteilung unter der Nullhyopthese bekannst ist.
Erkläre ANOVA
eine Varianzanalyse
eine statistische Methode, mit dem man untersuchen kann, ob sich die Mittelwerte verschiedener Gruppen signifikant unterscheiden.
mehr als zwei Gruppen miteinander vergleichen
man betrachtet dabei verschiedene Varianzteile: Fehlervarianz und Effektvarianz
Grundidee der ANOVA ist die Annahme, dass Personen aus verschiedenen Gründen unterschiedliche Messwrrte erhalten können.
Begrifflichkeiten ANOVA
unabhängige Variable (UV) : Faktor
hat der Faktor Einfluss auf die AV
normalskaliert
verschiedene Ausprägungen des Fakotrs: Stufen
Gruppen die ich untersuche
abhängige Variable (AV)
intervallskaliert
Effekt: wenn sich die Mittelwerte der verschiedenen Gruppen unterscheiden
Vorraussetzungen für ANOVA
Varianzhomogenität
auch Homoskedastizität
Varainz für alle Faktorstufen gleich
Normalverteilung
beobachteten Werte innerhalb einer Gruppe normal um den Mittelwert verteilt
Unabhängigkeit
beobachteten Werte sind voneiannder unabhängig
ANOVA Berechnung
Gesamtvarianz besteht aus Fehlervarianz und Effektvarianz.
Wir wollen klären, ob ein Teil der Varainz durch den Faktor verursacht wurde.
Wir müssen anhand einer Stichprobe schätzen, ob die Effektvarianz >0 ist.
Effektvarainz können wir nicht einzeln schätze, sondern der Schätzer ist immer mit der Fehlervarianz vermischt —> MQA
Fehlervarianz können wir einzeln schätzen —> MQR
Wir führen einen F-Test durch um zu überprüfen, ob die MQA signifikant größer ist als die MQR :
Den erhaltenen Wert muss man mit dem kritischen Wert aus der F-Tabelle vergleichen (1-a)
Freiheitsgrade zum Nachschlagen:
und
ist der berechnete Wert gleich oder größer, dann H1 annehmen.
Nachteil der ANOVA
man weiß, dass sich die Mittelwerte unterscheiden, aber nicht welche
Dafür nutzt du eine Nachfolgeanaylse “Post-Hoc-Tests”
Kovarianz
Zusammenhangsmaß zur Darstellung linearer Zusammenhänge zwischen zwei Variablen.
wenn sich eine Variable verändert, dann die andere auch -> sie kovariieren miteinander
Summe der multiplizierten Abweichung von zwei Variablen, die durch die Anzahl der Freiheitsgrade geteilt wird
Korrelation
ob und wie stark zwei Variablen zusammenhängen
Lineare Regression
wir können eine Variable aufgrund einer anderen Variablen vorhersagen.
Kriterium (Variable) wird mithilfer eines Prädiktor (andere Variable) vorhergesagt
Multiple Regression
bei mehreren Prädiktoren
höhere Vorhersagengenauigkeit
Bayes Faktor
Verhältnis der Likelihoods von zwei Hypothesen.
drückt aus, wie viel Evidenz uns die Daten für eine der Hypothesen geliefert haben
welche Hypothese wahrscheinlicher ist
Eigenschaften:
Positivität
Reziprozität
Transitivität
Relativität
Evidenz
relative Vorhersagengenauigkeit von zwei Hypothesen
Was ist Basis der Bayesianischen Regression?
Bei der bayesianischen Regression vergleicht man mithilfe des Bayes-Fakotes statistische Modelle, die die Prädiktoren entweder erhalten oder nicht.
Bayesfakotr 1,7 interpretieren bei einem klinischen Test
Die Daten sind unter der Hypothese A 1,7 mal so wahrscheinlich wie unter Hypothese B.
T-Test berechnen
F- Test Formel erweiterung
Was ist schlecht an vielen T-Tests, warum sollte man ANOVA nehmen?
Wie hoch ist die Wahrscheinlichkeit im Beispiel einen alpha-Fehler zu machen?
Durch multiple Tests kommt es zu einer a-Inflation, also eine Kumulierung der Fehlerwarhscienlichkeit 1.Art
Wahrscheinlichkeit für a-Fehler: 1-(1-a)^m
m= Anzahl Tests
Nenne 3 Möglichkeiten um Teststärke zu erhöhen und bewerte diese
a-Niveau anpassen: Irrtumswahrscheinlichkeit unter der H0 erhöht sich
Effektstärke/Hypothese anpassen: würde bedeutetn, dass unser Test nicht mehr als Test der inhaltlichen Hypothese geeignet ist
Stichprobe anpassen: mit Poweranalyse bestimmen- beste Lösung
Was ist ein Nachteil an der bayesianischen Hypothesentestung mit dem Bayes Faktor?
Keine Lnagzeit-Fehlerkontrolle
Wie heißt der Begriff für den Umstand, dass Varianz zweier Gruppe gleich sind?
Wie lautet die Formel für df einer zweifaktoriellen ANOVA?
Df= N-pq
Was testet der globale F- Test?
Der globale F-Test testet ob mindestens einer unserer Prädiktoren einen signifikanten Teil der Varianz des Kriteriums vorhersagen kann.
P(H/D) ist proportional zu…
Die Posterior-Verteilung ist proportioal zu dem Produkt aus Prior und Likelihood
Was ist mit der Priorverteilung für einen Parameter gemeint?
Die Prior-Verteilung ist eine Wahrschienlichkeitsverteilung, die unsere Vorannahmen und Vorwissen über den Wert eines Parameters “Theta” ausdrückt.
Was ist Qstot? In welchem Teil wird sie in der einfaktoriellen ANOvA zerlegt?
QStot = Gesamte Variabilität der Daten, bestehend aus Variabilität zwischen Gruppe und die Variabilität innerhalb der Gruppe
Nennen Sie 3 Vorteile der bayesianischen Hypothesentestung gegenüber NHST.
BF kann relative Evidenz für oder gegen H0 oder H1 geben. p-Wert bei NHST kann nur Evidenz gegen H0 geben.
BF erlaubt die Antworrt auf unsere Frage, Wie wahrscheinlich sit meine Hypothese, gegeb meinern Daten?”; p-Wert kann nie Evidenz für Hypthese geben -> keine Interpretation
In der BF geht es um die Wahrschienlichkeit der beobachteten Daten unter beiden möglichen Hypothesen. Der p-Wert ist jedoch definiert als die Wahrscheinlichkeit, die beobachteten/ectremere Daten zu erhalten, gegeben, dass die Nullhypothese wahr ist. Das beudetet aber, dass der p-wert teilweise von Daten abhängt,welche nie beobachtetet wurden.
NHST häufiger da länger etabliert und Lngzeitfehlerkontrolle
Erkläre die Grundidee von NHST
Beim NHSt entscheiden wir, ob die H0 beibehalten werden kann oder verworfen wird. Der p-Wert ist das Hauptwerkzeug des NHST. P-wert ist dide Wahrscheinlichkeit, die beobachteten Daten zu beobachten, wenn die H0 wahr ist. Ist dieser größer als das vorher festgelegte Signifikanzniveau, können wir H0 nicht ablehnen. Ist er kleiner, ist das Ergebnis signifikant und wir lehnen H0 ab.
Wir interpretieren den p-wert nicht.
Wir schauen lediglich, ob der beobachtete Wert der Teststaistik im Rejektionsbereich liegt.
Was zählt zu den Voraussetzungen der linearen Regression?
Linearität
Homoskedastizität
Was ist die Korrelation und erkläre den Zusammenhang mit der linearen Regression?
Korrelation ist die standardisierte Kovarianz, also ein Maß für den Zusammenhang zwischen zwei Variablen, unabhängig von der Einheit.
Diesen Zusammenhang kann man für die lineare Regression nutzen, da man eine Variable aufgrund einer anderen Variable vorhersagen kann.
Was besagt der p-Wert ?
Wahrschienlichkeit den beobachteten Wert unter der NUllhypothese zu erhallten.
Nennen sie zwei zentrale Kritikpunkte des NHST?
Modus Tollens: Das Eintreten eines Ereignisses, das unter der Nullhypothese unwahrschienlich ist, führt nicht zwingend zum Schluss, dass die Nullhypothese falsch ist
Für einen sinnvollen statistischen Hypthesentest ist es notwendig, neben der Nullhypothese auch eine Alternativhypothese zu beachten
Nennen sie vier Komponenten, von denen der kritische Wert im NHST abhängt?
alpha
Ein-/Zweiseitig testen
Standardabweichung
Stichprobengröße
Was ist ein Fehler 2. Art ?
Wie verändert sich die Wahrscheinlichkeit eines solchen Fehlers in folgenden Situationen
a.) Fehlerwahrschienlichekti 1.Art vergörßert sich
b.) Effektstärke verringert sich
c.) statt zweiseitig wird einseitig getetstet.
Fehler 2. Art = H0 ist falsch aber wird fälchlicherweise beibehalten.
a.) Je größer a festgelegt wird, desto kleiner der kritische Wert der Teststaistik, wodurch die Wahrscheinlichkeit eines Fehlers 2. Art ebenfalls sinkt.
b.) Wenn die Effektstärke, also der Unterscheid zwischen H1 und H0 sinkt, vergrößert sich die Wahrshcienlichkeit ines Fehler 2.Art
c.) Wenn einseitg getestet wird, wird der kritische Wert kleiner. Dadruch sinkt die Wahrscheinlichkeit eiens Fehlers 2. Art
Welches Skalenniveau müssen die Daten beim Kruskal-Wallis Test mindestens haben?
Ordinalsklaiert
Welcher nichtparametrische Test wird für eine ANOVA mit unabhängigen Daten angewandt?
Kruskal-Wallis-Test
Was ist Likelihood?
Die Likelihood P(D/Theta) drückt aus, wie plausibel die beobachteten Daten D unter einem bestimmten Wert des Parameters Theat sind.
Zuletzt geändertvor 2 Jahren