Wie heißt der unabhängige t-test auf englisch?
two-sample t-Test
Wofür ist der unabhängige t-Test geeignet?
Ist ein statistischer Test, zur Überprüfung ob es einen Unterschied zwischen zwei Gruppen gibt
Grundlage für Nullhypothese
Werden zwei Stichproben aus zwei Population gezogen, lässt sich mit dem t-Test unabhängiger Stichproben überprüfen ob beide Srichproben aus Population stammen, deren Parameter μ1 & μ2 identisch sind
Wie lautete die Nullhypothese
H0: μ1 = μ2 => μ1 - μ2 = 0
Arbeitshypothese
H1: μ1 ≠ μ2 => μ1 - μ2 ≠ 0 (ungerichtet)
H1: μ1 >/< μ2 => μ1 - μ2 >/< 0 (gerichtet)
Wie wird die unabhängigkeit der Stichproben formal definiert?
P (A|B) = P(A)
Doch die Populationswerte μ1 & μ2 sind unbekannt, womit rechnen wir dann?
wir schätzen mit den Stichprobenkennwerten x1 & x2
bzw. die Mittelwertsdifferenz (x1 - x2) als Indikator für einen Unterschied
Liegt ein systematischer Unterschied vor sollte auch die wahrscheinlichkeit der Mittelwerte hoch sein
Was ist also die Formel der Teststatistik für unabhängige t-Test & warum/ wie kann man sie vereinfachen?
Verinfacht gesagt (unter berücksichtigung der Nullhypothes H0: μ1 - μ2 = 0):
Wie kommt der untere Term der Formel zustande?
Standardfehler der Differenz lässt sich nicht berechnen, weil Populationsvarianz nicht bekannt ist
-> Allerdings kann man über die vorliegende Stichprobe schätzen, Sind diese entnommenen Varianzen gleich, ist es sinvoll Varianz aufgrund der Daten aus beiden Stichproben zu berechnen
Was besagt das Varianz-Summengesetz I (Bienaymé-Gleichung)?
= die Varianz der Summe unkontrollierter Zufallsvariablen ist die Summe der Varianz der Zufallsvariable (Unkontrolliertheit der Varianz wird vorrausgesetzt)
-> dies gilt nur bei gleich großen Stichprobenumfängen & ungefähr gleich großen Standardabweichungen (Varianzhomogenität)
Standardfehler der Differenz berechnen bei ungleichen Stichproben (n1 ≠ n2)
-> Es handelt sich um Varianz, daher gewichtet man über die
Freiheitsgrade & erhält damit die gepoolte Varianz (sp)
Gepoolte Standardabewichung (sp)
(bei gleiche großen Stichproben)
Wie erhalten wir eine Aussage über die Stärke des Effekts? und was ist die Voraussetzung für die Berechnung?
-> Um eine Aussage über die Stärke des Effekts zu erhalten, wird Cohen’s d berechnet
-> die gemeinsame Streuung die benötigt wird ist sp
Kategorien der Effektstärke nach Cohen (d)
-> Cohen Wert bedeutet, dass die Zahl ca. den Standardabweichungenzwischen den Gruppen entspricht
Kleiner Effekt d = 0.2
= kleiner, aber erkennbarer Effekt
Mittlerer Effekt d = 0.5
= gut sichtbar und bedeutsamer Effekt
Großer Effekt = 0.8
= Dieser Effekt ist stark und deutlich sichtbar
Was ist G-Power und wofür kann es verwendet werden?
G-Power ist eine Berechnungssoftware
Wir verwenden es um:
Post-hoc vorhandene Testergebnisse zu berechnen
A-priori den Nopt zu berechnen
(dafür benötigen wir d, ß, α)
Was machen wir wenn die Standardabweichungen beider Gruppen unterschiedlich sind?
Und von wem kommt der Vorschlag?
Glass
schlägt vor, dass dann nicht auf die gepoolte Standardabweichung zurückgegriffen wird, sondern auf die Standardabweichung der Kontrollgruppe
-> Standardabweichung der Kontrollgruppe wurde nicht durch Intrevention beeinflusst (Glass Delta) (ähnliche
Effektstärkenmaße wie bei Cohen
Voraussetzungen für einen unabhängigen t-Test
& häufige Fehler bei der Überprüfung
Beide Stichproben sind einfache voneinander unabhängige Zufallsstichproben
Die Varianzen der zu vergleichenden Populationen sind gleich
Normalverteilung des Merkmals in der jeweiligen Population
-> häufiger Fehler bei Überprüfung der
Normalverteilungsvoraussretzung :
gesamte Daten auf N (μ, σ) getestet, statt auf N(μ1, σ1) &
N(μ2, σ2)
Vorgehensweise bei Anwendung eines t-Tests
Welches Verfahren prüft die Varianzhomogenität & wie interpretiert man die Ergebnisse
-> Levene-Test (F-Wert)
-> Ist er siginifikant wird die H0 (Varianzen sind homogen) verworfen
Wie interpretiert man die Ergebnisse des Levene-Test?
Die signifikanz des Levene Tests wird mithilfe des Signifikanzniveaus (α) bestimmt
-> Ist F größer als α wird die H0 beibehalten
-> Ist F kleiner oder gleich α lehnen wir die H0 ab
Was eignet sich besonders um Mittelwertsunterschiede darzustellen?
Und was sollte umbedingt mit eingezeichnet werden?
Balkendiagramme (neben Liniendiagrammen)
Ki sollte umbedingt mit eingezeichnet werden
Wie gibt man mittelwert und Standardfehler APA konform an?
(M = 102.33, SE = 4.56)
Was geht aus Monte-Carlo-Studien hervor?
t-Tests für unabhängigr Stichproben reagieren robust auf Verletzungen seiner Voraussetzungen
Wann nennt man ein Testverfahren robust?
-> wenn es nicht sensibel auf Ausreißer reagiert
-> wenn er trotz Voraussetzungsverletzung richtig entscheidet
Was bedeutet die Robustheit eines t-Tests?
Rebustheit besonders, wenn gleich große Stichproben aus ählichen, möglichst eingipfligen-symmetrisch verteilten Grundgesamtheiten verglichen werden
Sind Stichprobenumfänge sehr unterschiedlich, wird Präzoson t-Test nicht beeinträchtigt, wenn Varianzen gleich sind
Sind weder Stichprobenumfänge noch Varianzen gleich, ist mit erheblich höheren Prozentsatz an Fehlentscheidungen zu rechnen
Was ist das Problem inhomogener Varianzen?
Und wann sind die Konsequenzen besonders gravierend?
Fällt bei ungelichen Gruppengrößen gravierender aus
-> progressive Entscheidung: Schluss auf Unterschiede die faktisch nicht vorhanden sind
Wer beschreib das Problem des t-Tests mit inhomogenen Varianzen?
Behrens-Fisher
Welche Lösung schlug Welch für inhomogene Varainzen vor?
sx ̄1 −x ̄2 anders berechnen
Freiheitsgrade modifizieren
Was ist die H0 des Levene-Tests UF Varianzhomogenität bezogen?
H0: Varianzen sind homogen
-> Signifikantes Ergebnis bedeutet als Ablehnung der H0
Gibt es Einigkeit über die beste Lösung des Behrens-Fisher Problem
-> Nein
Der Vorschlag von Welch ist nur einer von mehrern, den t-Test bei vorliegender heterogenität der varianz zu modifizieren
Wann muss auf die Interpretation des t-Tests verzichtet werden?
Wenn sowohl eine Abweichung von der Normalverteilungn als auch eine heterogene Vraianz festgestell wird.
Welche Alternativen kann man einsetezen, wenn man auf die Interpretation des t-Tests verzichten muss.
-> Alternative bilden parameterfreie Verfahren
Wilcoxon Rangsummen-Test (Mann-Whitney-U-Test)
Permutations- & Bootrap-Test
Zuletzt geändertvor 6 Monaten