t-Test unabhängiger Stichproben

von louisa O.

Wie heißt der unabhängige t-test auf englisch?

two-sample t-Test

Wofür ist der unabhängige t-Test geeignet?

Ist ein statistischer Test, zur Überprüfung ob es einen Unterschied zwischen zwei Gruppen gibt

Grundlage für Nullhypothese

Werden zwei Stichproben aus zwei Population gezogen, lässt sich mit dem t-Test unabhängiger Stichproben überprüfen ob beide Srichproben aus Population stammen, deren Parameter μ1 & μ2 identisch sind

Wie lautete die Nullhypothese

H0: μ1 = μ2 => μ1 - μ2 = 0

Arbeitshypothese

H1: μ1 ≠ μ2 => μ1 - μ2 ≠ 0 (ungerichtet)

H1: μ1 >/< μ2 => μ1 - μ2 >/< 0 (gerichtet)

Wie wird die unabhängigkeit der Stichproben formal definiert?

P (A|B) = P(A)

Doch die Populationswerte μ1 & μ2 sind unbekannt, womit rechnen wir dann?

wir schätzen mit den Stichprobenkennwerten x1 & x2
bzw. die Mittelwertsdifferenz (x1 - x2) als Indikator für einen Unterschied
Liegt ein systematischer Unterschied vor sollte auch die wahrscheinlichkeit der Mittelwerte hoch sein

Was ist also die Formel der Teststatistik für unabhängige t-Test & warum/ wie kann man sie vereinfachen?

Verinfacht gesagt (unter berücksichtigung der Nullhypothes H0: μ1 - μ2 = 0):

Wie kommt der untere Term der Formel zustande?

Standardfehler der Differenz lässt sich nicht berechnen, weil Populationsvarianz nicht bekannt ist

-> Allerdings kann man über die vorliegende Stichprobe schätzen, Sind diese entnommenen Varianzen gleich, ist es sinvoll Varianz aufgrund der Daten aus beiden Stichproben zu berechnen

Was besagt das Varianz-Summengesetz I (Bienaymé-Gleichung)?

= die Varianz der Summe unkontrollierter Zufallsvariablen ist die Summe der Varianz der Zufallsvariable (Unkontrolliertheit der Varianz wird vorrausgesetzt)

-> dies gilt nur bei gleich großen Stichprobenumfängen & ungefähr gleich großen Standardabweichungen (Varianzhomogenität)

Standardfehler der Differenz berechnen bei ungleichen Stichproben (n1 ≠ n2)

-> Es handelt sich um Varianz, daher gewichtet man über die

Freiheitsgrade & erhält damit die gepoolte Varianz (sp)

Gepoolte Standardabewichung (sp)

(bei gleiche großen Stichproben)

Wie erhalten wir eine Aussage über die Stärke des Effekts? und was ist die Voraussetzung für die Berechnung?

-> Um eine Aussage über die Stärke des Effekts zu erhalten, wird Cohen’s d berechnet

-> die gemeinsame Streuung die benötigt wird ist sp

Kategorien der Effektstärke nach Cohen (d)

-> Cohen Wert bedeutet, dass die Zahl ca. den Standardabweichungenzwischen den Gruppen entspricht

Kleiner Effekt d = 0.2
= kleiner, aber erkennbarer Effekt
Mittlerer Effekt d = 0.5
= gut sichtbar und bedeutsamer Effekt
Großer Effekt = 0.8
= Dieser Effekt ist stark und deutlich sichtbar

Was ist G-Power und wofür kann es verwendet werden?

G-Power ist eine Berechnungssoftware
Wir verwenden es um:
- Post-hoc vorhandene Testergebnisse zu berechnen
- A-priori den Nopt zu berechnen

(dafür benötigen wir d, ß, α)

Was machen wir wenn die Standardabweichungen beider Gruppen unterschiedlich sind?

Und von wem kommt der Vorschlag?

Glass
schlägt vor, dass dann nicht auf die gepoolte Standardabweichung zurückgegriffen wird, sondern auf die Standardabweichung der Kontrollgruppe

-> Standardabweichung der Kontrollgruppe wurde nicht durch Intrevention beeinflusst (Glass Delta) (ähnliche

Effektstärkenmaße wie bei Cohen

Voraussetzungen für einen unabhängigen t-Test

& häufige Fehler bei der Überprüfung

Beide Stichproben sind einfache voneinander unabhängige Zufallsstichproben
Die Varianzen der zu vergleichenden Populationen sind gleich
Normalverteilung des Merkmals in der jeweiligen Population

-> häufiger Fehler bei Überprüfung der

Normalverteilungsvoraussretzung :

gesamte Daten auf N (μ, σ) getestet, statt auf N(μ1, σ1) &

N(μ2, σ2)

Vorgehensweise bei Anwendung eines t-Tests

Welches Verfahren prüft die Varianzhomogenität & wie interpretiert man die Ergebnisse

-> Levene-Test (F-Wert)

-> Ist er siginifikant wird die H0 (Varianzen sind homogen) verworfen

Wie interpretiert man die Ergebnisse des Levene-Test?

Die signifikanz des Levene Tests wird mithilfe des Signifikanzniveaus (α) bestimmt

-> Ist F größer als α wird die H0 beibehalten

-> Ist F kleiner oder gleich α lehnen wir die H0 ab

Was eignet sich besonders um Mittelwertsunterschiede darzustellen?

Und was sollte umbedingt mit eingezeichnet werden?

Balkendiagramme (neben Liniendiagrammen)
Ki sollte umbedingt mit eingezeichnet werden

Wie gibt man mittelwert und Standardfehler APA konform an?

(M = 102.33, SE = 4.56)

Was geht aus Monte-Carlo-Studien hervor?

t-Tests für unabhängigr Stichproben reagieren robust auf Verletzungen seiner Voraussetzungen

Wann nennt man ein Testverfahren robust?

-> wenn es nicht sensibel auf Ausreißer reagiert

-> wenn er trotz Voraussetzungsverletzung richtig entscheidet

Was bedeutet die Robustheit eines t-Tests?

Rebustheit besonders, wenn gleich große Stichproben aus ählichen, möglichst eingipfligen-symmetrisch verteilten Grundgesamtheiten verglichen werden
Sind Stichprobenumfänge sehr unterschiedlich, wird Präzoson t-Test nicht beeinträchtigt, wenn Varianzen gleich sind
Sind weder Stichprobenumfänge noch Varianzen gleich, ist mit erheblich höheren Prozentsatz an Fehlentscheidungen zu rechnen

Was ist das Problem inhomogener Varianzen?

Und wann sind die Konsequenzen besonders gravierend?

Fällt bei ungelichen Gruppengrößen gravierender aus

-> progressive Entscheidung: Schluss auf Unterschiede die faktisch nicht vorhanden sind

Wer beschreib das Problem des t-Tests mit inhomogenen Varianzen?

Behrens-Fisher

Welche Lösung schlug Welch für inhomogene Varainzen vor?

sx ̄1 −x ̄2 anders berechnen
Freiheitsgrade modifizieren

Was ist die H0 des Levene-Tests UF Varianzhomogenität bezogen?

H0: Varianzen sind homogen

-> Signifikantes Ergebnis bedeutet als Ablehnung der H0

Gibt es Einigkeit über die beste Lösung des Behrens-Fisher Problem

-> Nein

Der Vorschlag von Welch ist nur einer von mehrern, den t-Test bei vorliegender heterogenität der varianz zu modifizieren

Wann muss auf die Interpretation des t-Tests verzichtet werden?

Wenn sowohl eine Abweichung von der Normalverteilungn als auch eine heterogene Vraianz festgestell wird.

Welche Alternativen kann man einsetezen, wenn man auf die Interpretation des t-Tests verzichten muss.

-> Alternative bilden parameterfreie Verfahren

Wilcoxon Rangsummen-Test (Mann-Whitney-U-Test)
Permutations- & Bootrap-Test

Beitreten

Vorschau

Author

louisa O.

Informationen

Zuletzt geändert
vor 2 Jahren

Kurs melden