Ziel des Hypothesentests
Durch das Verwerfen der Nullhypothese H0 wird die Alternativhypothese HA mit einer zuvor festgelegten Irrtumswahrscheinlichkeit a bestätigt
T-Verteilung bei veschiedenen Freiheitsgeraden
Testverfahren beim Signifikanztest für das Bestimmtheitsmaß R
a) Aufstellen der Nullhypothese und der Alternativhypothese
b) Bestimmung der Varianzzerlegung
c) Festlegung der Irrtumswahrscheinlichkeit
d) Bestimmung der Prüfgröße
e) Bestimmung der Obergrenze für H0
f) Entscheidung und Interpretation
Was ist das Ziel des Signifikanztest für das Bestimmheitsmaß R?
-> Testen, ob die durch die X-Variable erklärte Varianz der Y-Variable signifikant größer ist als 0
Frage: Tragen alle unabhängigen Variablen gemeinsam zu einer bedeutsamen/signifikanten Verbesserung der Vorhersage der abhängigen Variable bei?
Welchen Test muss man für das Bestimmtheitsmaß durchführen und warum?
Da das Bestimmtheitsmaß immer positiv ist, ist stets ein einseitiger Test durchzuführen
Nullhypothese und Alternativhypothese für R
Welche Prüfgröße verwendet man für den Signifikanztest von R?
= F -Statistik: zeigt das Verhältnis von zwei Varianzen
Berechnung:
Was entspricht dem quadrierten t-Wert?
In der bivariaten Regressionsanalyse entspricht der quadrierte T-Wert des unstandardisierten Regressionskoeffizienten b dem F-Wert für das Bestimmtheitsmaß R
Fehler 1. Art und Fehler 2. Art
Wie verändert sich die Wahrscheinlichkeit für den Fehler 2. Art wenn die Wahrscheinlichkeit für einen Fehler 1. Art abnimmt?
Die Wahrscheinlichkeit ß für einen Fehler 2. Art wächst mit abnehmender Wahrscheinlichkeit a für einen Fehler 1. Art
Problem: die Wahrscheinlichkeit für einen Fehler 2. Art (H0 trifft nicht zu, wird aber akzeptiert) kann nicht berechnet werden, weil diese vom unbekannten Parameter (ß) in der Grundgesamtheit abhängt
Korrigiertes R
Ein Gütemaß, welches beides, Modellanpassung und Sparsamkeit berücksichtigt, ist das sogenannte korrigierte R²
Es besteht aus dem Wert des einfachen R², welcher mit einem "Strafterm" belegt wird -> daher nimmt das korrigierte R² in der Regel einen geringeren Wert als das einfache R² an und kann in manchen Fällen sogar negativ sein
Korrekturfaktor des R
n - 1 / n - k - 1
Je größer die Anzahl der unstandardisierten Regressionskoeffizienten b bei gegebenen Stichprobenumfang n, desto kleiner wird die Fehlervarianz
Wie interpretiert man das korrigierte R?
Beispiel:
Das korrigierte R beträgt 0,660. -> 66% der Variation in der Einstellung zur Rechtfertigbarkeit von Scheidung in Europa (Y) lässt sich in 2008 über de Modernisierungsgrad des Landes erklären
Extremfall von R
Ist die Anzahl der unstandardisierten Regressionskoeffizienten ebenso groß wie die Zahl der Fälle (n) dann ist der Vorhersagefehler (E2) 0.
-> Interzept kann nicht interpretiert werden
Alienationskoeffizient / Unbestimmtheitsmaß
1 - R^2
der Alienationskoeffizient wird umso stärker gewichtet:
je größer die Anzahl k und je größer dadurch die Anzahl der geschätzten Regressionskoeffizienten b ist,
= je kleiner also die Anzahl der Freiheitsgerade ist
Inklusionsschluss
Schluss von bekannter Grundgesamtheit auf die Verteilung in der Stichprobe
(Bsp.: Verteilung unstandardisierter Regressionskoeffizienten)
Annahmen eines Stichprobenmodells der bivariaten Regression
die X-Werte sind feste Größen und frei von zufälligen Messefehlern
die Y-Werte können als Summe aus einer systematischen Komponente a + b * x und einer Fehlerkomponente e erklärt werden
Fehlerkomponente: umfasst die Wirkungen aller X-Variablen, die nicht in die Regression aufgenommen wurden, und Messfehler der abhängigen Variable
Fehlervariable E: Dessen Erwartungswert ist 0 und die Varianz ist konstant
Wie bildet man die Regressionsgleichung für die Grundgesamtheit?
arithmetisches Mittel von Regressionskoeffizient a und b
a = 3, b = 0,5
Erwartungstreue
E(b) = ß
E -> Erwartungswert
Der Mittelwert der unstandardisierten Regressionskoeffizienten b über alle Stichproben hinweg ist identisch mit dem entsprechenen unstandardisierten Regressionskoeffizienten b in der Grundgesamtheit
Wofür steht Epsilon (E)
Epsilon steht für den Fehler in der Grundgesamtheit
Varianz
Die Varianz ist eine Maßzahl für die Schwankungen der Stichprobenregressionskoeffizienten a und b
Formel:
Repräsentationsschluss
Schluss von einem Stichprobenergebnis auf die unbekannten Parameter der unbekannten Grundgesamtheit
(über Testverfahren und Schätzverfahren)
Bestimmung des Standardfehlers von b (b als Schätzer für ß in der Grundgesamtheit)
Wie bestimmt man die Obergrenze für H0: Signifikanztest für das Bestimmtheitsmaß
Auszug aus Tabelle für F-Verteilung
Warum muss man bei R immer einen einseitigen Test durchführen?
= Weil das Bestimmtheitsmaß R immer positiv ist und von 0 bis 100 Prozent reicht
Zuletzt geändertvor 15 Tagen