Nenne die Hypothesen H_0 and the H_A für die folgenden Beispiele
t.test(age~train, data=jtrain2)
t.test(educ~train, data=jtrain2)
t.test(married~train, data=jtrain2)
t.test(nodegree~train, data=jtrain2)
t.test(unem75~train, data=jtrain2)
H₀: beta_1: Es gibt keinen Unterschied im durchschnittlichen Alter zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im durchschnittlichen Alter zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
H₀: beta_1 = 0: Es gibt keinen Unterschied im Bildungsniveau (Jahre der Bildung) zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Bildungsniveau (Jahre der Bildung) zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
H₀: beta_1=0: Es gibt keinen Unterschied im Anteil der Verheirateten zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Verheirateten zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
H₀: beta_1 =0: Es gibt keinen Unterschied im Anteil der Personen ohne Schulabschluss zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Personen ohne Schulabschluss zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
H₀: beta_1=0: Es gibt keinen Unterschied im Anteil der Arbeitslosigkeit im Jahr 1975 zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Arbeitslosigkeit im Jahr 1975 zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Streuungsmaße sind….
Spannweite
Interquatilsabstand
Varianz
Standardabweichung
Lagemaße sind….
Median
Mean
Minimum
Maximum
(Modus)
Die Güte einer Schätzung wird gemessen mit Hilfe des p-Werts. Richtig oder falsch?
Falsch, weil Güter der Schätzung durch das R-Quadrat gemessen wird
Der Regressionskoeffizient ist positiv, wenn die Kovarianz positiv ist. Richtig oder falsch?
Richtig, weil der Regressionskoeffizient beta_1_dach=cov(x,y)/var(x) und die Varianz wg. der Quadrierung immer positiv ist.
Der Korrelationskoeffizient misst die Steigung der Regressionsgerade. Richtig oder falsch?
Falsch, weil der Regressionskoeffizient die Steigung misst.
Wenn die Irrtumswahrscheinlichkeit unter 5% liegt, dann ist ein Regressionskoeffizient signifikant. Richtig oder falsch?
Rcihtig. Der p-Wert entspricht der Irrtumswahrscheinlichkeit. Wenn der p-Wert kleiner als 5% ist, dann ist ein Regressionskoeffizient signifikant.
Eine Dummy-Variable als y-Variable erfordert die Interpretation der Regressionskoeffizienten in Prozent. Ok?
Nein, sondern in Wahrscheinlichkeiten und in Prozent (Lineares Wahrscheinlichkeitsmodell)
Beim Datensatz tips wird ein Regressionskoeffizient zwischen total_bill und tip von 0,11 Dollar berechnet (Einfachregression). Der Regressionskoeffizient ist signifikant. Ist das ein kausaler Effekt?
Nein, weil es keine Programm- und Kontrollgruppe
Was heißt Bereinigung beim Gender Pay Gap?
Es wird bereinigt um die Unterschiede zwischen Frauen und Männern (also z.B. Bildungsunterschiede, Arbeitserfahrungsunterschiede, Familienstatus) durch Aufnahme von Kontrollvariablen in die multiple Regressionsanalyse
Unterschied zwischen Männer und Frauen
Kontrollvariablen (Bildung, Erfahrung, Status)
multiple Regressionsanalyse
Wenn bei der Mincer-Gleichung (Lohn wird bestimmt durch Bildung etc.) die y-Variable als log(wage) gemessen wird, muss man dann die Regressionskoeffizienten als Wahrscheinlichkeiten interpretieren?
Nein, weil keine Dummy-Variable als y-Variable geschätzt wird, sondern lwage (das ist keine Dummy-Variable)
Aufgabe 1: Gender Pay Gap
Aufgabe 2: Gender Pay Gap
Aufgabe 3: Gender Pay Gap
Aufgabe 4: Gender Pay Gap
Aufgabe 5: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten
Obervationen: 32
Aufgabe 6: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten
Observationen: 32
Aufgabe 7: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten
Observationen: 150
Aufgabe 8: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten
Observationen: 116
Aufgabe 9: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient
plot(total_bill,tip)
Visuell ist ein Zusammenhang zu zwischen tip und total_bil zu sehen
Kovarianz: Positiv, somit ein Zusammenhang vorhanden
Korrelation: >0,5 somit ein starker positiver Zusammenhang
Aufgabe 10: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient
plot(Ozone,Temp)
Visuell ist ein Zusammenhang zu zwischen Ozone und Temp zu sehen
Aufgabe 11: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient
plot(qsec,mpg)
Visuell ist ein kein eindeutiger Zusammenhang zwischen Qsec und MPG zu sehen
Korrelation: <0,5 somit ein schwacher positiver Zusammenhang
Aufgabe 12: Prediction
Wie viel Trinkhgeld würde es bei einer Rechnugnshöhe von 100 Dollar geben?
Estimate Intercemt+Steigung*Pedictet Wert
(0,920270+0,105025*100)=11,42277
Intercept=Sartpunkt=Ordinatenabschnitt, wo die Gerade die y-Achse schneidet
beta_1_Dach>0: Ein Anstieg der unabhängigen Variable X führt zu einem Anstieg der abhängigen Variable Y
oder
beta_1_Dach<0: Ein Anstieg der unabhängigen Variable X führt zu einem Rückgang der abhängigen Variablen Y
beta_1_Dach=0: Bedeutet dass die unabhängige Variable X keinen signifikanten Einfluss auf die abhängige Variable Y hat
Aufgabe 13: Prediction
Welche Reichweite wird ein PKW im Durchschnitt erreichen, wenn er 4.500lbs wiegt?
37.2851+(-5.3445*4.500)=13.23485
Last changed2 months ago