Prüfungfragen

Buffl

by Marc-Aurel R.

Nenne die Hypothesen H_0 and the H_A für die folgenden Beispiele

t.test(age~train, data=jtrain2)
t.test(educ~train, data=jtrain2)
t.test(married~train, data=jtrain2)
t.test(nodegree~train, data=jtrain2)
t.test(unem75~train, data=jtrain2)

1. t.test(age ~ train, data = jtrain2)

H₀: beta_1: Es gibt keinen Unterschied im durchschnittlichen Alter zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im durchschnittlichen Alter zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.

2. t.test(educ ~ train, data = jtrain2)

H₀: beta_1 = 0: Es gibt keinen Unterschied im Bildungsniveau (Jahre der Bildung) zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Bildungsniveau (Jahre der Bildung) zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.

3. t.test(married ~ train, data = jtrain2)

H₀: beta_1=0: Es gibt keinen Unterschied im Anteil der Verheirateten zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Verheirateten zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.

4. t.test(nodegree ~ train, data = jtrain2)

H₀: beta_1 =0: Es gibt keinen Unterschied im Anteil der Personen ohne Schulabschluss zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Personen ohne Schulabschluss zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.

5. t.test(unem75 ~ train, data = jtrain2)

H₀: beta_1=0: Es gibt keinen Unterschied im Anteil der Arbeitslosigkeit im Jahr 1975 zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.
Hₐ: beta_1 ungleich 0: Es gibt einen Unterschied im Anteil der Arbeitslosigkeit im Jahr 1975 zwischen den Teilnehmern des Trainingsprogramms und den Nicht-Teilnehmern.

Streuungsmaße sind….

Spannweite
Interquatilsabstand
Varianz
Standardabweichung

Lagemaße sind….

Median
Mean
Minimum
Maximum
(Modus)

Die Güte einer Schätzung wird gemessen mit Hilfe des p-Werts. Richtig oder falsch?

Falsch, weil Güter der Schätzung durch das R-Quadrat gemessen wird

Der Regressionskoeffizient ist positiv, wenn die Kovarianz positiv ist. Richtig oder falsch?

Richtig, weil der Regressionskoeffizient beta_1_dach=cov(x,y)/var(x) und die Varianz wg. der Quadrierung immer positiv ist.

Der Korrelationskoeffizient misst die Steigung der Regressionsgerade. Richtig oder falsch?

Falsch, weil der Regressionskoeffizient die Steigung misst.

Wenn die Irrtumswahrscheinlichkeit unter 5% liegt, dann ist ein Regressionskoeffizient signifikant. Richtig oder falsch?

Rcihtig. Der p-Wert entspricht der Irrtumswahrscheinlichkeit. Wenn der p-Wert kleiner als 5% ist, dann ist ein Regressionskoeffizient signifikant.

Eine Dummy-Variable als y-Variable erfordert die Interpretation der Regressionskoeffizienten in Prozent. Ok?

Nein, sondern in Wahrscheinlichkeiten und in Prozent (Lineares Wahrscheinlichkeitsmodell)

Beim Datensatz tips wird ein Regressionskoeffizient zwischen total_bill und tip von 0,11 Dollar berechnet (Einfachregression). Der Regressionskoeffizient ist signifikant. Ist das ein kausaler Effekt?

Nein, weil es keine Programm- und Kontrollgruppe

Was heißt Bereinigung beim Gender Pay Gap?

Es wird bereinigt um die Unterschiede zwischen Frauen und Männern (also z.B. Bildungsunterschiede, Arbeitserfahrungsunterschiede, Familienstatus) durch Aufnahme von Kontrollvariablen in die multiple Regressionsanalyse

Unterschied zwischen Männer und Frauen
Kontrollvariablen (Bildung, Erfahrung, Status)
multiple Regressionsanalyse

Wenn bei der Mincer-Gleichung (Lohn wird bestimmt durch Bildung etc.) die y-Variable als log(wage) gemessen wird, muss man dann die Regressionskoeffizienten als Wahrscheinlichkeiten interpretieren?

Nein, weil keine Dummy-Variable als y-Variable geschätzt wird, sondern lwage (das ist keine Dummy-Variable)

Aufgabe 1: Gender Pay Gap

Aufgabe 2: Gender Pay Gap

Aufgabe 3: Gender Pay Gap

Aufgabe 4: Gender Pay Gap

Aufgabe 5: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten

Obervationen: 32

Aufgabe 6: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten

Observationen: 32

Aufgabe 7: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten

Observationen: 150

Aufgabe 8: Beschreibe die wesentlichen Erkenntnisse des dargestellten Boxplots und der bereitgestellten Daten

Observationen: 116

Aufgabe 9: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient

plot(total_bill,tip)

Visuell ist ein Zusammenhang zu zwischen tip und total_bil zu sehen
Kovarianz: Positiv, somit ein Zusammenhang vorhanden
Korrelation: >0,5 somit ein starker positiver Zusammenhang

Aufgabe 10: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient

plot(Ozone,Temp)

Visuell ist ein Zusammenhang zu zwischen Ozone und Temp zu sehen
Kovarianz: Positiv, somit ein Zusammenhang vorhanden
Korrelation: >0,5 somit ein starker positiver Zusammenhang

Aufgabe 11: Zusammenhanganalyse: Streudiagramm, Kovarianz u. Korrelationskoeffizient

plot(qsec,mpg)

Visuell ist ein kein eindeutiger Zusammenhang zwischen Qsec und MPG zu sehen
Kovarianz: Positiv, somit ein Zusammenhang vorhanden
Korrelation: <0,5 somit ein schwacher positiver Zusammenhang

Aufgabe 12: Prediction

Wie viel Trinkhgeld würde es bei einer Rechnugnshöhe von 100 Dollar geben?

Estimate Intercemt+Steigung*Pedictet Wert
(0,920270+0,105025*100)=11,42277
Intercept=Sartpunkt=Ordinatenabschnitt, wo die Gerade die y-Achse schneidet
beta_1_Dach>0: Ein Anstieg der unabhängigen Variable X führt zu einem Anstieg der abhängigen Variable Y
oder
beta_1_Dach<0: Ein Anstieg der unabhängigen Variable X führt zu einem Rückgang der abhängigen Variablen Y
oder
beta_1_Dach=0: Bedeutet dass die unabhängige Variable X keinen signifikanten Einfluss auf die abhängige Variable Y hat

Aufgabe 13: Prediction

Welche Reichweite wird ein PKW im Durchschnitt erreichen, wenn er 4.500lbs wiegt?

Estimate Intercemt+Steigung*Pedictet Wert
37.2851+(-5.3445*4.500)=13.23485
Intercept=Sartpunkt=Ordinatenabschnitt, wo die Gerade die y-Achse schneidet
beta_1_Dach>0: Ein Anstieg der unabhängigen Variable X führt zu einem Anstieg der abhängigen Variable Y
oder
beta_1_Dach<0: Ein Anstieg der unabhängigen Variable X führt zu einem Rückgang der abhängigen Variablen Y
oder
beta_1_Dach=0: Bedeutet dass die unabhängige Variable X keinen signifikanten Einfluss auf die abhängige Variable Y hat

Join Course

Preview

Author

Marc-Aurel R.

Information

Last changed
2 years ago

Report course