Buffl

MLR

df
by diana F.

1. Grundlagen der Linearen Regression


Was beschreibt die Slope und wie wird sie interpretiert?

Was beschreibt das Residuum und wie ist seine Interpretation?

Was bedeutet ein kleines/großes Residuum?



Der Steigungsparameter gibt an, wie stark die Gerade steigt bzw. fällt. Die Steigung der Geraden ist an jeder Stelle konstant.

Steigungskoeffizient (Slope, 𝑏1) = -10.1:

Die Steigung beschreibt, wie sich 𝑌 (IQ) ändert, wenn 𝑋 (Bierkonsum) um eine Einheit (1 Liter) zunimmt. Der Wert 𝑏1=−10.1 bedeutet, dass für jeden zusätzlichen Liter Bier, den eine Person trinkt, der vorhergesagte IQ um durchschnittlich 10.1 Punkte sinkt.

Interpretation: Pro Liter Bier, den eine Person trinkt, sinkt ihr vorhergesagter IQ um 10.1 Punkte. Der negative Wert der Steigung zeigt eine negative Beziehung zwischen Bierkonsum und IQ.

  • Beispiel: wie stark sinkt der IQ im Mittel, wenn der Bierkonsum um eine Einheit zunimmt.

  • Beispiel: Jemand der 2 Maß mehr trinkt, hat im Mittel einen IQ, der um 20.2 Einheiten geringer ist.

__________________________________________________

Regressionsgleichung: 𝑌𝑖=𝛽0+𝛽1⋅𝑋𝑖+𝜀𝑖

Diese Gleichung stellt das lineare Regressionsmodell dar.

𝑌𝑖 = tatsächliche IQ einer Person,

𝛽0 = Achsenabschnitt (Intercept),

𝛽1 = Steigungskoeffizient,

𝑋𝑖 = Bierkonsum, und

𝜀𝑖 = Fehlerterm (Residuum): Unterschied zwischen dem vorhergesagten und dem tatsächlichen Wert.

Interpretation: Diese Formel sagt den IQ einer Person basierend auf ihrem Bierkonsum und dem durchschnittlichen Zusammenhang zwischen Bierkonsum und IQ vorher. Für jede Person, die eine bestimmte Menge Bier getrunken hat, kann mit Hilfe dieser Gleichung der vorhergesagte IQ berechnet werden.

Residuum (𝑒𝑖=𝑦𝑖−𝑦𝑖^)

Das Residuum ist die Differenz zwischen dem tatsächlichen Wert und dem vorhergesagten Wert

Es zeigt, um wie viel der tatsächliche Wert vom vorhergesagten Wert abweicht. Residuen können sowohl positiv als auch negativ sein.

Interpretation: Das Residuum gibt den Vorhersagefehler des Modells an. Ein kleines Residuum bedeutet, dass der vorhergesagte Wert sehr nah am tatsächlichen Wert liegt, während ein großes Residuum bedeutet, dass das Modell für diese Beobachtung weniger genau ist.


4. Kodierung von kategorialen Variablen


Was ist Dummy-Kodierung und wann wird sie verwendet?

Wie erfolgt die Kodierung?

Was beschreibt der Intercept?

Was beschreibt 𝛽2?

Was ist Dummy-Kodierung und wann wird sie verwendet?


Eine Methode zur Umwandlung von kategorialen Variablen in numerische Form. Eine Kategorie wird als Referenz (0) gewählt, und die andere wird als 1 kodiert.


𝐼𝑄i= 𝛽0 + 𝛽1 ⋅ 𝐵𝑖𝑒𝑟i + 𝛽2 ⋅ 𝑀𝑢𝑐1 + 𝜀i


z.B.: keine Münchner*in = 0, Münchner*in = 1

  • Intercept = Achsenabschnitt der Referenzgruppe

  • Das Regressionsgewicht für muc ist der Unterschied im Intercept der anderen Gruppe im Vgl. zur Referenzgruppe

Interpretation der Dummy-Kodierung:

Intercept (𝑏0): Der Intercept repräsentiert den Mittelwert der abhängigen Variable 𝑌 (z. B. IQ) für die Referenzgruppe (hier: „keine Münchner*in“). Wenn alle Prädiktorvariablen (z. B. Bierkonsum) den Wert 0 haben, gibt der Intercept den vorhergesagten Wert für die Referenzgruppe an.

Beispiel: Wenn 𝑏0=102, bedeutet das, dass der durchschnittliche IQ für Personen, die keine Münchner*innen sind, 102 beträgt (bei einem Bierkonsum von 0).

Koeffizient für „Münchner*in“ (𝑏1): Der Koeffizient 𝑏1 für die Dummy-Variable „Münchner*in“ zeigt den Unterschied im Intercept (Mittelwert der abhängigen Variable) zwischen den beiden Gruppen an.

Beispiel: Wenn 𝑏1=8, bedeutet das, dass der durchschnittliche IQ von Münchnerinnen (Gruppe mit Wert 1) 8 Punkte höher ist als der von Nicht-Münchnerinnen (Referenzgruppe). Der neue Intercept für Münchner*innen wäre also 102+8=110

Steigung für Bierkonsum: Der Steigungskoeffizient für Bierkonsum (𝑏2) bleibt gleich, unabhängig davon, ob eine Person Münchner*in ist oder nicht, wenn keine Interaktion modelliert wird.

Beispiel: Wenn 𝑏2=−10, bedeutet das, dass für jede Einheit Bierkonsum der IQ um 10 Punkte sinkt, egal ob die Person Münchnerin oder keine Münchnerin ist.

Zusammenfassung der Dummy-Kodierung:

Der Intercept (𝑏0) ist der Wert der abhängigen Variable für die Referenzgruppe (keine Münchner*in).

Der Koeffizient 𝑏1 zeigt den Unterschied zwischen der Referenzgruppe und der Vergleichsgruppe (Münchner*in) im Mittelwert der abhängigen Variable an.

Der Effekt des Prädiktors (z. B. Bierkonsum) ist für beide Gruppen gleich, sofern keine Interaktion modelliert wird.





Author

diana F.

Information

Last changed