Welcher Lösungsansatz kann verwendet werden, wenn die Zielgröße nicht stetig und normalverteilt wird? Welcher alternative gibt es noch?
Eine Transformation der abhängigen Variable mit dem natürlichen LN wäre möglich
Eine weitere alternative wäre ein generalisiertes Regressionsmodell
Was unterscheidet ein GLM (Generalisierte Lineare Modell) vom linearen Modell?
Eine Normalverteilung der Zielvariable ist nicht notwendig
Zielgröße kann eine Verteilung von exponentiellen Familien besitzen
Poisson
Binomial
Gamma
Aus welchen Komponenten besteht das GLM
Zufallskomponente
Wahrscheinlichkeitsverteilung der abhänigen Variable wird berücksichtigt
Systematische Komponente
Kovariaten, welche die Vertwilung von Y beeinflussen
Verknüpfungsfunktion
Nichtlineare Verknüpfung zwischen Y und X wird benötigt
Inwiefern kann geprüft werden, ob die LN oder GLM transformation besser ist?
Prüfung auf Fit durch Residuenplot
In welchen Varianten kann das Logit Modell unterschieden werden?
Grundsätzlich werden nominale abhängie Variablen genutzt
binäre logistische Regression
abhängige Variable mit 2 ausprägungen
multinominale logistische Regression
abhängige Variable mit mehr als 2 ausprägungen
Worin unterscheiden Sie die Logit Modelle zur linearen Regression?
Es wird die Eintrittswahrscheinlichkeit einer bestimmten ausprägung geschätz und nicht die höhe der abhängigen Variable selbst. Die abhänige Variable erhält somit einen Wert nur zwischne 0 und 1
Erläuteren Sie die Grundgedanken des Logit Modell?
Es existieren die Variablen Z (Abhängige) und X (Unabhägige). Der Zusammenhang wird als Linear angenommen. Z erzeugt werte zwischen 0 und 1
Wo können die Logit Modelle anwendung finden?
Marketing
Kauf eines Produktes
Finanzierung
Kreditrückzahlung
Produktion
Erfüllung des qualitätsstandards
Gesundheitsökonomie
Relevante Diagnose zur Abrechnung einer Fallpauschale
Sollten kardinale oder ordinale Variablen bei einem Logti-Modell ausgelassen werden?
Nein, es sollten keine Informationen ausgelassen werden
Wie werden die Gütemaße und Erklärungsbeiträge eines Logit-Modell
Die Signifikanz eines Logit-Modell wird über die Wald Statistik oder den Likelihood Quotienten ermittelt.
Es kann kein R^2 ermittlet werden, weshalb andere Gütermaße verwendeet werden um ein Pseudo R^2 zu ermitteln
Likelidhood Ratio Test
McFadden
Cox and Snell
Nagelkerke
Was ist der Hintergrund von Zähldatenmodelle und erläuteren Sie diese? Nennen Sie auch die Annahme
Hintergrund
Sachverhalte, welche unter Umständen gar nicht eintreten und mit einem Wert = 0 ausgeprägt sind
Zähldaten
Es handelt sich um diskrete und geordnete Ergebnisse von Prozessen in positiven natürlichen Zahlen
Sie ereignen sich in klar abgegrenzten Zeiträumen, sind nicht nach oben begrenzt und können kardinal interpretiert werden
Annahmane
Poissonverteilung für Residuen
Was sind typische Probleme des Zähldatenmodells
Überdispersion
Hohe Anzahl an 0 in abhängige Variable
Erläuteren Sie die Überdispersion und Unterdispersion und welche Auswege es gibt
Poisson Verteilung nicht ausreichend, weil Überdispersion Poisson impliziert E(Y) = Var (Y), aber häufig E(Y) < Var(Y) oder E(Y) > Var(Y).
Auswege
Quasi Poisson Modelle
Häufig Annahme allgemeinerer Verteilungen, z. B. negative Binomialverteilung
Erläuteren Sie die Hohe Anzahl an 0 in abhängige Variable und ihre möglichen Auswege
Abhänige Variablen erhalten sehr oft mehr als 50% 0, aber ab 30% bereits kritisch
Mischungsmodelle
Nimmt an, dass eineige keine Risiko haben
Hürdenmodelle (ZIB oder ZINB)
Alle weisen ein bestimmtes Risiko auf
Last changeda year ago