Variablenarten
Abhängige Variable: nominal skaliert »
Unabhängige Variablen: metrisch skaliert »
Verfahren zur Analyse von Gruppenunterschieden » Klassisches Beispiel: Kredit-Scoring › Unterscheidung der Kreditwürdigkeit von Kreditnehmern (Risikoklassen: hoch, niedrig) hinsichtlich bestimmter Merkmale (Einkommen, Alter, etc.) ›
Abhängige Variable: Kredit-Scoring |
unabhängige Variablen: Merkmale der Kreditnehmer »
Weiteres Anwendungsgebiet der Diskriminanzanalyse ist die Klassifizierung (DA bildet die Vorstufe für die anschließende der Klassifizierung, vgl. Übung)
Grund der Diskriminanzanalyse
Unterschied zur Clusteranalyse
Ablauf Diskriminanzanalyse
Definition der Gruppen
Formulierung der Diskriminanzfunktion
-> Lineare Funktion, ähnlich zu einer Regression
-> linear: kanonisch
Bildung der Centroiden
Die Formel stellt dabei die Bildung der Mittelwerte da.
Ig ist die Anzahl
Ygi ist dabei das Merkmal -> Entstanden durch die Diskriminanzfunktion
Basierend auf diesem Minimum und Maximumproblem werden dann die Koeffizienten der Diskriminanzfunktion ermittelt
-> kritische Wert kann ganz einfach die Mitte zwischen den Gruppen bilden, aber auch andere Methoden mögliche
Ziel bei der Schätzung der Diskriminanzfunktion
Beispiel der Verteilung der Streuungswerte
Je mehr Streuung (Standardabweichung), desto mehr Überschneidung
Je nähere Mittelwerte, desto mehr über Schneidung
Schätzung der Diskriminanzfunktion
Dabei können es mehrere Lösungen für b1 und b2 geben, diese sind aber immer ein Faktor voneinander oder haben einen mathematischen Zusammenhang
b0 => beschreibt die Verschiebung des krititschen Wertes um den Wert von b0
Prüfung der Diskriminanzfunktion
Unterschied zur Regression
Distanzkonzept für die Klassifikation
=> nicht so relevant
Bayes-Klassifikator
A-priori Wahrscheinlichkeiten
Bayes-Theorem
=> Entscheidung je nachdem welcher größer ist und welcher nicht
Zuletzt geändertvor einem Monat