Skizzieren eines Decision Tree Workflows
Skizzieren Sie eine Confusion Matrix. Wie berechnet man die dazugehörige Genauigkeit?
Accuracy: true predictions (yes and yes + no and no) : Anz. aller Werte
Was versteht man unter Reduced Error Pruning?
Wird ein Baum in einem Nachbearbeitungsschritt beschnitten
Jeder Knoten wird durch die beliebteste Klasse ersetzt
=> nur wenn die Vorhersagegenauigkeit nicht abnimmt
Welche Vorteile hat das Reduced Error Pruning?
Vorteil der Einfachheit und Schnelligkeit.
Bennene die Nachteile der Konfusionsmatrix.
Berücksichtigt nur die Genauigkeit im Allgemeinen und nicht für verschiedene Klassen
=> Daher nicht informativ, wenn die Klassenverteilung unausgewogen ist.
Was ist Cohen´s Kappa?
gutes statistisches Maß
Kann Probleme mit mehreren Klassen & unausgewogenen Klassen bewältigen
Was sagt der Cohen´s Kappa aus?
Wie viel besser Ihr Klassifikator im Vergleich zu einem Klassifikator ist, der zufällig die einzelnen Klassen rät
Beschreiben Sie die Variablen p0 und pe.
p0: beobachtete Übereinstimmung
pe: für die erwartete Übereinstimmung
Was sagen die Werte von k aus?
K= 1 => Perfektes Modell
K=0 => Modell Leistung gleich einem Zufalls Classifier
Benennen Sie die Bedeutung der Spalten, Reihen und der Diagonalen einer Konfusionsmatrix.
Spalten: Vorhergesagte Werte
Reihen: Korrekte Werte
Hauptdiagonale (\): Korrekt Klassifiziert
außerhalb der Hauptdiagonale (/): falsch klassifiziert
Nennen Sie die Vorteile eines Regression Trees.
Ermittlung der lokalen Regressionswerte (Mittelwert)
Nennen Sie die Nachteile eines Regression Trees.
Keine Interpolation zwischen den Grenzen
Heuristischer Algorithmus => instabil & nicht optimal
Was versteht man unter “bagging”?
Für jeden Baum wird eine Trainingsmenge durch gleichmäßige Stichproben mit Ersetzug aus der Standart- Trainingsmenge erzeugt.
Nennen Sie die Vorteile von Bagging.
Bewertung des Modells mittels Trainingsdaten
Bäume auf Sample anwenden, die nicht für das Training verwendet wurden
Was versteht man unter Boosting?
iterative Erzeugung von einer Folge von Bäumen
=> so dass jeder Baum sich auf falsch klassifizierte Objekte des vorherigen Baumes konzentriert
Last changed3 months ago