Was sind die Elemente von Entscheidungsbäumen?
Knoten (Wurzel und interne Knoten)
repräsentieren Tests für Wert eines Attributes
Kanten
repräsentieren Ergebnis eines Tests
Blattknoten
Endknoten, die Ergebnis vorhersagen
Was ist Decision Tree Learning?
datengetrieben
Trainigsbeispiele werden zur Bestimmung geeigneter Tests verwendet
typischerweise top-down
Beispiel: Entscheidungsbaum
Was ist das Divide-And-Conquer-Prinzip (Entscheidungsbäume)?
TDIDT: Top-Down Induction of Desicion Trees
Zerlegung des Problems in Teilprobleme
Lösen jedes Teilproblems
Wie ist der grundlegende Algorithmus zur Erstellung von Entscheidungsbäumen?
Anhand welcher Kriterien sollten Entscheidungsbäume gelernt werden?
möglichst einfach
greedy Strategie
Instanzen basierend auf Attributtest teilen, der bestimmtes Kriterium optimiert
Daten sollten so geteilt werden, dass nachfolgende Knoten so rein wie möglich sind —> möglichst nur Beispiele einer Klasse enthält
Was sind Algorithmen zur Erstellung von Entscheidungsbäumen?
ID3: Iterative Dichotomiser
C4.5: Nachfolger von ID3
CART: Classification And Regression Trees
Wie funktioniert ID3?
Wie wählt man das beste Attribut für den Wurzelknoten eines Entscheidungsbaums?
Präferierung eines hohen Maßes an “Ordnung”
alle Beispiele gehören gleicher Klasse an
Beispiel:
Was ist Entropie bzgl. zwei Klassen (Kontext: Enscheidungsbäume)
Wie berechnet sich Entropie bzgl. mehrerer Klassen (Kontext: Entscheidungsbäume)?
Wie berechnet man die Qualität einer ganzen Unterteilung (Entscheidungsbaum)
Hintergrund: Entropie berechnet nur Qualität einer einzigen Untermenge von Beispielen
Was ist Information Gain und wie errechnet er sich?
Zuletzt geändertvor einem Jahr