Grund der Assoziationsanalyse
Market-Basket-Model
Reihenfolge ist nicht relevant, es geht nur um die Zusammenhängen.
Frequent Pattern Mining - Support
-> Sobald es enthalten ist, wird es mitgezählt, also {Bier,Chips,Fanta} würde auch dazu gehören
Frequent Pattern Mining - Anwendungsfelder
Confidence
Exkurs bedingte Wahrscheinlichkeiten
Vorgehen der Assoziationsanalyse
Apriori-Algorithmus
Wird verwendet um die Menge an Elementen zu verringern und somit eine unwichtige Elemente nicht mehr zu nutzen
Bei C3 sollten ebenfalls folgende Mengen vorhanden sein:
{A,C,E} und {A, B, C}, diese werden aber nicht betrachet, wegen der Apriori-Eigenschaften, die in C2 auftritt, denn {A,B} und {A,E} werden vorher schon gestrichen
Allgemein: Der Algorithmus bildet für jede Anzahl alle Menge mit einem bestimmten Support. Danach kann dann weiter analysiert werden. So würde man sich vielleicht fragen, welche Produkte haben Abhängigkeiten. Dann geht man in die Mengen von 2 Elementen und berechnet für die von Algorithmus entstanden Mengen die Confidence und sucht die maximalen Ergebnisse heraus.
Nutzung von minimaler Confidence
Bsp: {Brot, Milch}
Ich rechne für beide Richtungen die Confidence aus und wähle dann, wenn alle Richtungen der minimalen Confidence entsprechen.
Interest = Lift
Gleicht die Schwächen von Support und Confidence aus
Grund für den PF-Growth Algorithmus
Ablauf des FP-Growth Algorithmus
Nach dem man die Zahl der einzelnen Häufigkeiten berechnet hat, werden die Reihenfolge der Häufigkeiten der Elemente nach sortiert, dann werde alle Transaktion in den Baum eingefügt => 2 maliges Durchlaufen der Daten
Moderne Entwicklungen
Zuletzt geändertvor 20 Tagen