4 Qualitätsdimensionen des Conformance Checking
Fitness
Precision
Generalization
Simplicity
-> Multiplizitäten der Abläufe im Log werden nicht beachtet!
Was ist Fitness?
L = verschiedene Aktivitätsfolgen im Eventlog
M = im Modell mögliche Abläufe
Was ist Precision?
L = verschiedene Abläufe im Eventlog
-> bei Loops: Precision geht gegen 0
Was ist Generalization?
= Wie gut verallgemeinert Modell?
= sinnvolles zusätzliches Verhaltens im Modell: M \ L
M= modelliertes Verhalten
L = im Log aufgezeichnetes Verhalten
L⁺ = sinnvolle Erweiterung:
wird gegeben
keine sinnvolle Generalization, wenn
L⁺ unendlich ist
L⁺\L leer ist
Was ist Simplicity?
= einfach labern
= wie einfach beschreibt das Modell das Verhalten?
Ockham’s Razor
Einfachheit des Kontrollflusses
Anzahl Knoten
hängt ab von:
persönlichen Präferenzen
eigenem Kenntnisstand
Wie sieht das Trace-Modell aus?
= jede Aktivitätsfolge im Log bekommt eine Sequenz von Aktivitäten
mit xor-Split und -Join
perfekte Fitness, perfekte Precision
Wie sieht das Flower Model aus?
= erlaubt beliebige Sequenzen der Aktivitäten des Event Logs
hat perfekte Generalisation
Sprache ist größer als jede sinvolle Erweiterung L⁺
Def. Regelbasierte Fitness
-> Multiplizitäten sind egal!
Zähler = Regeln, die gelten
Nenner = Alle Regeln
Welche Regeln gibt es bei der regelbasierten Fitness?
“MinMax”-Regel r1_G
“braucht”-Regel r2_G
“dann auch”-Regel r3_G
“immer ohne” Regel r4_G
Was sagt die “MinMax-Regel”?
= Spalten: Name der Regel
1. Zeile = Aktivität
2. Zeile = Minimum
3. Zeile = Maximum
Was sagt die “braucht”-Regel?
wenn Aktivität in Spalte,
dann immer Aktivität in Zeile irgendwo davor
Was sagt die “dann-auch”-Regel?
= wenn Aktivität in Spalte,
dann kommt irgendwann auch Aktivität in Zeile
Was sagt die “immer ohne”-Regel
dann nie Aktivität in Zeile
Was ist die Replay Fitness?
-> Multiplizitäten sind wichtig!
bei consumed und produced +1 für Anfangs- und End-Markierung!
Wie berechnet mman die Replay Fitness?
-> Achtung: Zellen wurden mit Multiplizitäten multipliziert!
-> immer zwischen 0 und 1
Def. Alignment
oben Aktivitätsfolge aus Log
unten Wort der Sprache des Modells
>> heißt Skip-Symbol
Wert = Anzahl >>
Def. Optimales Alignment
= Alignment mit kleinstem Wert
Def. 7.4.6 Easy sound beschriftetes Workflownetz
beschriftetes Workflownetz
stark zusammenhängend, wenn Kante zwischen o und i
easy sound = es gibt min eine Schaltsequenz von i nach o
Def. Synchrones Produkt
2 WFN
wenn eins davon Aktivitätsfolge, dann einfach lineares WFN draus machen
in die Mitte gemeinsame Aktivitätsfolge (hier einfach von oben kopiert)
für jede Aktivität Kanten zum Vor- und Nachbereich der beiden ursprünglichen WFN
Formel Alignment Trace Fitness
Def. Alignment Fitness
|E| = Anzahl der Events = Anzahl der Folgen
<E> = # Aktivitäten in allen Folgen
Was ist ein Anti-Alignment?
Eine Aktivitätsfolge aus der Sprache des GP-Modells, die nicht im Eventlog enthalten ist.
Def. Anti-Alignment Precision
Bestimme normierten Levenstein Abstand zu einem Anti-Alignment und Event Log
für jeden Eintrag im Log:
Levenshtein-Abstand berechnen = Anzahl Ersetzungen, Einfügungen, Löschungen, um eine Folgen in andere zu überführen
normiert = dividieren durch längere Folge
Davon das Minimum nehmen
Last changed5 months ago