Was ist Process Mining
Datenanalyse zur
Erstellung von Geschäftsprozessen
Überprüfung von Geschäftsprozessen
Erweiterung von Geschäftsprozessen
Grundlage für Process Mining
Event-Log
Eine Logdatei -> ein Prozess -> viele Prozessinstanzen (Fälle) -> viele Aktivitäten
Aktivitäten meist chronologisch geordnet, besitzen Attribute wie
Kosten
Bezeichnung
ausführende Ressource
Zeitstempel
Event-Log im XES-Format
Log: repräsentiert Prozess
Trace: repräsentiert einen Fall/Instanz
Event: repräsentiert Aktivität
Process Mining: Erster Schritt
Discovery
Aus Event Log Geschäftsprozessmodell ableiten
Es gibt verschiedene Synthesealgorithmen mit denen dies möglich ist
Herausforderung Discovery
Passendes Modell erzeugen
Alpha Algorithmus - Allgmein
Ist ein Synthese-Algorithmus
Wird genutzt um Geschäftsprozessmodelle zu erkennen
Schritte
Sequenzen erstelen
Footprint Matrix ableiten
Kontrollmuster ableiten
Petrinetz ableiten
Alpha-Algorithmus - Sequenzen erstellen
Aus Event Log Sequenzen ableiten: Mit a>b aufschreiben welche Aktivitäten direkt aufeinander Folgen
Alpha Algorithmus Footprint Matrix ableiten
Regeln:
A > B (Direkte Nachfolge): gdw. in einem Fall B direkt auf A folgt.
A → B (Kausalität): gdw. stets nur A>B und niemals B>A beobachtet wird
A || B (Nebenläufigkeit): gdw. sowohl A>B als auch B>A beobachtet wird.
A # B (Auswahl): gdw. weder A>B als auch B>A beobachtet wird.
Alpha Algorithmus Kontrollflussmuster ableiten
Alpha Algorithmus Petri Netz ableiten
Kontrollflussmuster aus vorherigem Schritt zusammenfügen Lücken auffüllen durch “puzzlen”
Alpha Algorithmus - Vorraussetzungen & Herausforderungen
Vorraussetzungen
Anforderung an Event Log sind erfüllt
Activity Completeness: Jede Aktivität des Prozesses taucht mindestens einmal auf
Behavioral Completeness: Falls eine Aktivität B auf A folgt taucht dies mindestens einmal im Log auf
Herausforderungen
Rauschen: falsch aufgezeichnete Aktivität oder Abweichung
Duplizierte Aktivität oder Schleifen
Häufigkeiten nicht miteinbezogen
Heurisitc Mining
Abbildung von Häufigkeiten bei Ermittlung der Ordnungsbeziehungen
Anwendung verschiedener Heuristiken bei Erstellung des Kontrollflusses
Vergleichsweise unempfindlich gegenüber Noise und Uncompleteness
Entdeckung von Causal Nets
Genetic Mining
Inspieriert von Natur
Zufällige Erstellung /entweder komplett random oder durch Synthesealgorithmen) von Prozessmodellen als mögliche Kandidaten für endgültiges Modell
Berechnung der „Fitness“ des Modells in Bezug auf das Event Log
Veränderung der Lösungen durch genetische Operatoren (Crossover, Mutation) und so schrittweise Annäherung an ein Prozessmodell mit der höchsten Fitness
Wenn Abbruchkriterium erreicht Modell mit höchster Fitness auswählen
Fuzzy Mining
Erlaubt „Zoomen“ im Modell für bessere Übersicht der häufig genutzten Pfade oder der häufig auftretenden Aktivitäten
Kantenstärke steigt mit Häufigkeit der Anzahl an Fällen, in denen diese Kanten traversiert werden
Gut geeignet für komplexe, wenig strukturierte Prozesse
Perspektivisch - Organisationsperspektive
Soziale Netzwerke auf Basis von Metriken
Zusammenarbeit (welche Mitarbeiter arbeiten gemeinsam an Fällen?)
Ähnliche Aufgaben (welche Mitarbeiter führen ähnliche Aufgaben aus?)
Übergabe von Arbeit (welcher Mitarbeiter führt Folgeaktivitäten aus?)
Process Mining zweiter Schritt
Conformance Checking
Vergleich von Event Log und Prozessmodellen* mittels Conformance Checking dient der Ableitung eines Maßes zur Übereinstimmung
Aufteilbar in:
Normatives Prozessodell (soll-Modell) schreibt vor wie ein Prozess ausgeführt werden soll z.B. durch gesetzliche Vorgaben durch Messung können Abweichungen erkannt werden -> Hier sehr hohe Fitness wichtig
Deskriptives Prozessmodell (Ist-Modell) beschreibt wie Prozess ausgeführt wird, wird durch beispielsweise Discovery gewonnen, durch Conformance checking wird Qualität von GPM geprüft -> höhere Fitness besser aber nicht so wichtig wie bei Normativ
Conformance checking - Fall-Ebene (naiv)
Fall passt oder passt nicht
Anteil an Fällen die funktionieren aus Log ausrechenen
Problem: Fall kann theoretisch zu 99% richtig oder zu 1% richtig ausgeführt werden Fall ebene unterscheidet dies nicht (beides schlägt fehl)
Fitness auf Event-Ebene
berücksichtigt zu welchem Anteil Fälle ausgeführt werden können
Ermittlung:
Abspielen von Petrinetz, dabei notieren der folgenden Werte MCRP (merken: McRib):
missing: falls ein Token für aktivierung von Transaktion fehlt
consumed: Wenn Transaktion schlatet und dadurch Token “verbraucht” werden
remaining: übriggebliebene Token am Ende des Durchlaufs
produced: Token die durch Transaktionen erzeugt werden
In folgenden Formel einsetzen
Wenn mehrere Fälle, Gewichtung beachten, wenn unklar meldet euch bei Moritz ist schwierig zu erklären haha
Process Mining: Dritter Schritt
Enhancement
Ergänzen eines Prozessmodells um weitere Informationen
Beispiel
Ergänzen durch Häufigkeit des Betretens der verschiedenen Pfade im Modell, ausgedrückt durch Kantenbeschriftung sowie Stärke der Kanten
Decision Mining: Erkennen aus welchen Gründen Prozessmodell in bestimmte Richtung verzweigt
Abgrenzung
Klassisches Data Mining = reine Datensicht, keine Prozessbewusstheit
Last changed2 years ago