Aufgaben der Business Intelligence
Bereitstellung eines Datenbestands, Erkennung interessanter Muster und Kommunikation der Erkenntnisse:
Data Delivery: informationsintegration und Data Warehousing
Data Mining: Data Mining und statistische Analysen
Knowledge Sharing: Informationsvisualisierung und Wissensmanagement
Eigenschaften interessanter Muster
gültig (valid):
das in den Daten festgestellte Muster ist mit hinreichender statistischer Sicherheit auch in der realwelt beobachtbar
bislang unbekannt (novel):
festgestellte Muster ist nicht offensichtlich und bislang auch nicht bekannt gewesen
potenziell nützlich (potentielly usefull):
Erkenntnis aus Muster weist betriebswirtschaftliche Relevanz auf
einfach verständlich (ultimately understandable):
Muster ist klar erkennbar und lässt sich auf unkomplizierte Weise reproduzieren
Methoden des Data Mining
Assoziationsanalysen:
Aufdeckung von strukturellen Zusammenhängen („Mustern“) und Korrelationen in den Daten
Erstellen von „Wenn-Dann“- Regeln auf Basis der Muster
Klassifikationsanalysen:
Erstellung von Modellen zur Vorhersage der Klassenzugehörigkeit von Objekten
Anwendung der Modelle auf neue, nichtklassifizierte Objekte
Clusteranalysen:
Bildung von Klassen (z.B. für Klassifikationsmodelle) von zueinander ähnlichen Objekten
Aufspüren von Ausreißern, die zu keiner Gruppe gehören
“Die systematisch generierung von Wissen wird als maschinelles Lernen bezeichnet und ist eine Teildisziplin der KI.
-> Definition von KI, ML und DL
Künstliche Intelligenz:
Befähigung von Maschinen, Aufgaben zu erledigen, die menschliche Intelligenz erfordern.
Maschinelles Lernen:
Teilgebiet Künstlicher Intelligenz, befässt sich mit Entwicklung lernfähiger Algorithmen. Das bed., Computerprogramme verbessern mit der Zeit selbstständig ihre Performance, durch eingebaute Feedbackschleifen.
Deep Learning:
teilgebiet maschinellen Lernens, welches Lernprozess mit sehr großen Datensätzen und über mehrere lernebenen ausführt, um komplexe Aufgaben wie Sprach- oder Bilderkennung automatisiert durchführen zu können.
Maschinelles Lernen (ML) - im Data Mining Kontext
Maschinelles Lernen kann im Data-Mining-Kontext eingesetzt werden, um den Vorgang der datengetriebenen Mustererkennung zu automatisieren.
Unüberwachtes Lernen -> Klassifikationsanalyse:
Lernen einer Funktion (=Modell) aus gegebenen Paaren von Ein- und Ausgaben
Ziel: automatische Klassifikation neuer Objekte mit der gelernten Funktion
Überwachtes Lernen -> Clusteranalyse:
Erkennung von zusammengehörigen Gruppen und Ausreißern in den Datensätzen
Ziel: automatische Erkennung von (potenziellen) Klassen für die Klassifikation neuer Objekte
Die Assoziationsregel A -> B
Beschriebt Korrelation zwischen gemeinsa auftretenden Elementen innerhalb n Transaktionenen (z.B. Produktkäufe)
—> A -> B bed., dass er kauf von A den kauf von B impliziert
—> A und B sind jew. mengen von mind. einem Produkt
Business Intelligence Definition
Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Ansatz zur betrieblichen Entscheidungsunterstützung.
Assoziationsanalyse
Mustererkennung mit Assoziationsanalysen
Einmal festgestellte Assoziationsregeln können auch zur Klassifizierung von weiteren Datensätzen genutzt werden
Vorhersagemodelle
Bei regelbasierten Klassifikationsverfahren werden Assoziationsregeln zur Bestimmung der Klassifizierungen neuer Objekte verwendet.
ML-basierte Klassifikationsverfahren resultieren in einem regelbasierten Vorhersagemodell.
Entscheidungsbäume sind ein Vorhersagemodell, das durch ein ML-Verfahren anhand von Trainingsdaten generiert wurde.
Last changed13 days ago