Prozesse DEF
Abfolge von Aktivitäten, wodurch Inputfaktoren (Rohstoffe, Arbeit, Informationen) zu Outputfaktoren (Produkte, Kreditvertrag, ...) umgewandelt / verarbeitet werden
2 unterschiedlichen Prozesse eines Industriebetriebs
Technische Prozesse (Herstellungsprozess):
z.B. Monate eines Motors, Lackierung einer Türe, …
Ergebnisse: Stücklisten, Arbeitspläne, Montageanweisungen
Betriebswirtschaftliche Prozesse (Geschäftsprozess):
z.B. Anfrage bearbeiten, Mitarbeiter einstellen, Materialbeschaffung
Ergebnisse: Geschäftsprozessmodelle, Ablaufdiagramme
Ein Geschäftsprozess ist ein Bündel von Aktivitäten, wodurch mit verschiedenen Inputs für den Kunden/Markt Leistungen erzeugt werden, die seinen Vorstellungen entsprechen
Wer ist der Kunde?
Personen oder Organisationseinheiten, die Leistungen in Form von Produkten oder DL vom UN bzw. Prozess empfangen
Egal ob bezahlt oder nicht
Interne Kunden sind Organisationseinheiten innerhalb des UN. Externe Kunden können andere UN sein, aber auch Endabnehmer
Eigenschaften von Prozessen (6)
Welches Ziel verfolgt Total-Quality-Management (TQM)
Qualität als Systemziel einzuführen und dauerhaft zu garantieren
Was ist ein Referenzprozessmodell und welche Arten lassen sich unterscheiden
Referenzmodelle beschreiben Erfahrungswissen, das als Grundlage für das Reengineering der Geschäftsprozesse dienen kann.
Arten:
Branchenspezifisch
Softwarespezifisch
Unternehemensspezifisch
Fachspezifisch
Was ist ein Workflow?
Ein Workflow ist ein formal beschriebener, ganz oder teilweiseautomatisierter Geschäftsprozess
Was ist Workflow-Management-Coalition + Ziel
Die WfMc ist ein Verbund von mehr als 300 Herstellern, Nutzern, Beratern und Wissenschaftlern im Bereich des Workflow-Managements.
Ziel der WfMC ist die Förderung des Einsatzes von Workflow Management Systemen durch die Schaffung von Standards, die den Anwendern Investitionssicherheit geben sollen.
Wichtigster Standard XPDL
Wie ist das Workflow-Referenzmodell aufgebaut? (5 Interfaces)
Prozessdefinition: Schnittstelle zwischen Prozessdefinition, Modellierungswerkzeugen und der Workflow Engine
Benutzerschnittstelle: APIs für Clients, um Dienste von der Workflow Engine anzufordern, damit der Prozessfortschritt und die Aktionen kontrolliert werden können
Applikations-Schnittstelle: APIs, die der Workflow Engine erlauben, Applikationen aufzurufen und zu nutzen
Workflow-Management-System Schnittstelle: Standard-Schnittstelle für den Austausch mit anderen Workflow-Systemen
Administration und Monitoring: Schnittstelle für Werkzeuge zur Kontrolle der Prozesse und zur Überwachung
Operatives System Sven. Dispositives System 3 Unterschiede
Ziel:
OR: Geschäftsprozesse abwickeln
DS: Management-Unterstützung, Entscheidungsfindung
Anfragen:
OR: Meist einfach, strukturiert, statisch, einzelne Datensätze
DS: Oft komplex durch Abfragen mit Detailansichten, ad-hoc, Bereichsanfragen mit Aggregation
Datenvolumen:
OR: Mega- / Gigabytes
DS: Giga- /Terrabytes
Porter ́sche Wertschöpfungskette und deren Bedeutungfür das Geschäftsprozessmanagement
Primärprozesse (Ausführungsprozesse)
Funktionsübergreifende Prozesse, die für Kunden Wert schöpfen
Bündeln primären, für den Unternehmenserfolgt unentbehrlichen Aktivitäten
Jeder Schritt in Primärprozess dient um Wert für Kunden zu generieren
Unterstützungsprozesse
Stellen die nötigen Ressourcen und die Infrastruktur für die Ausführungsprozesse bereit
Sind nur indirekt an Wertschöpfung für Kunden beteiligt
Haben direkten Einfluss auf die Effizienz der Primärprozesse
Prozessorientiere Betrachtungsweise vs. funktionsorientierte
Funktion:
Organisation primär nach Funktion, Produkt, Region oder Projekt strukturiert
Zuerst Aufbauorganisation, danach Ablauforganisation
Viele Schnittstellen bei Bearbeitung, Wechsel von Veranwtrortlichkeiten, kein Prozessverantwortlicher
Prozess:
durchgängige Prozesse zwischen Beschaffungs- und Absatzmarkt ohne Schnittstellen
Ablauforganisation wird durch das Kundenproblem bestimmt
Vernantwortlichkeiten für Prozesse
Was ist geschäftsprozessmanagement
Es beschäftigt sich mit der systematischen Gestaltung, Steuerung, Überwachung und Weiterentwicklung der Geschäftsprozesse eines Unternehmens
Geschäftsprozessmanagement- Kreislauf
Strategisches Projektmanagement (z.B. Ziele festlegen)
Prozessentwurf (z.B. Prozesse modellieren)
Prozessimplementierung (z.B. Informationssysteme integrieren)
Prozesscontrolling (z.B. Kennzahlen erheben)
Was ist Kaizen + welche Methoden wendet man in diesem Konzept an
Botschaft: Kein Tag ohne irgendeine Verbesserung im Unternehmen
Ziele:
Identifizierung und Vermeidung von Fehlern und Ineffizienzen
Wahrnehmung von Wualität als ständige Aufgabe aller Mitarbeiter
Merkmale:
Fokussierung auf den Prozess, weniger auf Ergebnis
Permanente Steigerung der Prozessleistung durch Verbesserung in kleinen Schritten
Orientierung an den Wünschen der internen und externen Kunden
Methoden:
PDCA-Zyklus (Plan-Do-Control-Act) (Act = Verbesserung)
Teilautonome Arbeitsgruppen
Qualitätszirkel, Qualitätsfachgruppen, Steuergruppe
Eigenverantwortlichkeit der Mitarbeiter
Benchmarking
Wesentliche Ansatz Six-Sigma-Konzepts
Produkte, Prozesse und Dienstleistungen sollen von Fehlern befreit werden, Kosten runter Produktivität hoch
Qualitätsniveau von 3,4 Fehler bei einer Millionen Fehlermöglichkeiten in Produkten, Prozessen und Dienstleistungen
Variation eines Prozesses soll verringert werden und dadurch eine Qualitätssteigerung und Erhöhung der Kundenzufriedenheit -> Null-Fehler-Strategie
DMAIC: Für bestehende Prozesse
DMADV: Für neue Prozesse
5 Maßnahmen Steigerung der Prozesseffizienz
Weglassen
Ergänzen
Verlagern (z.B. früher Beginn von bisher nachgelagerten Aktivitäten)
Auslagern
Parallelisieren
5 Elemente einer Prozessbeschreibung / Prozesssteckbrief
Prozessname
Prozessvernatwortlicher
Prozessstart
Prozessbeschreibung
Prozesskunde
Komponenten Workflow
Arbeitsaufgabe
Arbeitsgruppe
Arbeitsprozess
Arbeitshilfsmittel
Arbeitsgegenstand
Was ist Business Intuition?
Fällen von geschäftlichen Entscheidungen auf Basis unzureichender Information
Erfolgreicher Einsatz von Intuition als Werkzeug im Management
Was ist ein Data Warehouse
Datenbank, in der Daten aus unterschiedlichen Quellen in einem einheitlichen Format für analytische Anwendungen integriert werden
DWH ist die zentrale Datenbank in einem DWH-System (es gibt noch andere DBs)
Single-Point-Of-Truth(allgemeingültiger Datenbestand)
Erläutern Sie den Zusammenhang von Business Intelligence und
Geschäftsprozessmanagement im Rahmen von BT?
GPM: Erhebung, Gestaltung, Dokumentation und Umsetzung von Prozessen
BI: Sammelbegriff für Abfrage-,Analyse-und Reporting-Verfahren zur Informationsgewinnung im betrieblichen Einsatz
Erweiterung von BI durch prozessorientierte Werkzeuge für Planung, Prognosen und Simulationen und dabei in den Bereich des Geschäftsprozessmanagements vorgedrungen ist.
Erläutern Sie, warum reine Intuition oder Trial-and-Error-Ansätze für Mana
gement-Entscheidungen heutzutage in der Regel nicht ausreichend sind!
Als gutes Beispiel dient Nokia, die im Jahr 2007 noch sehr hohe Marktanteile besaß, aber sie schnell Marktanteile verlor, weil sie die Entwicklung auf dem Smartphone Mark verschlafen hat.
Business Intelligence kann dabei helfen, diese Entwicklung am Markt frühzeitig am Markt zu erkennen. So ist der Business Intuition Ansatz nicht erfolgsversprechend, da das Fällen von geschäftlichen Entscheidungen auf Basis unzureichender Informationen getroffenwird.
Nennen und erläutern Sie Einflussfaktoren auf Unternehmen, welche den Einsatz von BI-Systemen fördern!
Konkurrenz; Konkurrenzunternehmen können durch Preis, Innovation, etc. das Unternehmen gefährden
Kundenanforderungen; Der Wünsche und Bedürfnisse der Kunden verstehen
Erläutern Sie die Nachteile einer gewachsenen Architektur von verschiedenen Reporting-Systemen, die ohne DWH direkt auf die operativen Datenquellen zugreifen!
keine einheitliche Datenstruktur
Duplikate, da gleiche Daten in mehreren Data Marts(Teilbestand Datenlager) abgelegt sind
inkonsistenter Zustand der Daten, da die Pflege von verschiedenen Systemen herkommen
Was versteht man unter dem Begriff Business Intelligence?
Verfahren, Prozesse und Technologien zur systematischen Analyse (Sammlung, Auswertung und Darstellung) von Daten in elektronischer Form mit dem Ziel der Gewinnung von Erkenntnissen, die in Hinsicht auf die Unternehmensziele bessere operative oder strategische Entscheidungen ermöglichen
BI ist ein Prozess, der Wissen über eigene und fremde Positionen, Potenziale und Perspektiven generiert.
Typische fachliche Fragestellungen aus dem Bereich
Vertrieb, für deren Beantwortung BI-Systeme eingesetzt werden. Welche Art von Analysesystem kommt dabei zum Einsatz?
Der Vertrieb möchte wissen, wie Rabattaktionen wirken und wie hoch Rabatte tatsächlich sein müssen, um verkaufserhöhende Wirkungen zu erzielen. Zu hohe Rabatte an Kunden, die ohnehin kaufen, wirken sich negativ auf die Erträge auf. Rabattoptimierung vermindert Druck auf die Margen und verbessert die Ertragssituation.
Unternehmensführung, für deren Beantwortung BI-Systeme eingesetzt werden. Welche Art von Analysesystem kommt dabei zum Einsatz?
Die Unternehmensführung interessiert sich beispielsweise dafür, Muster zu erkennen, wann und welche Mitarbeiter ein Unternehmen verlassen wollen oder wie neue Mitarbeiter sich leistungsmäßig entwickeln werden.
Sowie Analyse und Prognose von Zahlungsausfällen von hohem Stellenwert. Hier kann man mittels Data Mining beispielsweise erkennen, bei welchen Kunden überdurchschnittliche Zahlungsausfallrisiken bestehen und wie durch verbesserte Kreditvergabeprozesse Ausfallquoten gesenkt werden können.
Marketing, für deren Beantwortung BI-Systeme eingesetzt werden. Welche Art von Analysesystem kommt dabei zum Einsatz?
Die Marketingabteilung kann durch Analyse der Klickpfade der Unternehmenswebsite feststellen, welche Informationen für Besucher der Website besonders interessant sind und durch entsprechende Gestaltung Attraktivität und Besuchsfrequenz der Unternehmenswebsite erhöhen.
Unterschied absoluten und relativen Kennzahlen
Absolute Kennzahlen:
Bestände
Summen
Differenzen (Gewinn)
Relative Kennzahlen:
Beziehungskennzahlen(A/B, z.B. EUR/h)
Gliederungskennzahlen(% Anteile, z.B. Marktanteil)
Indexkennzahlen(Preisindex)
Erläutern Sie, was ein Kennzahlensystem ist!
hierarchische Zusammenführung von
betriebswirtschaftlichen Kennzahlen, die
miteinander in Beziehung stehen
Ziel: vollständig über einen Sachverhalt (z. B. Unternehmensbereich, Rentabilität) zu informieren
Einsatz bei Planung und Kontrolle der Leistung des Unternehmens oder einzelner Bereiche
Berücksichtigen i.d.R. nur monetäre, exakt quantifizierbare Kennzahlen
Warum ist die Steuerung eines Unternehmens über Kennzahlen allein problematisch? Wie würden Sie vorgehen?
In manchen Fällen müssen einzelne Sachverhalte genauer überprüft werden. Das alleinige Verlassen auf Kennzahlen, kann zu einem Risiko führen. Kennzahlen können dabei helfen, Zusammenhänge auf zu decken. Stellen Sie anhand der Kennzahlen konkrete Hypothesen auf und überprüfen Sie dann durch entsprechende Messungen und Berechnungen, ob Ihre Vermutung richtig ist.
Was versteht man unter operativen Daten? Nennen Sie einige charakteristische Eigenschaften!
Dienen dem eigentlichen Geschäftszweck / Tätigkeitsfeld des Unternehmens
werden generiert von Abrechnungs-, Produktionssteuerungs-, Warenwirtschafts-, Logistik-Systemen etc.
Was versteht man unter dispositiven Daten? Nennen Sie einige charakteristische Eigenschaften
unterstützen das Management bei Entscheidungen zur Steuerung oder strategischen Ausrichtung des Unternehmens
werden aus operativen Daten abgeleitet
Erläutern Sie Unterschiede zwischen operativen und dispositiven Daten.
Ziel
Transaktionen
Anfragen
Anwendertyp
Operative System
Dispositive System
Geschäftsprozesse abwickeln
Management-Unterstützung, Entscheidungsfind.
laufend kurze Lese- und Schreib-Transaktionen; Insert, Update, Delete
Ergänzend; Fortschreibung aggregierter Daten; hauptsächlich Insert
Anrfagen
meist einfach, strukturiert, statisch, einzelne Datensätze
oft komplex, ad-hoc; Bereichsanfragen mit Aggregation
Sachbearbeiter
Manager, Controller, Analyst
Wodurch unterscheiden sich operative IT-Systeme von dispositiven IT-Systemen in Bezug auf System- und Daten-Charakteristik?
Datenquellen
Modellierung
Zeitbezug
Zustand
Datenvolumen
Operative Systeme
Dispositive Systeme
meist eine
Integration mehrerer Quellen
funktionsorientiert; Fokussierung auf eizelnes Objekt/einzelne Transaktionen
auswertungsorientiert; Fokussierung auf Aggregation von Kennzahlen über hierarchisch strukturierte Dimensionen
aktuell, zeitpunktbezogen
zeitraumbezogen
oft unkontrolliert, redundant und inkonsistent
bereinigt, konsistent; kontrollierte Redundanz für Performance
Mega-/Gigabytes
Giga-/Terrabytes
Skizzieren Sie die Schichtenarchitektur eines BI-Systems und erläutern Sie jede Schicht!
Nennen Sie und erläutern Sie die unterschiedlichen Arten von Analysesystemen!
Reportings; Keine oder wenige Interaktionsmöglichkeiten für Anwender
Interaktive Analyse; interkaktive Tabellen und Grafiken, freie Navigation in Daten OLAP
Statistische Analyse; Einsatz explorativer statistischer Methoden Data Mining
Was versteht man unter Daten-, Analyse-, Entscheidungs- und Umsetzungslatenz?
Datenlatenz; Zeit, die vergeht, bis Daten zur Auswertung im BI-System zur Verfügung stehen
Analyselatenz; Zeit, die vergeht, bis die Daten ausgewertet und für die Verteilung/Präsentation aufbereitet sind
Entscheidungslatenz; Zeit, die vergeht, bis aufgrund der Analyse eine Entscheidung getroffen wurde oft der größte Zeitfaktor
Umsetzungslatenz; Zeit, die vergeht, bis die beschlossenen Maßnahmen umgesetzt werden
Was ist die Aktionszeit in einem BI-System und wie setzt Sie sich zusammen?
Zeitraum zwischen Erfassung eines Geschäftsvorfalls in operativen Systemen und daraus resultierenden Maßnahmen.
Setzt sich zusammen aus Datenlatenz, Analyselatenz, Entscheidungslatenz und Umsetzungslatenz.
Auf welche Art von Latenz wirken sich Mobile BI-Lösungen aus?
Datenanalyse für unterwegs, durch bspw. responsive Webanwendung. Reduzierung der Analyselatenz; Zeit, die vergeht, bis die Daten ausgewertet und für die Verteilung/Präsentation aufbereitet sind, da die Daten stets verfügbar sind.
Auf welche Art von Latenz wirken sich Self-Service-BI Lösungen aus?
Selbstständiger Einsatz von OLAP- und Datenvisualisierungswerkzeugen durch Endanwender ohne Beteiligung der IT-Abteilung, deshalb Umsetzungslatenz; Zeit, die vergeht, bis die beschlossene Maßnahmen umgesetzt werden und reduziert.
Welche Nachteile ergeben sich daraus, wenn analytische Informationssysteme direkt auf operative Datenbestände zugreifen?
- Separation analytischer Systemlast von Transaktionsverarbeitung
- Integration mehrere Datenquellen in einen Single-Point-of-Truth
- Reduktion der Komplexität der Datenmodelle für einfacheres Reporting und Ad-hoc-Analysen
- Steigerung der Anfrageperformance durch optimierte Datenmodelle
- Vorhalten längerer Zeitreihen
- Versionierung von Stammdaten, ohne Änderung der Transaktionssysteme
Was versteht man unter den Begriffen OLTP und OLAP?
OLTP: (Online Transaction Processing)
Stamm- und Prozessdatenverwaltung
Operative Geschäftsprozesse werden mittels OLTP-Systeme im Unternehmen abgebildet (ERP-System)
OLAP: (Online Analytical Processing)
hoch effektices Analyse- und Auswertungskonzept für große Datenmengen, die in mehrdimensionalen Würfeln (Cubes/OLAP- oder Info-Cubes), häufig schon in aggregierter verdichteter Form organisiert sind
-> OLAP- und OLTP-Systeme ergänzen sich im Unternehmen funktional wechselseitig
Was sind die Komponenten einer Data Warehouse (Referenz- Architektur)? Nennen Sie jede und erläutern Sie Ihre Rolle im DWH-Prozess.
(Core) Data Warehouse
Kernkomponente der Architektur basiert meistens auf einer relationalen Datenbank Befüllung (über Staging Area) aus operativen Quellsystemen oder vorgelagerten ODS(Datenbanktyp)
Historisierungsschicht
Data Marts
Auswertungsorientierte, performance-optimierte, physisch materialisierte Teilmenge des Core-DWH
Datenbereitstellungsschicht
Staging Area
(meist) relationale Datenbasis
Integrationsschicht
Operational-Data-Store (ODS)
Kombination aus operativem und dispositivem System
Hauptsächlich für Analysen im operativen Kontext
Unterstützung operativen und taktischer Entscheidungen
near realtime Analysen zum aktuellen Tagesgeschäft auf granularer Ebene
Was bedeutet ETL?
Extraktion: Selektion eines Ausschnitts der Daten aus Quellen- ausgeführt an den entsprechenden Quellen
Transformation: Aufbereitung und Anpassung der Daten an vorgegebene Schema- und Qualitätsanforderungen - ausgeführt im temporären Arbeitsbereich (Data Staging Area)
Laden: Physische Einbringung der Daten aus Arbeitsbereich in das DWH, einschließlich evtl. notwendiger Aggregationen
Welchem Zweck dient ETL?
Überführung der an speziellen operativen Anwendungsfeldern orientierten Quelldaten in themenorientierte DWH-Daten, die dem Informationsbedarf des Managements entsprechen
Was ist Staging Area und welche Rolle spielt sie im DWH-Prozess
Staging Area:
Unterstützung des Ladenprozesses für das Core DWH
Temporäre Datenhaltung in der DB, um mit relationalen Mitteln die Bereinigung und Tranformation zu unterstützen
Nennen Sie Kriterien, wonach Quelldaten unterschieden werden können, und geben Sie Beispiele!
Quelldaten stammen aus operativen Datenbeständen, aber auch externen Daten wie Online-Dienste. Beispiele für operativen Systeme sind Daten aus SCM, ERP, CRM und E-Procurement.
Was versteht man unter Stamm- und Bewegungsdaten im Unternehmen? Was ist die Motivation für das Stammdaten-Management?
Stamm- und Bewegungsdaten sind die operativen Daten, mit dem ein ERP-System wie SAP das Tagesgeschäft abwickelt.
Stammdaten sind z.B. Kreditoren, Betriebe, Hausnummer. Stammdaten haben im Unterschied zu Bewegungsdaten eine sehr lange Gültigkeit und werden nur in Ausnahmen verändert.
Bewegungsdaten sind dynamisch. Sie haben in der Regel einen zeitlichen Bezug. Als Beispiel dient eine Bestellung, Produktpreise, Bestellmenge etc.
Wozu dient der Transformationsprozess?
Der Transformationsprozess umfasst alle Aktivitäten zur Umwandlung der operativen Daten in betriebswirtschaftlich interpretierbare Daten. Er setzt sich aus den Teilprozessen der Filterung, der Harmonisierung, der Aggregation sowie der Anreicherung zusammen.
Was versteht man unter der Bereinigung im Extraktionsprozess?
Auch Data Cleansing oder Data Scrubbing genannt. Befreiung der extrahierten Daten sowohl von syntaktischen als auch semantischen Mängel
-> Mängel 1., 2., 3. Klasse
Nennen Sie Beispiele für syntaktische und semantische Mängel!
Syntaktische Mängel:
Bekannte Formatanpassungen, erkennbare Formatinkompatibilität
Semantische Mängel:
Fehlende Datenwerte, Ausreißer, unstimmige Wertkonstellationen
Erläutern Sie die Mängelklassifikation (nach Kemper)
Klasse 1:
syntaktisch: bewirkt durch interne Format., Steuer-, oder Sonderzeichen - werden über Zuordnungstabellen bearbeitet
semantisch: fehlende IST-Werte werden durch vorher festgelegte äquivalente Werte ersetzt
Klasse 2:
syntaktisch: neue Syntaxvarianten müssen durch technische Spezialisten manuell berichtigt werden und somit zu Mängeln der Klasse 1
semantisch: Fehler in den operativen Datenquellen werden durch Plausibilitätskontrollen erkannt und bedürfen kurz- oder mittelfristiger Korrekturmaßnahmen in den betroffenen operativen Datenquellen
Klasse 3:
syntaktisch: keine
semantisch: unkorrekte Datenwerte in den extrahierten Daten werden nur durch betriebswirtschaftliche Fachexperten erkannt und bedürfen kurz- oder mittelfristiger Korrekturmaßnahmen in den betroffenen operativen Quellsystemen und bis zur Korrekturimplementierung Berichtigung der semantischen Fehler in der Filterungsschicht des DWH
Nennen Sie die wesentlichen Aufgaben der syntaktischen Harmonisierung und beschreiben Sie diese!
Problem: Operative und externe Datenbestände weisen meist eine hohe Heterogenität auf. Die operative Daten müssen vereinheitlicht, d. h. syntaktisch harmon- isiert werden.
Lösung:
Einsatz umfangreicher Transformationsregeln
Schlüsselbehandlung (Schlüsseldisharmonie)
Kondierungskonvertierung
Synonyme / Homonyme
Was versteht man unter einer Schlüsseldisharmonie?
Schlüsseldisharmonien basieren auf Unverträglichkeiten der Primärschlüssel in den extrahierten und bereinigten Daten und entstehen durch die Verwendung unterschiedlicher Zugriffsschlüssel in der operativen Datenhaltung.
Nennen Sie ein Beispiel für eine betriebswirtschaftliche Harmonisierung von Daten!
Transformationsregel, die das operative Datenmaterial in Bezug auf die betriebswirtschaftliche Bedeutung, die gebiets- und ressortspezifische Gültigkeit, die Währung oder die Periodenzuordnung in einheitliche Werte überführen.
Bsp. Einheitliche Währung € und nicht $
Erläutern Sie die grundlegenden Strukturen des multidimensionalen Datenmodells (MD) an einem dreidimensionalen Beispiel?
Beispiel eines Onlinehandels der in der ersten Dimension die Regionen Ost, West, Süd und Nord abbildet. In der Zweiten die Produkte, wie Laptop, Tablet etc. In der dritten Dimension wird die Zeit abgebildet, wie 1., 2., 3. und 4.Quartal.
Nennen und erläutern Sie die typischen OLAP-Operationen, für die das multidimensionale Datenmodell konzipiert wurde!
Slice: Herausschneiden von ”Scheiben“ aus dem Würfel durch Einschränkung (Selektion) auf einer Dimension
Verringerung der Dimensionalität
Dice: Herausschneiden einen ”Teilwürfels“ durch Selektion auf mehreren Dimensionen
unterschiedlichste mehrdimensionale Aggregationen / Gruppierungen
Pivot (Austausch von Dimensionen), Sortierung, Top-n-Anfragen
Was ist der Mehrwert des multidimensionalen Datenmodells gegenüber dem relationalen Datenmodell?
· Betrachtung aus mehreren Perspektiven (zeitlich, regional, produktbezogen) → Dimensionen
· Navigationsstrukturen für Aggregation (Konsolidierungsebenen) werden explizit modelliert
· Relationale Abbildung über Star-/Snowflake Schema trotzdem möglich
Wo finden sich funktionale Abhängigkeiten in den Dimensionen vom multidimensionalen Datenmodell?
Die Mehrzahl der Dimensionstabellen beinhalten funktionale Abhängigkeiten zwischen Nicht-Schlüsselattributen und sind somit nicht normalisiert.
Was ist Data Mining?
Prozess, der aus einer Datenmenge implizit vorhandene, aber bisher unentdeckte, nützliche Informationen extrahiert
Welche Aufgabenstellung gibt es im Data Mining? Nennen Sie jeweils ein Beispiel!
Clustering/Segmentierung (Bildung von Gruppen)
Objekte repräsentierende Datensätze werden zu Gruppen zusammengefasst, so dass Elemente einer Gruppe möglichst ähnlich und Elemente verschiedener Gruppen möglichst verschieden
Gruppen sind grundsätzlich nicht bekannt (Gegensatz zur Klassifikation)
Klassifikation (Erklärung von Gruppen)
Abbildung von Elementen in vorgegebene und bekannte Klassen
z.B. Kundenklassifikation aufgrund von Kreditwürdigkeit
Regression (Erklärung von Zusammenhängen, Prognosen)
Erklärung einer stetigen Variablen durch mehrere unabhängigen Variablen
Variablenabängigkeit werden vorgegeben
z.B. Prognose für Absatz Automobile
Abhängigkeitsentdeckung (Beschreibung von Zusammenhängen)
Variablenabhängigkeit werden nicht vorgegegeben
z.B. Warenkorbanalyse
Wie unterscheiden sich KDD und Data Mining voneinander?
Datamining ist der Analyse-Teil des KDD-Prozesses
Nennen Sie die Phasen des Crisp-DM-Prozesses und beschreiben Sie sie kurz!
Business Understanding (Verständnis des Geschäftsziels)
Verständnis der Ziele und Anforderungen aus der Business Perspektive
Was soll mit Data Mining erreicht werden?
Data Understanding (Datenverständnis)
Was für Daten sind vorhanden?
Wie ist die Qualität der Daten?
Was für Teilmengen lassen sich für die Ableitung von Hypothesen über unbekannte Zusammenhänge bilden?
Data Preparation (Datenvorbereitung)
Vorbereitung bzw. Aufbereitung der Input-Daten für das Data Mining
Auswahl von Tabellen und Attributen, Festlegung von Filterbedingungen, Transformation, Bereinigung (ETL)
Modeling (eigentliches Data Mining)
Nutzung von Data Mining zur Erstellung eines Modells
Evaluation (Bewertung)
Modell ist erstellt und muss nun auf seine Qualität in bewertet werden
Überprüfung der Rahmenbedingungen und Einsatzfähigkeit
Erfüllt das Modell den Geschäftszweck?
Deployment (Anwendung)
Anwendung des Modells im Entscheidungsprozess
Mögliche Formen: Erstellung eines Berichts, Integration von Scorings oder Regeln in das operative System
Unterschied zwischen Klassifikation und Clustering
Klassifikation
Klassen/Gruppen sind vorgegeben
Clustering:
Gruppen ähnlicher Elemente sollen gefunden werden
Geben Sie ein Beispiel für eine Assoziationsanalyse
Die Assoziationsanalyse ist ein Verfahren des Data Mining, mit dem Zusammenhänge und Abhängigkeiten in einer Datenbasis entdeckt werden sollen.
Welche Klassifikationsalgorithmen kennen sie - wodurch unterscheiden sich diese?
Prototyp basierte Lernverfahren
interpretierbar
wenig Parameter
Beispiel: GLVQ
Deep neural Network
nicht interpretierbar
viele Parameter
auch mit großen Datenmengen umsetzbar
Kernel Ansätze
Support Vector Machine (SVM)
interpretierbar bei linearem Kernel
einige Parameter
Zuletzt geändertvor 2 Jahren