Buffl

Fragen Kapitel 04-02-03

SE
by Simon E.

5. Data Mining kommt zwar häufig bei großen Datenmengen zum Einsatz, ist aber nicht auf Big Data beschränkt. Das Data Mining beschreibt den eigentlichen Vorgang der Analyse von Daten in Bezug auf relevante Zusammenhänge und Erkenntnisse und kann auch auf Datenbasis zur Anwendung kommen.


Die Datenbasis kann in einem

a) zentralen Data Warehouse (DWH),

b) einem Data Mart,

c) einem ODS,

d) einem Data Lake oder

e) aus externen Quellen

kommen.


Beschreiben und erklären sie die einzelnen Datenquellen?

a)

DWH Transformiert Daten aus Unterschiedlichen quellen in Strukturen die eine direkte Analyse ermöglichen (Schema on Write)


Seite 117 4 merge

---------------------------------------------------------------

b)

Datenwürfel (Data Mart)

• Teile der Daten aus der Basisdatenbank werden in einer effizienten Speicherform für Auswertungen gehalten.


Chat PDF: Seite 123 4 merge

---------------------------------------------------------------

c)

Operational Data Store (ODS)

Detaillierte, aber NICHT verdichtete Daten werden für kurze Zeit für Analysezwecke gehalten.


Seite 123 4 merge

---------------------------------------------------------------

d)

1) Data Lake:

- Speichert und Verwaltet daten im Originalformat

- Schema on Read

- Sehr Großer Speicher für Daten aus Unterschiedlichen Quellen


Seite 100 4 merge, Seite 117 4 merge

---------------------------------------------------------------

e)

Externe Quellen

- Externe Quellen (z.B. Google Maps) können genutzt werden.


- Deren Datenhaltung ist unbekannt aber auch nicht Relevant

Author

Simon E.

Information

Last changed