In welchen drei Dimensionen werden die Tätigkeiten der Data Science durchgeführt?
Datenfluss
Datenorganisation
Datenanalyse
Was liegt in der ersten Dimension Datenfluss?
Sammlung von Daten
Auflistung möglicher Quellen und Attribute
Daten müssen nachvollziehbar, vollständig (in gewissem Umfang) und zugänglich sein.
Was liegt in der zweiten Dimension Datenorganisation?
Datenorganisation = Verfeinerung gesammelter Daten:
Datenbereinigung: Daten werden von sogenannten Rauschen (Tippfehler bei der Dateneingabe) und "falschen" Ausreißern befreit.
Datenbeschreibung: Umfasst die Datenstruktur, Schemata in Datenbanken und die beschreibenden Metadaten
Datenveröffentlichung: Zur Verfügung stellen von Daten
Datensicherheit: Datensicherung und Schutz vor unberechtigtem Zugriff, sowie umsetzung der rechtlichen Rahmenbedinungen und Richtlinien.
Was liegt in der dritten Dimension Datenanalyse?
Deckt verborgene Muster in den Daten auf und wandelt die Daten in relevante, nützliche Informationen um.
Sagt zukünftige Ereignisse voraus, um Entscheidungsprozesse zu unterstützen und/oder zu automatisieren.
Zu Analysetechniken gehören: Modellierung und Simulation, maschinelles Lernen, künstliche Intelligez un statische Analyse.
Zuletzt geändertvor 2 Jahren