Daten
Warum gibt es keine einheitliche Definition von „Daten“?
Weil jedes Fachgebiet den Begriff anders nutzt:
Juristen /Recht: Daten = Infos über Personen (z. B. Adresse, Geburtsdatum).
Volkswirtschaft/Ökonometrie: Daten = Abbild wirtschaftlicher Vorgänge.
Informatiker: Daten = digitale, maschinenlesbare Darstellung von Information. Kurz: „Daten“ ist ein Kontextwort, es bedeutet je nach Fach was anderes.
Was sagt die Informatik/ISO-Definition über Daten?
Daten sind eine formalisierte Darstellung von Information, die man wieder interpretieren kann. Einfach gesagt: Daten sind Infos so gespeichert, dass Computer sie verstehen, verarbeiten und weitergeben können.
Wie hängen Zeichen, Daten, Information und Wissen zusammen?
Zeichen = kleinste Bausteine (Zahlen, Buchstaben, Sonderzeichen).
Daten = Zeichen, die nach Regeln (Syntax) sinnvoll geordnet sind.
Information = Daten mit Kontext → plötzlich versteht man, was gemeint ist.
Wissen = verknüpfte Informationen + Erfahrung + Fachwissen → damit kann man Entscheidungen treffen. Bildlich: Zeichen = Buchstaben → Daten = Worte → Information = Satz mit Bedeutung → Wissen = Geschichte mit Sinn.
Welche Rolle spielt Syntax bei Daten?
Syntaxregeln ordnen Zeichen zu Aussagen. So entstehen Daten, die messbar, ordnbar und strukturierbar sind.
Wann werden Daten zu Informationen?
Wenn sie in einen Kontext gesetzt werden und dadurch Bedeutung erhalten.
Auf diese Weise werden Daten zu Informationen.
Wie entsteht Wissen aus Informationen?
Durch Verknüpfung von Informationen mit Erfahrungen, Wertvorstellungen und Fachkenntnissen zu einem Netzwerk.
Welche Bedeutung hat Wissen für Unternehmen?
Das Wissen – es entsteht durch Verknüpfung von Informationen mit Erfahrungen, Werten und Fachkenntnissen. Es ist komplexer als Information, zählt zu den höchsten Gütern einer Unternehmung und ermöglicht Entscheidungen und Handlungen
Unternehmensdaten
Was sind Unternehmensdaten?
Nenne Beispiele für Unternehmensdaten.
Alle Daten, die im betrieblichen Kontext zur Unterstützung von Leistungsprozessen und Wertschöpfung genutzt werden.
Warendaten
Kundendaten
Materialdaten
Lieferantendaten
Mitarbeiterdaten
Ohne diese Daten wüsste ein Unternehmen nicht, was es verkauft, an wen es verkauft oder wie viel auf Lager liegt.
Was ist der Unterschied zwischen Stammdaten und Bestandsdaten?
Stammdaten = die Grundinfos, die sich kaum ändern, wie Name, Adresse eines Kunden oder Produktbeschreibung. Man kann sagen: „Das sind die Visitenkarten des Unternehmens.“
Bestandsdaten = (Abbildung erfasster Bestände von Objekten, fortlaufend verarbeitet. Beispiel: Lagerbestände, Kontobestände) Wie viel gerade da ist, z. B. 200 Stück im Lager oder 1.000 € auf dem Konto. Diese ändern sich ständig.
Was ist der Unterschied zwischen Änderungsdaten und Bewegungsdaten?
Änderungsdaten: Wenn sich an den Grundinfos (Stammdaten) etwas ändert – zum Beispiel ein Kunde zieht um → neue Adresse. (durch Löschen, Hinzufügen oder Anpassen)
Bewegungsdaten: Wenn sich Bestände ändern – zum Beispiel eine Lieferung kommt ins Lager (Zugang) oder Ware wird verkauft (Abgang). (Veränderungen von Bestandsdaten, z. B. Zugang/Abgang von Mengen oder Werten in Lager- oder Kontobeständen.)
Welche typischen Eigenschaften haben Unternehmensdaten?
Datenvolumen: Meist überschaubar, außer bei Riesen wie Amazon (tausende Sendungen pro Minute).
Vielfalt (Variety): Oft nur wenige Quellen und Arten von Daten.
Geschwindigkeit (Velocity): Daten werden meist nicht sofort, sondern in „Paketen“ (Batch) verarbeitet → keine Echtzeit.
Frage: Woher kommt Big Data und wohin entwickelt es sich?
1960er: Lochkarten, Großrechner – primitive Datenverarbeitung.
1980er: PC & Internet → Transaktionen, Datenbanken.
2000er: Relationale DBs, Datenexplosion → aus „Data“ wird „Big Data“.
2010+: Riesige, unstrukturierte Daten → Data Lakes als Zwischenlösung.
Heute/Morgen: KI, Cloud, IoT, Web 3.0, Industrie 4.0 → Datenströme in Echtzeit.
Was sind die 4 Vs von Big Data?
Volume (Menge): Datenexplosion (GB → TB → PB → EB …).
Variety (Vielfalt): Viele Quellen & Arten (Social Media, IoT, Sensoren, Multimedia).
Velocity (Geschwindigkeit): Von Batch zu Echtzeit, Datenströme im Millisekundentakt.
Veracity (Wahrheit): Datenqualität – sind sie vollständig, korrekt, zuverlässig?
Warum ist Volume (Menge) ein Problem?
Weil klassische Systeme Datenmengen in Petabyte oder Exabyte nicht mehr bewältigen → braucht zentrale Organisation und neue Speicher-/Analyseverfahren.
Warum ist Veracity (Wahrheit) wichtig?
Schlechte Daten = schlechte Entscheidungen. Unvollständige oder fehlerhafte Daten sind gefährlich. Problem: Wie misst man Qualität bei unstrukturierten Daten?
Warum ist Variety (Vielfalt) wichtig?
Früher nur wenige Quellen, heute viele: Social Media, Produktbewertungen, Sensoren. Unternehmen müssen lernen, mit neuen Datenarten umzugehen.
Warum ist Velocity (Geschwindigkeit) kritisch?
Daten müssen rechtzeitig verarbeitet werden → Echtzeitverarbeitung mit In-Memory-Technologien (z. B. SAP HANA). Beispiel: 500 Mio. Tweets pro Tag.
Was ist Big Data laut Definition (De Mauro 2016)?
Daten in großer Menge, Vielfalt, Geschwindigkeit aus vielen Quellen, oft unstrukturiert → man braucht spezielle Technologien, um daraus Informationen und Wert zu gewinnen.
Welche Anforderungen stellen die 5C an Big Data?
Clean Data → saubere, bereinigte Daten.
Consistent Data → konsistente Datenbasis, keine Widersprüche.
Conformed Data → einheitliche Standards & Regeln.
Current Data → aktuelle, Echtzeit-Daten.
Comprehensive Data → umfassende, vollständige Datenbasis für Entscheidungen.
Was sind strukturierte, unstrukturierte und semistrukturierte Daten?
Strukturierte Daten: Klar in Tabellen (Zeilen/Spalten) organisiert, leicht von Computern lesbar und abfragbar (z. B. Kundendaten in SQL).
Unstrukturierte Daten: Kein festes Format, schwer zu verarbeiten (z. B. Texte, Bilder, Audio, Social Media). → brauchen Analyseverfahren wie Texterkennung.
Semistrukturierte Daten: Haben keine starre Tabellenstruktur, aber gewisse Markierungen/Tags (z. B. XML, JSON), die Inhalte kennzeichnen.
Was ist der Unterschied zwischen strukturierten und unstrukturierten Daten?
Strukturiert: folgen einem Modell, haben definierte Typen und Längen, sind einfach zu speichern, durchsuchen und analysieren.
Unstrukturiert: keine feste Struktur, vielfältige Formate, nicht für relationale Datenbanken geeignet, schwer zu ordnen. → Vergleich: Excel-Tabelle (strukturiert) vs. Sammlung von Fotos und Sprachnachrichten (unstrukturiert).
Wie sieht der Lebenszyklus von Daten aus?
Erzeugen → Daten entstehen (Sensoren, Logs, Eingaben).
Vorverarbeiten → Fehler bereinigen, Qualität verbessern.
Speichern → effizient ablegen, damit man schnell findet, was man braucht.
Nutzen → Abfragen, Analysen, Berichte.
Archivieren/Löschen → alte Daten lagern oder rechtlich vorgeschrieben löschen.
→ Merksatz: „Erzeugen – Vorverarbeiten – Speichern – Nutzen – Archivieren/Löschen.“
Was sind interne und externe Datenquellen?
Intern: Entstehen im Unternehmen selbst, aus Prozessen und Wertschöpfung (z. B. Stammdaten, Bestandsdaten, Bewegungsdaten).
Extern: Kommen von außen, meist aus dem Internet (z. B. Marktanalysen, Kundenbewertungen, Trends). → Kurz: Innen = eigene Prozesse, außen = Markt und Umwelt.
Wofür brauchen Unternehmen generell Daten?
Für drei Hauptzwecke:
Wertschöpfung – Daten sind eine Ressource, die Prozesse und Produkte unterstützt.
Entscheidungsfindung – bessere, schnellere, objektivere Entscheidungen.
Reporting – Überblick und Kontrolle über Abläufe und Ergebnisse.
Wie helfen Daten bei der Entscheidungsfindung?
Daten liefern eine fundierte Basis, machen Muster und Modelle sichtbar.
Sie zeigen, was in Zukunft passieren könnte → Entscheidungen werden messbarer und objektiver.
Beispiele:
Marketing: Personalisierte Angebote.
Innovation: Produkte an Kundenbedürfnisse anpassen.
Strategie: Zukunftsorientierte Planung durch externe Daten.
Welche vier Arten von Data Analytics gibt es und was machen sie?
Descriptive Analytics – Was ist passiert? (Vergangenheit beschreiben).
Diagnostic Analytics – Warum ist es passiert? (Ursachen analysieren).
Predictive Analytics – Was wird passieren? (Zukunft vorhersagen).
Prescriptive Analytics – Was soll ich tun? (Handlungsempfehlungen geben).
Merksatz: „DESIgn PRÄS“
DESI = Descriptive + Diagnostic → beschreibt und erklärt die Vergangenheit.
PRÄS = Predictive + Prescriptive → schaut in die Zukunft und gibt Empfehlungen.
Last changed4 days ago