ISO/IEC 2382-1 Information Technology – Vocabulary
Data: a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation, or processing
Information: knowledge concerning objects, such as facts, events, things, processes, or ideas, including concepts, that within a certain context has a particular meaning
Unstrukturierte Daten
Daten, die aber (noch) keiner formalen Struktur unterliegen, bzw. in keiner Struktur vorliegen die „einfach“ genutzt werden kann
Unstrukturierte Daten enthalten oft Mehrdeutigkeit und und andere „Irregularitäten“, wodurch es schwierig ist sie zu automatisiert zu verarbeiten
Strukturierte Daten
Den Daten liegt ein Schema zugrunde, bspw. in Form von Relationen (Tabellen) und Spalten dieser Tabellen, jeweils mit zugeordneten Datentypen
Eine Instanz eines solchen Schemas sind Daten, die diesem Schema entsprechen.
Semistrukturierte Daten
Semistrukturierte Daten werden oft als „schemalos“ oder „selbstbeschreibend“ bezeichnet
Sie unterliegen keiner vordefinierten Struktur, sondern beschreiben ihre Struktur selbst
verkraften Abweichungen in der Struktur
Struktur nicht komplett zufällig ist, sondern nahe an gewissen Typen, ist es möglich auch semistrukturierte Daten abzufragen
Flexibilität wichtiger als Spezifität
egal, dass wir Datentypen nicht explizit repräsentieren, wir annotieren jedes Datum einfach explizit mit einer Beschreibung (name, telefon, email, ...), es beschreibt sich damit also selbst.
Durch das Weglassen von Datentypen und Hinzufügen von Beschreibungen geht keine Information verloren
Wozu Datenmodellierung
Ermöglichen
(komplexe) maschinelle Operationen auf Daten
Ermöglichen den Austausch und das Zusammenführen von Daten
idealerweise Interpretation von und Kommunikation über Daten
Stufen der Datenmodellierung
Konzeptuelle Modellierung: Welche Merkmale des Originale soll mein Modell abbilden?
Logische Modellierung: Abbildung des konzeptuellen Modells mittels einer bestimmten Datenstruktur/Technologie (z.B. XML, RDF, JSON, ...)
Physikalische Modellierung: Implementierung des logischen Modells (z.B. Indizierung von Tabellen in Datenbanken)
Entity-Relationship-Model (ERM)
Entitäten: grundlegenden Einheiten des Modells
Attribute: Eigenschaften der Entitäten?
Relationen: Beziehungen zwischen Entitäten
Last changed5 months ago