Was sind Daten?
Roh Fakten ohne Kontext
Aufträge, Kapazität, Liefertermine
Sind Gespeicherte Fakten über uns selbst, andere und unser Umfeld. Beispiele:
Kontobewegungen
Telefonnummern
Kontakte im Smartphone
Außentemperatur
Konzerttermine
Produktionsarbeitspläne
Bestände an Kunden- und Lieferantenaufträgen
Verwandte Begriffe:
Informationen = interpretierte Daten.
Kapazität reicht nicht aus um die Aufträge zum gesagten Termine zu liefern
Wissen = subjektiv bewertete Informationen.
Kapazität lassen durch zusätzliche Machienen oder Schichten erhöhen
Fertigungstermine wichtiger Aufträge unbedingt einhalten
Warum sind Daten Teuer?
Müssen gekauft, erhoben, gespeichert, verwaltet und ausgewertet werden.
Benötigen qualifiziertes Personal, Hard- und Software.
Beispiele:
Facebook kaufte WhatsApp für 14 Mrd. € (31 €/Nutzer).
Erste Steuersünder-CD (BND, 2006) kostete 4,6 Mio. €.
Datensatz (Adresse, Beruf, Alter etc.) kostet im Schnitt 18 Cent.
Aus welchen zwei Teilen bestehen Datenbanken
Datenbasis
Strukturierte Sammlung von Daten
Datenbankmanagementsystem (DBMS)
Verwaltung und Schutz des Datenbestands
Aufgaben:
Speichern und Verwalten von Daten
Zugriff ermöglichen (gleichzeitig für mehrere Benutzer)
Optimierung von Datenzugriffen
Sicherstellung von Datenschutz und Datensicherheit
Metapher: Bibliothek
Datenbasis: Alle Bücher der Bibliothek (geordnet, katalogisiert)
DBMS: Bibliothekar, der Ordnung hält, Bücher verwaltet, neuen Zugang organisiert und gleichzeitig Zugriff für viele Personen ermöglicht
Was ist das Drei-Schema-Architektur – oft „ANSI-SPARC-Architektur“
Beschreibungen einer Datenbank werden in drei klar getrennte Ebenen unterteilt
Ihr Zweck ist, Datenbanknutzer vor negativen Folgen zu schützen, wenn sich die innere Struktur einer Datenbank ändert.
Mit anderen Worten: Änderungen sollen möglichst keine Störungen für Anwendende verursachen.
Was ist die Externe Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?
Individuelle Benutzersichten auf die Daten
Genau auf die Anforderungen einer Benutzergruppe zugeschnitten
Enthält keine überflüssigen Dateneinheiten oder Beziehungen
Mehrere Benutzergruppen ⇒ mehrere externe Schemata
Unterstützt gleichzeitigen Multi-User-Betrieb
Benötigt ein Berechtigungskonzept für sicheren Zugriff
Was ist die Konzeptionelle Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?
Beschreibt logische Dateneinheiten (Entity) und Beziehungen (Relationship)
Enthält keine Datenwerte, nur deren Struktur
Beschreibung durch Datenmodell (hierarchisch, netzwerkartig, relational)
Keine Angaben zur physischen Speicherung
Vorteile
Stabile Beschreibung der Datenbasis
Einheitliche Dokumentation der Informationszusammenhänge
Änderungen erfolgen langsamer als in Anwendungen
Was ist die Interne Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?
Organisation der physischen Datenspeicherung
Physikalische Realisierung auf Speichermedien
Enthält Algorithmen zur Speicherung, Indizierung, Sortierung und Selektion
Know-how des Entwicklers, für Anwender verborgen
Was ist Datenunabhängugkeit und aus welchen zwei Arten besteht sie, bezogen auf einer DBMS, das eine Drei-Ebenen-Trennung (oder etwas Vergleichbares) unterstützt
Datenunabhängigkeit ist die Fähigkeit eines Datenbanksystems, Änderungen an der Datenstruktur vorzunehmen, ohne dass Anwendungen, die auf diese Daten zugreifen, angepasst werden müssen.
Es gibt zwei Arten von Datenunabhängigkeit:
Logische Datenunabhängigkeit:
Änderungen im logischen Schema (z. B. neue Felder) beeinflussen weder externe Schemata noch Anwendungen.
Physische Datenunabhängigkeit:
Änderungen im physischen Schema (z. B. Speicherort der Daten) haben keine Auswirkungen auf das logische Schema oder Anwendungen
Was ist Stand Alone Datenbank?
Kategorisierung von DBMS nach Betriebskonzept
Stand-Alone-Datenbank
Lokale Einzelplatzlösung, kein Mehrbenutzerzugriff
Einfaches internes Schema, meist ohne komplexe Berechtigungen
Beispiele: dBase, Access, Filemaker
Geeignet für einfache Anwendungen wie Adressverwaltung oder Buchhaltung
Was ist File-Share-Datenbank?
Mehrbenutzerzugriff innerhalb eines Netzwerks
Datenbank als zentrale Datei, auf die Clients zugreifen
Database Engine läuft auf jedem Client
Server speichert Daten, verwaltet sie aber nicht selbst
Vorteil: keine redundante Datenhaltung, Änderungen sofort für alle sichtbar
Nachteil: hoher Netzwerkverkehr bei gleichzeitigen Zugriffen, Sperrprobleme
Was versteht man unter Client-Server-Datenbank?
Welche Vor- und Nachteile hat eine relationale Datenbank?
Läuft auf dediziertem Server im Netzwerk
Server verwaltet Datenbank und verarbeitet Anfragen der Clients
Clients greifen nicht direkt auf Daten zu, sondern über Schnittstellen
Trennung von Datenverwaltung und Datenzugriff
Vorteile: hohe Sicherheit, gute Leistung, flexible Nutzung
Erfordert Betreuung durch Datenbankadministrator
Beispiele: Oracle, DB2, Microsoft SQL Server, MySQL, MAXDB
Was ist das hierarchisches Datenbankmodell?
Welche Vor- und Nachteile hat eine hierarchisches Datenbank?
Daten in hierarchischer (Baum-)Struktur organisiert
Beispiel: Unternehmen mit Abteilungen und Mitarbeitern
Nutzung: teilweise noch in Dateisystemen und XML-Entwicklung
Vorteile:
Übersichtliche Struktur
Technisch einfach
Sehr schneller Lesezugriff
Geeignet für große Datenmengen
Nachteile:
Starre Baumstruktur, keine Querverknüpfungen
Nachträgliche Änderungen schwierig
Heute meist von relationalen oder anderen modernen Modellen abgelöst
Was ist eine Netzwerkdatenbank?
Welche Vor- und Nachteile hat eine Netzwerdatenbank?
Erweiterung des hierarchischen Modells, um Hierarchien zu überwinden
Keine strikte Hierarchie, mehrere Suchwege möglich
Datenfeld besteht aus Name und Wert, Navigation durch die Daten möglich
Nutzung: netzartige Strukturen, z. B. geographische Netze, semantisches Web, soziale Netzwerke
keine strenge Hierarchie
mehrere Suchwege pro Datensatz
flexibler als hierarchische Datenbanken
leistungsfähiger als relationale Datenbanken
gute Integrität
unübersichtlich bei großen Datenmengen
Datenstruktur bestimmt Aufbau
kann aufwendig und kompliziert sein
Was ist eine relationale Datenbank?
Effizientes und flexibles Modell für die Datenspeicherung
Besteht aus Tabellen mit Zeilen (Tupeln) und Spalten (Attributen)
Tabellen sind durch Primär- und Fremdschlüssel miteinander verknüpft
Nutzung: weit verbreitet in modernen Datenbanksystemen
Vorteile: Übersichtlichkeit, einfache Datenverknüpfung, gute Datenintegrität
einfach umzusetzen
flexible Erstellung und Bearbeitung
schnelle Inbetriebnahme
weitgehende Datenunabhängigkeit
SQL-fähig
weniger leistungsfähig als andere Modelle
keine Gewährleistung der Datenintegrität
fehler- und störanfällig
künstliche Schlüsselattribute
mangelhafte Segmentierung
Was ist eine Objektdatenbank (objektorientiertes Datenmodell)?
Welche Vor- und Nachteile hat Objektdatenbank (objektorientiertes Datenmodell)?
Daten und zugehörige Funktionen werden gemeinsam gespeichert
basiert auf Prinzipien der objektorientierten Programmierung
sehr leistungsfähig, aber komplex
Bedeutung durch NoSQL-Datenbanken verringert
Speicherung multimedialer Inhalte
flexible Datenrepräsentation
unterstützt mehrdimensionale Daten
wiederverwendbare Objekte
komplizierte Implementierung
geringe Geschwindigkeit
wenige kompatible Schnittstellen
Was ist die erste Normalform (1NF)?
Definition: Eine Tabelle ist in der ersten Normalform, wenn alle Attribute atomar sind (nicht weiter teilbar)
Beispiel: Tabelle „Studenten“ mit Namen und Telefonnummern der Studenten, wobei jede Telefonnummer in einer eigenen Spalte steht (keine Liste in einer Zelle)
Was ist die zweite Normalform (2NF)?
Definition: Eine Tabelle ist in der zweiten Normalform, wenn sie in der ersten Normalform ist und jedes Nicht-Schlüsselattribut vollständig vom Primärschlüssel abhängt
Beispiel: Tabelle „Kurse“ mit Kursinformationen und Namen der Dozenten, bei der jeder Dozent eindeutig einem Kurs zugeordnet ist
Was ist die dritte Normalform (3NF)?
Definition: Eine Tabelle ist in der dritten Normalform, wenn sie in der zweiten Normalform ist und keine Nicht-Schlüsselattribute indirekt vom Primärschlüssel abhängen
Beispiel: Tabelle „Bestellungen“ mit Bestellinformationen und Kundendaten, wobei die Kundendaten in eine separate Tabelle ausgelagert werden, um Redundanz zu vermeiden
Was ist eine Einfüge-Anomalie?
Tritt auf, wenn Daten nur schwer oder gar nicht eingefügt werden können, ohne unvollständige oder inkonsistente Daten zu erzeugen
Ursache: Pflichtfelder ohne Werte können zu fehlerhaften Datensätzen führen
Was ist eine Änderungs-Anomalie (Update Anomaly)?
Tritt auf, wenn Änderungen an Daten zu Inkonsistenzen führen
Ursache: dieselben Daten werden an mehreren Stellen gespeichert, aber nicht alle aktualisiert
Was ist eine Lösch-Anomalie (Delete Anomaly)?
Tritt auf, wenn das Löschen eines Datensatzes unbeabsichtigt andere wichtige Daten entfernt
Ursache: Abhängigkeiten zwischen Daten führen dazu, dass beim Löschen eines Datensatzes auch andere benötigte Informationen verschwinden
Last changed14 days ago