Datenbanken Tag 1 Einführung

Buffl

Ibrahim Datenbanken

by Ali S.

Was sind Daten?

Roh Fakten ohne Kontext
- Aufträge, Kapazität, Liefertermine

Sind Gespeicherte Fakten über uns selbst, andere und unser Umfeld. Beispiele:
- Kontobewegungen
- Telefonnummern
- Kontakte im Smartphone
- Außentemperatur
- Konzerttermine
- Produktionsarbeitspläne
- Bestände an Kunden- und Lieferantenaufträgen
Verwandte Begriffe:
- Informationen = interpretierte Daten.
  - Kapazität reicht nicht aus um die Aufträge zum gesagten Termine zu liefern
- Wissen = subjektiv bewertete Informationen.
  - Kapazität lassen durch zusätzliche Machienen oder Schichten erhöhen
  - Fertigungstermine wichtiger Aufträge unbedingt einhalten

Warum sind Daten Teuer?

Müssen gekauft, erhoben, gespeichert, verwaltet und ausgewertet werden.
Benötigen qualifiziertes Personal, Hard- und Software.
Beispiele:
- Facebook kaufte WhatsApp für 14 Mrd. € (31 €/Nutzer).
- Erste Steuersünder-CD (BND, 2006) kostete 4,6 Mio. €.
- Datensatz (Adresse, Beruf, Alter etc.) kostet im Schnitt 18 Cent.

Aus welchen zwei Teilen bestehen Datenbanken

Datenbasis

Strukturierte Sammlung von Daten

Datenbankmanagementsystem (DBMS)

Verwaltung und Schutz des Datenbestands
Aufgaben:
- Speichern und Verwalten von Daten
- Zugriff ermöglichen (gleichzeitig für mehrere Benutzer)
- Optimierung von Datenzugriffen
- Sicherstellung von Datenschutz und Datensicherheit

Metapher: Bibliothek

Datenbasis: Alle Bücher der Bibliothek (geordnet, katalogisiert)
DBMS: Bibliothekar, der Ordnung hält, Bücher verwaltet, neuen Zugang organisiert und gleichzeitig Zugriff für viele Personen ermöglicht

Was ist das Drei-Schema-Architektur – oft „ANSI-SPARC-Architektur“

Beschreibungen einer Datenbank werden in drei klar getrennte Ebenen unterteilt
Ihr Zweck ist, Datenbanknutzer vor negativen Folgen zu schützen, wenn sich die innere Struktur einer Datenbank ändert.
Mit anderen Worten: Änderungen sollen möglichst keine Störungen für Anwendende verursachen.

Was ist die Externe Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?

1. Externe Ebene

Individuelle Benutzersichten auf die Daten
Genau auf die Anforderungen einer Benutzergruppe zugeschnitten
Enthält keine überflüssigen Dateneinheiten oder Beziehungen
Mehrere Benutzergruppen ⇒ mehrere externe Schemata
Unterstützt gleichzeitigen Multi-User-Betrieb
Benötigt ein Berechtigungskonzept für sicheren Zugriff

Was ist die Konzeptionelle Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?

2. Konzeptionelle Ebene

Beschreibt logische Dateneinheiten (Entity) und Beziehungen (Relationship)
Enthält keine Datenwerte, nur deren Struktur
Beschreibung durch Datenmodell (hierarchisch, netzwerkartig, relational)
Keine Angaben zur physischen Speicherung

Vorteile

Stabile Beschreibung der Datenbasis
Einheitliche Dokumentation der Informationszusammenhänge
Änderungen erfolgen langsamer als in Anwendungen

Was ist die Interne Ebene des ANSI-SPARC-Architektur (Drei-Schema-Architektur)?

3. Interne Ebene

Organisation der physischen Datenspeicherung
Physikalische Realisierung auf Speichermedien
Enthält Algorithmen zur Speicherung, Indizierung, Sortierung und Selektion
Know-how des Entwicklers, für Anwender verborgen

Was ist Datenunabhängugkeit und aus welchen zwei Arten besteht sie, bezogen auf einer DBMS, das eine Drei-Ebenen-Trennung (oder etwas Vergleichbares) unterstützt

Datenunabhängigkeit ist die Fähigkeit eines Datenbanksystems, Änderungen an der Datenstruktur vorzunehmen, ohne dass Anwendungen, die auf diese Daten zugreifen, angepasst werden müssen.
Es gibt zwei Arten von Datenunabhängigkeit:
- Logische Datenunabhängigkeit:
  - Änderungen im logischen Schema (z. B. neue Felder) beeinflussen weder externe Schemata noch Anwendungen.
- Physische Datenunabhängigkeit:
  - Änderungen im physischen Schema (z. B. Speicherort der Daten) haben keine Auswirkungen auf das logische Schema oder Anwendungen

Was ist Stand Alone Datenbank?

Kategorisierung von DBMS nach Betriebskonzept

Stand-Alone-Datenbank
- Lokale Einzelplatzlösung, kein Mehrbenutzerzugriff
- Einfaches internes Schema, meist ohne komplexe Berechtigungen
- Beispiele: dBase, Access, Filemaker
- Geeignet für einfache Anwendungen wie Adressverwaltung oder Buchhaltung

Was ist File-Share-Datenbank?

Mehrbenutzerzugriff innerhalb eines Netzwerks
Datenbank als zentrale Datei, auf die Clients zugreifen
Database Engine läuft auf jedem Client
Server speichert Daten, verwaltet sie aber nicht selbst
Vorteil: keine redundante Datenhaltung, Änderungen sofort für alle sichtbar
Nachteil: hoher Netzwerkverkehr bei gleichzeitigen Zugriffen, Sperrprobleme

Was versteht man unter Client-Server-Datenbank?

Welche Vor- und Nachteile hat eine relationale Datenbank?

Läuft auf dediziertem Server im Netzwerk
Server verwaltet Datenbank und verarbeitet Anfragen der Clients
Clients greifen nicht direkt auf Daten zu, sondern über Schnittstellen
Trennung von Datenverwaltung und Datenzugriff
Vorteile: hohe Sicherheit, gute Leistung, flexible Nutzung
Erfordert Betreuung durch Datenbankadministrator
Beispiele: Oracle, DB2, Microsoft SQL Server, MySQL, MAXDB

Was ist das hierarchisches Datenbankmodell?

Welche Vor- und Nachteile hat eine hierarchisches Datenbank?

Daten in hierarchischer (Baum-)Struktur organisiert
Beispiel: Unternehmen mit Abteilungen und Mitarbeitern
Nutzung: teilweise noch in Dateisystemen und XML-Entwicklung
Vorteile:
- Übersichtliche Struktur
- Technisch einfach
- Sehr schneller Lesezugriff
- Geeignet für große Datenmengen
Nachteile:
- Starre Baumstruktur, keine Querverknüpfungen
  Nachträgliche Änderungen schwierig
  Heute meist von relationalen oder anderen modernen Modellen abgelöst

Was ist eine Netzwerkdatenbank?

Welche Vor- und Nachteile hat eine Netzwerdatenbank?

Erweiterung des hierarchischen Modells, um Hierarchien zu überwinden
Keine strikte Hierarchie, mehrere Suchwege möglich
Datenfeld besteht aus Name und Wert, Navigation durch die Daten möglich
Nutzung: netzartige Strukturen, z. B. geographische Netze, semantisches Web, soziale Netzwerke
Vorteile:
- keine strenge Hierarchie
- mehrere Suchwege pro Datensatz
- flexibler als hierarchische Datenbanken
- leistungsfähiger als relationale Datenbanken
- gute Integrität
Nachteile:
- unübersichtlich bei großen Datenmengen
- Datenstruktur bestimmt Aufbau
- kann aufwendig und kompliziert sein

Was ist eine relationale Datenbank?

Welche Vor- und Nachteile hat eine relationale Datenbank?

Effizientes und flexibles Modell für die Datenspeicherung
Besteht aus Tabellen mit Zeilen (Tupeln) und Spalten (Attributen)
Tabellen sind durch Primär- und Fremdschlüssel miteinander verknüpft
Nutzung: weit verbreitet in modernen Datenbanksystemen
Vorteile: Übersichtlichkeit, einfache Datenverknüpfung, gute Datenintegrität
Vorteile:
- einfach umzusetzen
- flexible Erstellung und Bearbeitung
- schnelle Inbetriebnahme
- weitgehende Datenunabhängigkeit
- SQL-fähig

Nachteile:
- weniger leistungsfähig als andere Modelle
- keine Gewährleistung der Datenintegrität
- fehler- und störanfällig
- künstliche Schlüsselattribute
- mangelhafte Segmentierung

Was ist eine Objektdatenbank (objektorientiertes Datenmodell)?

Welche Vor- und Nachteile hat Objektdatenbank (objektorientiertes Datenmodell)?

Daten und zugehörige Funktionen werden gemeinsam gespeichert
basiert auf Prinzipien der objektorientierten Programmierung
sehr leistungsfähig, aber komplex
Bedeutung durch NoSQL-Datenbanken verringert
Vorteile:
- Speicherung multimedialer Inhalte
- flexible Datenrepräsentation
- schnelle Inbetriebnahme
- unterstützt mehrdimensionale Daten
- wiederverwendbare Objekte
Nachteile:
- komplizierte Implementierung
- geringe Geschwindigkeit
- wenige kompatible Schnittstellen

Was ist die erste Normalform (1NF)?

Definition: Eine Tabelle ist in der ersten Normalform, wenn alle Attribute atomar sind (nicht weiter teilbar)
Beispiel: Tabelle „Studenten“ mit Namen und Telefonnummern der Studenten, wobei jede Telefonnummer in einer eigenen Spalte steht (keine Liste in einer Zelle)

Was ist die zweite Normalform (2NF)?

Definition: Eine Tabelle ist in der zweiten Normalform, wenn sie in der ersten Normalform ist und jedes Nicht-Schlüsselattribut vollständig vom Primärschlüssel abhängt
Beispiel: Tabelle „Kurse“ mit Kursinformationen und Namen der Dozenten, bei der jeder Dozent eindeutig einem Kurs zugeordnet ist

Was ist die dritte Normalform (3NF)?

Definition: Eine Tabelle ist in der dritten Normalform, wenn sie in der zweiten Normalform ist und keine Nicht-Schlüsselattribute indirekt vom Primärschlüssel abhängen
Beispiel: Tabelle „Bestellungen“ mit Bestellinformationen und Kundendaten, wobei die Kundendaten in eine separate Tabelle ausgelagert werden, um Redundanz zu vermeiden

Was ist eine Einfüge-Anomalie?

Tritt auf, wenn Daten nur schwer oder gar nicht eingefügt werden können, ohne unvollständige oder inkonsistente Daten zu erzeugen
Ursache: Pflichtfelder ohne Werte können zu fehlerhaften Datensätzen führen

Was ist eine Änderungs-Anomalie (Update Anomaly)?

Tritt auf, wenn Änderungen an Daten zu Inkonsistenzen führen
Ursache: dieselben Daten werden an mehreren Stellen gespeichert, aber nicht alle aktualisiert

Was ist eine Lösch-Anomalie (Delete Anomaly)?

Tritt auf, wenn das Löschen eines Datensatzes unbeabsichtigt andere wichtige Daten entfernt
Ursache: Abhängigkeiten zwischen Daten führen dazu, dass beim Löschen eines Datensatzes auch andere benötigte Informationen verschwinden

Join Course

Preview

Author

Ali S.

Information

Last changed
9 months ago

Report course