Welche Grundlegenden Ansätze gibt es bei verteilten Datenbänken?
Shared Memory / Share-Everything
Shared-Disk
Shared-Nothing
Welche drei Eigenschaften gibt es im CAP-Theorem?
Consistency
Availability
Partition Tolerance
Was bedeuted Consistency aus dem CAP-Theorem?
alle Clients haben die gleiche Sicht auf den Datenbestand
Was bedeuted Availability aus dem CAP-Theorem?
es ist immer eine Kopie der Daten verfügbar, auch im Fehlerfall
Ausfall einzelner Knoten führt nicht zum Ausfall des gesammten Systems
Wofür steht ACID?
Atomic
Consistent
Isolated
Durable
Wofür steht BASE?
Basiclly Available
Soft-State
Eventually Consistent
Welche Konsistenzmodelle gibt es?
Strong Consistency
Weak Consistency
Was versteht man unter Strong Consistency?
strikte Consistenz ades ACID Modells
nachdem Update abgeschlossen, liefern alle folgenden Lesezugriffe andere Prozesse den neuen Wert und vorher den alten
Was versteht man unter Weak Consistency?
Keine Garantie, dass bei nachfolgenden Zugriffen der neue Wert geliefert wird
Was versteht man unter Evenutal Consistency?
Spezielle Form von Weak
Garantie: irgendwann werden alle Prozesse den neuen Wert lesen
Unter Bedingung: Irgendwann erfolgen keine Updates mehr im System
Welche Fragmentierungsverteilungsansätze gibt es?
Round Robin
Hash
Range
Welche Shared Nothing Techniken gibt es?
Datenfragmentierung
Datenreplikation
Anfrageaufteilung
Anfrageverteilung
Welche Fragmentierungsansätze gibt es?
Horizontale Fragmentierung
Vertikale Fragmentierung
Hybride Fragmentierung
An welchen Eigenschaften wird die Korrektheit der Fragmentierung überprüft?
Vollständigkeit
Rekonstruierbarkeit
Disjunktheit
Welche Eigenschaften müssen für die Auswahl von einfachen Prädikaten im HF-Algorithmus gelten?
Die Menge einfacher Prädikate soll minimal und vollständig sein.
Welche Schritte gibt es im HF-Algorithmus?
Einfache Prädikate bestimmen
Minterm-Prädikate bilden
Was macht folgender Ausdruck?
Semi-Join: Verknüpfe R und S aber behalte nur Attribute aus R
Welche Phasen gibt es bei der Verteilten Anfrageverarbeitung?
Koordinatorknoten
Übersetzen & Sichtauflösung
Datenlokalisierung
Globale Optimierung
Lokaler Knoten
Lokale Optimierung
Code-Erzeugung
Ausführung
What are the weaknesses of a relational model?
Impedance Mismatch
Sematic Overload
Weak Support for recursion
Homogeneity
What are the weaknesses of existing RDBMS?
designed for irregular updates
sql dialects
restricted data types
only declarative access
only short transactions
low throughput
rigid schema
no data versioning
What are the Vs of Big Data?
Volume
Variety
Velocity
What are the 5 Vs
volume
velocity
variety
veracity
value
Welche Technologien zählen zum NoSQL Core?
Key/Value/Tuple-Store
Column Families Store
Document Stores
Graph Database
Wie wird ein SELECT dargestellt?
Pi
Wie wird ein WHERE abgebildet?
Sigma
What are the main principles of Read Commited?
reading from database, only see comitted (no dirty reads)
writing to database, only overwrite commited (no dirty writes)
Wie funktioniert ein Semi Join?
Knoten 1 sendet Schlüssel (Projektion) zu Knoten 2
Knoten 2 selektiert alle relevanten Ergebnisse
Knoten 2 schickt diese zurück
Knoten 1 Joined die Ergebnisse
Which reduction rules can be applied to fragmented data queries?
remove empty relations (generated by contradicting selektions)
remove useless relations (generated by projektions)
joins over unions
Welche Phasen hat der Anfrageoptimierer?
Query rewrite
cost-based optimization
Welche Kosten sind in der Regel maßgeblich für verteilte Datenbanken?
Netzwerkkosten
How can the bad perfomance of db_get of a key-value store be fixed?
usage of index structures
How does an index structure work?
by using a byte offset from the key to determine the value
Warum ist Concurrency Control eine Herausforderung?
The Problem of synchronizing concurrent transactions such that the consistency of the DB is maintained, while at the same time maximum degree of concurrency is achieved.
Wozu wird eine Serial History genutzt?
um die Reihenfolge von Transaktionen zu bestimmen
Welche schwachen Isolationsansätze gibt es?
Read Commited
Snapshot Isolated
Repeatable Read
What are the core principles of read commited?
Read: only see data that has been commited
Write: only overwrite data that has been commited
Wie ist ein Lamport-Timestamp aufgebaut?
NodeID + Timestamp
How can dealocks be handled?
ignore
prevent
avoid
detection and recovery
Last changed2 years ago