Vorraussetzung für den betrieb von Informationssystemen
strukturierte Orga der benötigten daten auf den vorhandenen Speichermedien
Datenorganisation: Kodierung -> Modellierung -> Strukturierung
Kodierung unterscheidet sich je nach Datentyp
Dateisystem
Hierarchische Struktur, die über jede Datei auf einem Speichermedium eindeutig identifiziert werden kann:
Datenredundanz
Identische Datenelemente kommen in versch. Dateien vor, wenn gleiche Daten mehrfach abgespeichert werden.
Dateninkonsistenzen
Dasselbe Attribut weist untersch. Werte auf, wenn redundante Datensätze modifiziert werden.
Mangelnde Datensicherheit
Von Management nicht kontrollierbar, wer Daten liest/schreibt, weil Dateien in einem dezentralen Dateisystem gespeichert sind.
Abhängigkeiten zwischen Programm und Daten
Änderungen an Programmen erfordern Folgeänderungen an dateien, wenn zu enge Beziehung zwischen Programm und Daten
Fehlender Datenaustausch & mangelnde Flexibilität
Datenaustausch zw. verschiedenen Systemen nicht möglich, wenn Zugriff auf Daten spezielle Verfahren erfordert.
“Daten Funktionieren nur in einem Programm”
In der betrieblichen Praxis führt eine rein dateibasierte Datenorga zu einer Reihe gravierender Probleme:
Datenredundanz; Dateninkonsistenzen; Mangelnde Datensicherheit; Abhängigkeiten zw. Programm&Daten; fehlender Datenaustausch& mangelnde Flexibilität.
Um diese Probleme zu vermeiden: Datenbankansatz
Unterschied zwischen Dateiansatz und Datenbankansatz
Dateiansatz
Datenbankansatz
Direkter Zugriff auf dateien in Verzeichnissen
Zugriff auf Verzeichnisse über Dateisystem
Zugriff auf Dateien nur über eine Datenbank
Zugriff auf Datenbank über DBMS
Datenbank
(möglichst Redundanzfreie) Sammlung von Daten, so strukturiert, dass sie von mehreren Benutzern und Anwendungen gleichzeitig&effizient genutzt und flexibel ausgewertet/verknüpft werden können.
Datenbankmangementsystem (DBMS)
Sammlung von Programmen zum Erstellen und Verwalten einer DB, macht es mehreren Anwendungen gleichzeitig möglich, benötigte Daten zu speichern, extrahieren und manipulieren, ohne jeweils eigene Dateien erstellen zu müssen.
Um Datenbanken von konventionellen hierarchischen Architektur des Dateisystems zu abstrahieren, benötigen sie eigenes logisches Modell, das beschreibt, wie enthaltene Daten organisiert sind.
Modellbildung
Abstraktion eines Ausschnitts der realen Welt oder unserer Vorstellung in Form einer formalen Beschreibung.
Semantisches Datenmodell
bezweckt, die Datenarchitektur eines IS unter Berücksichtigung semantischer Zusammenhänge der Objekte und Beziehungen zu erfassen.
Konkret werden Daten und Datenbeziehungen durch Abstraktion und Klassenbildung beschrieben.
Datenverwaltung
direkt über Anwendungsprogramme
m.H. DBMS
Schema= Abstrakte Beschriebung; Instanz= konkreter Sachverhalt
Bekannte Vertreter dieser Sprachen:
Relationale DB: SQL
Graphdatenbanken: SPARQL; Cipher; Gremlin
Transaktion
Einheit von mehreren Datenbankoperationen, die einen inkonsistenten Datenbankzustand in einen konsisten überführt.
Realisierung des Transaktionskonzepts innerhalb eines DBMS ist Vorraussetzung für gleichzeitigen Zugriff mehrerer Anwendugsprogramme auf dieselbe DB.
Relevante Merkmale hierfür: ACID
Konzeptioneller Datenbankentwurf
Erstellung eines abstrakten Modells der zu speichernden Daten aus der Unternehmensperspektive.
-> E/R Modell
Logischer Datenbankentwurf
Überführung des konzeptionellen Modells in ein äquivalentes Datenbankschema, welches zur Struktur des konkreten DB-Systems passt.
Entity Relationship Modell (E/R-Modell)
Kardinalitäten
Komplexere Konstellationen im E/R-Modell
Zuletzt geändertvor einem Tag