WIssensbasierte Systeme KE 6 & 7

Buffl

Wissensbasierte Systeme

by Michael W.

2 grundsätzliche Annahmen fallbasierten Schließens

Ähnliche Probleme haben ähnliche Lösungen
jedes Problem ist anders, Typen der Aufgabenstellung wiederholen sich

Was sind die Vorteile fallbasierten Schließens?

+ Vorteile beim Wissenserwerb

Vorteile

schnelle Problemlösungen
Problemlösungen für Bereiche ohne allgemeine Regeln
mit Falldatensammlung lassen sich auch schwach strukturierte, vage Konzepte interpretieren
wichtige Teile einer Aufgabenstellung lassen sich leichter identifizieren und behandeln
- man muss nur wesentliche Charakteristika eines Problems herausstellen
Beispiele warnen vor Besonderheiten und Schwierigkeiten eines Problems
komplexe Aufgaben können behandelt werden, weil Beispiel Lösungen für ähnlich komplexe Aufgaben enthalten
gute Erklärungsfähigkeit
- positive und Gegenbeispiele
  -> hohe Akzeptanz

Vorteile beim Wissenserwerb:

Episoden dokumentieren implizites Wissen

Experten kooperieren mehr wegen der konkreten Fälle ("Bericht von der Front")
gespeicherte Computerberichte können als Fälle in Wissensbasis aufgenommen werden
System lernt automatisch und kontinuierlich
- durch Bearbeiten und Speichern neuer Fälle

Was ist der Kern beim fallbasierten Schließen?

Kern: Falldatensammlung

enhält Fallbeispiele/ Fälle
Zweck der Fälle:
- liefern Kontext für Verstehen neuer Situationen
- gelöste Fälle zeigen Lösungen für neue Probleme
  - manchmal verschmilzt man Lösungen
- Fallbasis dient zur Evaluation von Lösungsvorschlägen
wichtig: repräsentative Fälle
- dann auch gute Ergebnisse mit kleiner Datensammlung
- "seed cases"
enthält auch allgemeines (bereichsabhängiges) Wissen
- z.B. modellbasiertes oder regelbasiertes Wissen

Faktoren für Qualität eines CBR-Systems (5)

Erfahrung (Umfang der Fallbasis)

Verbindung zwischen neuen Situationen mit gespeicherten Fähigkeiten
Anpassun alter Lösungen an neue Probleme
Evaluation und Korrektion neuer Lösungen
Integration neuer Erfahrungen in die Fallbasis

Gemeinsamkeiten und Unterschiede zu ähnlichen Methoden

Analogschließen
- beide: Lösungen mit Bezug auf frühere analoge Fälle finden
- aber: Analogschließen eher abstraktes Wissen und strukturelle Ähnlichkeit
- CBR: Beziehungen zwischen spezifischen Episoden
  - + pragmatisch orientiert
  - -> wie nützlich ist ein früherer Fall
induktives Schließen
- beide: verwenden Sammlungen von Beispielen
- aber: Induktiv hat Ziel allgemeine Gesetzmäßigkeiten abzuleiten
  - eher abstrahierend
- CBR Konzepte und Kontexte immer an Einzelfällen festmachen
  - konkreter Fall
Datenbanken/ informationssuchende Systeme (information retrieval systems)
- CBR: Datenbanken sind Informationsquelle
- CBR sucht aber aktiver als informationssuchene Systeme
- dort: Benutzer müssen richtige Fragen stellen
- dort: exakter Abgleich
- CBR: möglichst ähnliche Fälle

Grundtypen des CBR (2 x 2)

problemlösendes CBR
- Ziel: Lösungen eines alten Problems als Lösung für neues Problem vorschlagen

interpretatives CBR
- Ziel: adäquate und differenzierte Beurteilung einer Situation

grundlegende Prozesse beider sind ähnlich
Unterschied in Adaption der Lösung

andere Klassifikation:

analytische CBR-Aufgaben
- Diagnose
- Klassifikation
synthetische CBR-Aufgaben
- Planung
- Konfiguration

4 Schritte im Ablauf des CBR-Zyklus

Selektierung (Retrieval)
- ähnlichster Fälle
- 2 Phasen:
  - 1. Grobsuche
    - alle Fälle, die infrage kommen suchen
  - 2. Feinsuche
    - vielversprechendste Fälle auswählen
- Probleme:
  - a) matching problem
    - Wie erkennt PC, welche Fälle ähnlich sind?
  - b) similarity
    - Wie Ähnlichkeit beurteilen
Wiederverwendung (Reuse)
- des in den Fällen gespeicherten Wissens
- hier unterschschied zwischen problemlösen und interpretieren
  - Grenzen aber fließend
- erst Näherungslösung
- dann Adaption
  - braucht Buchhaltungssysteme
    - z.B. Truth mantainance systems
    - moderieren Zustände eines Systems und Übergänge zwischen ihnen
  - um zu entscheiden, welche Komponenten der Lösung angepasst werden müssen
  - braucht Adaptionsstrategie
    - z.B. Heuristiken
Überprüfung (Revise)
- der vorgeschlagenen Lösung
- provisorische Lösung als Suchkriterium für Heraussuchen geeigneter Fälle
- ist Lösung fehlgeschlagen, entweder Prozess neu starten oder anpassen (Reparatur)
- Experte evaluiert -> Analysiert Fehlschläge
Aufnahme (Retain)
- des neuen Falles in die Fallbasis durch Integration
- Fall indizieren und einordnen

2 Bestandteile eines Falles

Aussage - > bestimmt den Inhalt
Kontext -> für Indizierung

3 Komponenten eines Falles

-> sind Rahmen für Fallrepräsentation

Problem- und SItuationsbeschreibung
- beinhalten aktuelle Aufgaben und Ziele
- bei Problemlösungaufgaben: Schwerpunkt auf Formulierung der Ziele und Bedingungen
  - Ausgangssituation weniger wichtig
- bei Interpretationsaufgaben: Schwerpunkt auf Situationsbeschreibungen
Lösung
- beinhaltet:
  - Lösungsschritte
  - Begründungen
Resultat
= Feedback aus der realen Welt
- Aspekte:
  - Feedback = was geschah nach Anwendung der Lösung
  - Erfüllung von Zielen = wurden Ziele erreicht?
  - Einstufung der Lösung als Erfolg oder Fehlschlag
  - Erklärung: Wie konnte es zu einem Fehlschlag kommen?
  - Korrektur: Was kann man tun, um Irrtum zu korrigieren?
  - Vermeidung: Wie hätte Fehlschlag verhindert werden können?
- -> hier liegt Lernpotenzial

Was ist ein Index eines Falles?

2 Schritte zum Erstellen
2 Teile
Anforderungen an Indizes und Vokabular
Unterschied zu Beschreibung

Index wie in einer Bücherei
- müssen Fall von anderen Fällen unterscheiden
Indizierungsproblem:
- richtigen Fall bei Suche finden
Filtert relevante Eigenschaften heraus
- relevanz:
  - fachliche Aspekte
  - Aufgaben des Systems
    - Vorhersage der Nützlichkeit eines Falles für zukünftige Aufgaben
man kann kein Vokabular anlegen, das alle zukünftigen Fälle abdeckt
-> immer auf Zweck gerichtet
gibt Ziel und Kontext eines Falles und identifizieren wichtige Merkmale

Anforderung an Indizes und Vokabular

Indizierung mit Konzepten, die Terminologie des Gebiets gehören
Indexvokabular nutzt Begriffe, die für Fallselektion genutzt werden
beim Indizieren Aufgabenkontext vorwegnehmen
= Umstände der Fallselektion
Indizes sollten hinreichend abstrakt sein
- passen sie zu mehr Situationen
Indizes sollten hinreichend konkret sein
- um Situationen leichter zu identifizieren

2 Schritte zum Erstellen eines Idexes:

Indexvokabular erstellen
- als Rahmen für Klassifikation und Beurteilung von Fällen
Fälle durch Index-Kombination kennzeichnen

2 Teile:

Menge von Merkmalen/ Attributen
Wertemengen
- werden den Attributen zugeordnet

Deskriptor = Attribut-Wert-Paar

Beschreibung ist ausführlicher

Verfahren zur Wahl eines Indexvokabulars (5 Schritte)

repräsentative Fälle sammeln
Besonderheiten eines Falles identifizieren und der Lehre, die sich aus ihm ziehen lassen
Situation charakterisieren
Indizes formulieren
- ausreichend abstrakt
- ausreichend konkret
Bildung eines Indexvokabulars aus verwendeten Begriffen
- Merkmale herausholen
- ihren Wertebereich festlegen

Kennzeichung eines Falls durch Indizes (4 Schritte

nur Deskriptoren aufnehmen, deren Wert wichtig ist

Fehlen eines Deskriptors ist Normalität/ Irrelevanz
Indizierung meist von Hand

Schrittweises Indizierungsverfahren:

relevanten Aspekte eines Falles bestimmen
Umstände des Falles bestimmen
Umstände in Vokabular des Systems übertragen
Beschreibung bearbeiten
- um sie so weit anwendbar wie möglich zu machen
- Generalisierungsschritt

2 Probleme bei Suche nach ähnlichen Fällen

Suchproblem
- Fallbasis effektiv durchsuchen

Ähnlichkeitsproblem
- Ähnlichkeitsmaß zur Beurteilung der Ähnlichkeit

Idealer Fallselektionsprozess (6 Schritte)

System leitet Beschreibung der neuen Situation und aktuelles Ziel an Selektierer weiter
Situation analysieren
errechnete Indizierung des neuen Falles auls Ausgangspunkt für Suche
- bei Suche Matchingprozeduren aufrufen
- Grad der Übereinstimmung zwischen Fällen
- oder Grad der Übereinstimmung zwischen Merkmalen berechnen
Algorithmus gibt Liste von nützlichen Fällen aus
Rangordnungsverfahren analysieren Liste von Fällen
beste Fälle an System zurück geben

3 Arten für Organisation der Fallbasis

flache Fallbasis
- Liste, Feld oder serielle Datei
  -> keine tiefere Struktur
- Suchalgorithmus durchläuft immer alle Fälle
- Vorteile:
  - beste Fälle werden immer gefunden
  - einfach neue Fälle hinzuzufügen
- Nachteil:
  - infeffektive und aufwendige Suche
invertierte Indizierung
- jedes Merkmal im Indexvokabular verweist auf Fälle, in denen es enthalten ist
  -> nur Fälle berücksichtigen die zu Indizes des neuen Falles gehören
- Indizierung muss dafür gut sein
Fallhierarchie
- z.B. Netzwerk aus gemeinsamen Merkmalen
- oder Unterschiede zwischen Fällen
- Suche ist Breitensuche
  - beginnt mit Knoten auf höchster Hierarchie-Ebene
  - zu Kindern gehen, bis man Fälle erreicht
    - meist Blattknoten
- Vorteil:
  - effektivere Suche
- Nachteile:
  - mehr Speicherplatz als flache Strukturen
  - mehr Aufwand bei Integration neuer Fälle
- Verbesserung:
  - prioritized network
  - zuerst wichtige Merkmale durchsuchen

5 Ähnlichkeitsmaße

Ähnlichkeit: quantitativ und qualitativ

Hamming-Ähnlichkeit:
1 - ( dist_h(x, y) / n )
- für zweiwertige Merkmale
- beruht auf Hamming-Distanz:
  - dist_H(x, y) = \sum_i_n |x_i - y_i|
gewichtete Hamming-Ähnlichkeit
sim_w_H(x,y) = 1 - \sum_i_n w_i ( | x_i - y_i |) / \sum_i_n w_i
- mit nicht-negativen Gewichten w für Merkmale

verallgemeinerte Ähnlichkeit
sim(x, y) = \sum_i_n w_i sim_i(x_i, y_i) / sum_i_n w_i
- für nicht nur binäre Attribute
- für Funktion sim_i
- bei reellen Attributwerten: normierte Differenzen
  - quantitative Ähnlichkeitsbestimmung
- vs. Ähnlichkeitswerte aufgrund von Klasseneinteilungen
  - qualitative Ähnlichkeit
  - subjektiv beurteilt oder festgelegt
PATDEX-Ähnlichkeitsmaß
- kontextabhängige Gewichtsfaktoren
- verarbeitet auch unvollständige Fallbeschreibungen
  - jedes Attribut durch "unbekannt" erweitert
  - sim(x;y) = 0, wenn x oder y "unbekannt"
  - basiert auf "hinreichender" Ähnlichkeit
    - hinreichend, wenn sim_i(x_i, y_i) >= 1 - delta
    - also größer als ein Schwellenwert
- sim (x, y) = \alpha E / (alpha E + beta C + eta U + gamma A)
  - E
    - beide Attribute bekannt und Ähnlichkeit größer als Schwellwert
    - "hinreichend ähnlich"
    - \sum w_ij sim_i(x_i, y_i)
  - C
    - beide Attribute bekannt und Ähnlichkeit unter Schwellwert
    - "signifikant unterschiedlich"
    - sum w_ij(1- sim_i(x_i, y_i))
  - U
    - Attribut des neuen Falles unbekannt
    - sum wij
  - A
    - Attribut bei alt unbekannt und bei neu abnormal
    - |A|
  - alpha = 1
  - beta = 2
  - gamma = 1
  - eta = 1/2

Was sind Adaptionsmethoden?

+ 4 Formen

Vorgang alte Lösung an neues Problem anpassen

ggf. mehrere Lösungsansätze berücksichtigen

4 Formen:

etwas Neues wird in alte Lösung eingefügt
etwas aus alter Lösung entfernen
Komponente austauschen
Teil der alten Lösung transformieren

Welche 4 Adaptionsmethoden gibt es?

Substitutionsmethoden
- Rahmenbedingung für alte und neue Situationen passt
- Reinstantiierung
  - Komponenten/ Rollen austauschen
- Lokale Suche
  - Teile der alten Lösung durch neue Objekte ersetzen
  - kleinere Teile als bei Reinstantiierung
  - nutzt semantische Netze oder Abstraktionshierarchien
- Parameteranpassung
  - verbindet unterschiede in Inputspezifikation mit Unterschieden im Output
  - z.B. Mengenanpassung bei Kochrezepten
- Fallbasierte Substitution
  - nutzt andere Fälle für Substitutionen
Transformationsmethoden
- bei neuen Rahmenbedingungen
- Komponenten weglassen/ hinzufügen
- Commonsense Transformation
  - nutzt Heuristiken des Allgemeinwissens
  - z.B. delete secondary component
- Modellbasierte Transformation
  - Steuerung durch kausale Modelle
  - z.B. in Diagnose und Planung
Spezielle Adaption und Verbesserung
- fuer bereichsspezfische und strukturmodifizierende Adaptionen
- die nicht zu a oder b gehören
- insb. fehlgeschlagene Lösungen korrigieren
Derivationswiederholung
- alte Lösung ableiten für neue Lösung

Was ist monotones Schließen?

Anwendung eines Operators Cn führt zu keinen neuen Erkenntnissen
- Cn = Consequence operation/ Folgerungsoperation
- Cn(F) = F
  - F Menge von Formeln
deduktiv abgeschlossene Theorie ist Fixpunkt des Operators Cn
Cn ist monoton, weil alle Modelle eingeschlossen sind
idealisierter Rahmen der Allwissenheit

Was ist nicht-monoton = revidierbares Schließen?

realistischer mit unvollständigem Wissen
verwendet allgemeinere Inferenzoperation
- C : 2^Form -> 2^Form
Unterschied
- nichtmonotone Ableitungen
  - durch nicht-montone Inferenzrelation
- nichtmonotone Regeln
  - verallgemeinerte Regeln
  - dürfen nur unter bestimmten Bedingungen angewandt werden

Aufgabenstellung für Truth Maintenance Systeme

neue Regeln können zur Inaktivierung allgemeinerer Regeln führen
- wenn sich ihre Schlussfolgerungen nicht vertragen
TMS nehmen Aussagen zurück, wenn sie im Konflikt mit neuen Infos stehen

2 Arten von Truth Maintenance Systemen

Justification-based TMS (JTMS)
- ohne Begründung darf nichts geglaubt werden
Assumption-based TMS (ATMS)
- verwaltet Menge von Annahmen, unter denen eine Aussage ableitbar ist
- mit Inferenzkomponente, die klassisch-deduktiv schlussfolgert

Aussehen und Bedeutung für Defaults

im Mittelpunkt: unsichere Regeln
= Default-Regeln/ Defaults
- Eigenschaften:
  - Regeln mit Ausnahmen
  - gelten allgemein/ typischerweise
  - gelten bis Gegenteil bewiesen wurde
bilden Allgemeinwissen nach
berücksichtigen Qualifikationsrproblem
- alle Aussnahmen aufnehmen
Default für
- typisches/ normales
- normativ
- erwartungshaltung
"Default" = "unsichere Regel"
Defaults für regelhaftes und faktisches Wissen

Aussehen:

Angeklagt : unschuldig / unschuldig
- Schuld muss eindeutig bewiesen werden
Formel 8.5 S.287
- Voraussetzung : Begründung(en) / Konsequenz
- Begründung für Teile des Defaults

Was ist die Semantik der Default-Logik?

Was ist ihre Problemstellung?

gibt Formeln Bedeutung
- Interpretation
- Modelle
Übersetzung:
- Wenn Voraussetzung bekannt ist
- und Begründungen konsequent angenommen werden können
- dann folgere Konsequenz

Problemstellung der Default-Logik nach Reiter

1. Was heißt "Voraussetzung ist bekannt"
2. Wann können Begründungen konsequent angenommen werden

zur Default-Logik gehört immer eine Faktenmenge
- Voraussetzung ist bekannt, wenn sie aus den Fakten geschlossen werden kann
- Begründungen müssen zu Fakten konsistent sein
aktuelle Wissensbasis erweitert Faktenmenge um "akzeptable" Thesen

Join Course

Preview

Author

Michael W.

Information

Last changed
a year ago

Report course