Ideal (Ziel) der Ingenieurpsychologie (Poulton)
das Ideal der Ingenieurpsychologie nach Poulton (1966) besagt, dass es bei dem Ziel der Ingenieurpsychologie
nicht primär um die Evaluation verschiedener Artefakte zur
Identifikation der passendsten Umsetzung geht,
sondern um die Identifikation der psychologischen Aspekte und Prozesse, die die Ursache dafür sind, dass eine bestimmte Umsetzung eines Artefaktes die passendste ist.
Dies entstammt aus seiner Definition -> „The aim of engineering psychology is not simply to compare two possible designs for a piece of equipment (which is the role of human factors), but to specify the capacities and limitations of the human (generate an experimental data base) from which the choice of a better design should be directly deductible.“ (Poulton, 1966, p. 178)
Definition der Ingenieurpsychologie (Vollrath)
„Ingenieurpsychologie ist die Wissenschaft vom Erleben und Verhalten des Menschen im Umgang mit technischen Systemen mit dem Ziel, diesen Umgang optimal zu gestalten.“ (Vollrath, 2015)
Forschungsansatz der Ingenieurpsychologie
Es werden gesellschaftliche Herausforderungen und technische Entwicklungen analysiert und aus diesen werden Fragestellungen auf basis von psychologischen Theorien für die Nutzerforschung formuliert. Aus diesen Ergebnissen werden dann Rahmenmodelle und schlussendlich Design- Guidelines abgeleitet für eine menschzentrierte Digitalisierung und eine optimierte Technikentwicklung.
Abgrenzung der Ingenieurpsychologie zu Human Factors / Ergonomie & Allgemeine Psychologie
Abgrenzung von Ingenieurpsychologie zu Human Factors / Ergonomie
IngPsy: keine Beschäftigung mit physiologischen Aspekten
Schwerpunkt Informationsverarbeitungsprozesse (aber: auch Schwerpunkt der kognitiven Ergonomie)
IngPsy stärker theoretisch fundiert/orientiert
IngPsy weniger stark Entwicklung & Vergleich von Designvarianten
Stärker Bezug auf experimentalpsychologisches Wissen
Jedoch: IngPsy hat starke Wurzeln in Ergonomie
Abgrenzung zur Allgemeinen Psychologie
Allgemeine Psychologie erfordert experimentelle Kontrolle aller Variablen
In der Ingenieurpsychologie überwiegt praktische die statistische Signifikanz
Ingenieurpsychologische Untersuchungen müssen anwendbares Wissen liefern
Teilgebiete der Ergonomie (& wo ist hier die Ingenieurpsychologie)
(1) Physical ergonomics -> Anatomie, Anthropometrie, Physiologie, Biomechanik
(2) Cognitive ergonomics -> Wahrnehmung, Aufmerksamkeit, Gedächtnis, Handlungsplanung, Motorik -> hier ist die Ingenieurpsychologie
(3) Organizational ergonomics -> Optimierung von Organisationsstrukturen, Kommunikation, crew ressource management, ...
◼Ingenieurpsychologie = besonders Aspekt (2)
Definiere Mensch-Maschine-System nach Timpe & Kolrep
Nenne jeweils 3 Subsysteme von Mensch- Maschine Systemen
Wie lässt sich “Maschine” von “Werkzeug” abgrenzen?
Mensch-Maschine-System:
„Zielgerichtetes Zusammenwirken von Personen mit technischen Systemen zur Erfüllung eines fremd- oder selbstgestellten Auftrages“ (Timpe & Kolrep, 2000, S. 10)
Mensch & Maschine können beide in Subsysteme gegliedert werden
Diese Subsysteme haben bestimme Eigenschaften
Beim Menschen z.B. Senorisch/ Perzeptuell, Kognitiv und Psychomotorisch
Bei Maschinen z.B. Hardware Interface, Software Interface und Instructional Support
Güte der Gestaltung des Mensch-Maschine-Systems (Passung Zusammenspiel Subsysteme) entscheidet über die Gesamtperformanz des Systems
Z.B. Passung von Eingabegeräte zu motorischen Anforderungen der Aufgabe,
Passung der Feedback-Modalität
„Maschine“:
Relativ breites Verständnis des Begriffes
Allgemein „technisches Gebilde“ / „technisches System“
Oder konkret „Anlage“, „Apparat“, „Produkt“, „Software-System“, „Gerät“, etc. Abgrenzung zu einfachen Werkzeugen:
Durch Vielzahl der Elemente, die miteinander in Beziehung stehen & dem Umsatz von Energien, Stoffen oder Signalen dienen
Was kennzeichnet ein optimumnahes Mensch-Maschine-System? (Timpe & Kolrep)
6 Faktoren
3 Rollen des Menschen in technischen Systemen (Hoyos)
Mögliche Rollen des Menschen im System (Hoyos, 1987)
(1) Regler: Einhalten von Sollwerten (z.B. Flugzeug auf Kurs halten)
-> durch zunehmende Automatisierung zurückgedrängt
(2) Überwacher: Signalverarbeitung, Diagnose, Entscheidung unter Unsicherheit
(3) Dialogpartner: komplexe Informationsverarbeitung -> interaktiver
Problemlöser
Weiterentwicklung der Rolle des Menschen im System durch Automatisierung:
Automatisierung kann zwischen „der Mensch regelt alles“ bis „der Computer entscheidet alles und führt alles aus“ geschehen (Sheridan & Verplank, 1978)
Stufen der Automatisierung, z.B. (Sheridan & Verplank, 1978)
Der Computer schlägt eine Alternative vor, der Mensch entscheidet
Der Computer gibt dem Menschen eine Veto-Chance in einem gewissen Zeitfenster
Der Computer informiert den Menschen nur, wenn dieser das fordert
Rahmenmodelle der Informationsverarbeitung: 3 Stage Model-> Proctor & Zandt
Schwächen bzw. Einschränkungen des Modells (2)
3-Stage Model der Informationsverarbeitung (Proctor & Zandt 2018)
(1) Perceptual Stage:
Teilweise unbewusste Teilprozesse (z.B. sensorische Verarbeitung von visuellen Reizen)
Systemgestaltung: wie lange sind Reize präsent & wie leicht ist die sensorische
Extraktion von Information (z.B. Auflösung, Größe, Kontrast,...)
(2) Cognitive Stage:
Kombination von Reizinformationen mit Gedächtnisinformationen, Verstehensprozesse, Entscheidungsprozesse, ...
Zahlreiche kognitive Begrenzungen (z.B. Arbeitsgedächtniskapaztität)
Systemgestaltung: Identifikation der benötigten kognitiven Ressourcen & deren
Grenzen
(3) Action Stage:
Auswahl der Verhaltensantwort aus Verhaltensoptionen, motorische Steuerung
Systemgestaltung: z.B. Größe von Eingabeelementen, Kompatibilität zwischen Steuerungselementen und erzielbaren Effekten (Affordances von Türen, Fahrzeugsteuerung, ...)
Schwächen/Einschränkungen:
Informationsverarbeitung ist nicht nur passiv linear, sondern folgt einem aktiven Zyklus
Motivationselemente (Handlungsregulatorische Prozesse) fehlen
Rahmenmodelle der Informationsverarbeitung: Wickens
Grundzusammenhang visuelles System vs. Aufmerksamkeitsbeschränkung
Visuelle Wahrnehmung – zentraler Zugang zu Informationen ̶ Aber: nur Objekte die im Zentrum Sehfeldes abgebildet werden = scharf
Implikationen: Nutzer kann nur jeweils Information von einem Ort gleichzeitig tief verarbeiten (scharf sehen)
Information dort darstellen wo Nutzer hinschaut und/oder Aufmerksamkeitslenkung(z.B. Blinken)
Selektive Aufmerksamkeit : 6 Aufgaben bei denen selektive Aufmerksamkeit relevant ist- OÜBSLÜ
Selektive Aufmerksamkeit - Auswahl von Bereichen für die Aufmerksamkeitszuwendung
Aufgaben bei denen selektive Aufmerksamkeit relevant am Beispiel Mary der Busfahrerin:
(1) Orientieren (Generelle Orientierung & Scanning)
Wenn Mary das Bus- Depot verlässt muss sie sich ständig orientieren und die Umgebung scannen.
(2) Überwachen (supervisory control)
Beim Scannen der Umwelt weiß mary in der Regel, welche Bereiche relevant für ihre Aufgabe ist, also der gesamte vordere Bereich z.B.
(3) Bemerken
Mary muss ebenfalls beobachten, um ggf. unerwartete Ereignisse / Stimuli zu entdecken, wie ein Kind, das unerwartet auf die Straße läuft.
(4) Suchen
Mary muss außerdem ständig nach vordefinierten Zielreizen suchen, z.B. nach Passagieren, die an der Haltestelle stehen und in den Bus einsteigen wollen.
(5) Lesen
Mary liest außerdem die Schilder.
(6) Überprüfen (confirming)
Mary überprüft auch, ob bestimmte Aktivitäten stattgefunden haben (d.h. Feedbackverarbeitung). ZB ob die hintere Tür geschlossen wurde, bevor sie weiter fährt.
Die 4 Arten der Aufmerksamkeitsanforderungen
◼Aufmerksamkeitsanforderungen (Arten/Aspekte):
(1) Selektive A.: notwendige Informationen für sicheres Verhalten selektieren
(2) Fokussierte A.: trotz irrelevanter Störreize Aufmerksamkeit fokussieren
(3) Geteilte A.: oft müssen wir A. zwischen Aufgaben/Reizen aufteilen
(4) Dauer-A. & Vigilanz: oft müssen wir Aufmerksamkeit lange aufrechterhalten
Konzept der AOI (Was ist das? Wozu braucht man das?)
◼AOI – „Area of Interest“
Bereich/Ort, an dem bestimmte aufgabenrelevante Informationen gefunden werden können
Eine AOI kann für mehrere (Teil-)Aufgaben relevant sein
Mehrere AOIs können für eine Aufgabe relevant sein
SEEV-Modell (Grundidee & Wert)
Grundidee:
Definiert vier Faktoren, die bestimmen, worauf (d.h. auf welche AOI) die visuelle Aufmerksamkeit zu einem bestimmten Zeitpunkt gerichtet wird
Sagt die Aufmerksamkeitsverteilung vorher (wie viel Aufmerksamkeit wird z.B. versch. Displays gewidmet – Verteilung Blickdauern)
4 Faktoren: Salience Effort Expectancy Value
Wert:
Gut geeignet, um z.B. das Blickverhalten beim Autofahren, beim Fliegen oder im Operationssaal vorherzusagen
Liefert auch Erklärung dafür, dass bestimmte AOIs von hohem Wert phasenweise vernachlässigt werden („neglect“)
SEEV-Modell - Grafik
SEEV- Modell (4 Fakoren im Detail & Implikationen)
◼(1) Salience
Auffälligkeit der AOI – inwieweit sticht AOI hervor
Abhängig z.B. von Größe, Farbe, Intensität, Kontrast
◼(2) Effort
Aufwand für Aufmerksamkeitsverschiebung zwischen AOIs
Augenbewegungen einfach – aber nicht aufwandsfrei
◼ (3) Expectancy
Erwartung bzgl. des Auftretens von Veränderungen innerhalb einer AOI
Wir schauen eher dorthin wo wir erwarten, dass dort mehr passiert – Hfkgt mit der Informationen an Ort auftauchen (antizipiert) – Infodichte (Änderungen pro Zeit)
Mentales Model der Umwelt repräsentiert Infodichte (wo passiert viel)
◼ (4) Value
Bedeutsamkeit/Nützlichkeit der Informationen innerhalb einer AOI
Wie wichtig ist Aufnahme einer bestimmten Info (z.B. Sicherheitsrelevanz)
Z.B. auch auf leerer Straße (-expectancy) Blick auf Fahrbahn wichtig (+value), oder dichte Straßenwerbung (+expectancy, -value)
◼ Implikationen aus dem SEEV-Modell für Displaygestaltung:
(1) Bedeutsamere AOIs sollten salienter gemacht werden
(2) Distanz zwischen AOIs sollte negativ korreliert zu ihrer Nutzungshäufigkeit sein
(3) Ebenso bedeutsam: Häufigkeit der sequentiellen Nutzung von AOIs
Definition & Faktoren (7) für Change Blindness
◼ (1) Definition: Unvermögen, unter best. Bedingungen selbst große Veränderungen in einer Szene nach einer Unterbrechung zu entdecken
◼ (2) Einflussfaktoren: Auftreten wahrscheinlicher wenn...
(1) die generelle Beanspruchung hoch ist
(2) der sich verändernde Stimulus unauffällig ist
(3) die Aufmerksamkeit nicht auf dem Ort der Veränderung liegt
(4) der räumliche Abstand zwischen dem Aufmerksamkeitsfokus und dem Ort der Veränderung groß ist
(5) der sich verändernde Stimulus komplett außerhalb des Sehfeldes liegt
(6) das Ereignis (die Veränderung) unwahrscheinlich ist
(7) [unabhängig davon wo Aufmerksamkeit während Änderung ist] ... weniger Aufmerksamkeit vor/nach Änderung auf Ort der Veränderung liegt
Definition & Faktoren für Inattentional Blindness
◼ (1) Definition: Unvermögen, Veränderungen in einer Szene trotz Blickzuwendung zu entdecken
Aufmerksamkeit auf andere Aspekte der Szenerie bzw. andere Aufgabe gerichtet
◼(2) Einflussfaktoren: Auftreten ist wahrscheinlicher wenn...
(1) die Beanspruchung durch die Primäraufgabe hoch ist
(2) die Veränderung nur geringe oder keine visuelle Ähnlichkeit mit der Primäraufgabe hat
Konzept UFOV – Was ist das? Wie kann man es (grob) erfassen?
Useful Field of View (UFOV)
Definition: Der Sehwinkel, in dem die Präsenz oder Absenz eines Zielreizes (bzw. einer relevanten Information) identifiziert werden kann
Größeres UFOV – weniger Blickbewegungen erforderlich, um den Suchbereich abzudecken
Messung: Abstand 2 Blicke nacheinander = Indikator für Durchmesser
SSTS model (inkl. Gleichung) & Sonderfälle
Serielle Suche mit Abbruch:
Serial Self-Terminating Search – SSTS model (Sternberg, 1966)
STp =ap +bN/2
STp -> wenn Ziel vorhanden (present)
ap -> Bestandteile der Suchzeit (Antwortzeit) außerhalb Suchprozedur
bN – b = Zeit für Scannen eines Elements & Entscheidung „nicht Ziel“ (N = Anzahl Elemente)
STa=aa+bN
Einschränkungen des SSTS-Modells – Sonderfälle
(A) Bottom Up
(1) Erschöpfende suche bei unbekannter Anzahl an Zielreizen (jedes Item wird gescannt)
(2) Parallele suche bei Klassifikation des Zielreizes anhand einer einzelnen salienten Dimension (z.B. Farbe) - auch genannt target popout - hier wird der Vorteil von z.B. grellen Farben deutlich
(3) Conjunction Search: Kombination aus verschiedenen Merkmalen im Zielreiz erschwert die parallele Suche (z.B. Farbe und Form) - ein rotes L finden zwischen roten und schwarzen L’s und T’s
(4) Serielle Suche ist umso schwerer, je ähnlicher sich Zielreiz und Distraktoren sind (z.B. abgeschnittenes T)
(5) Suche ist leichter, wenn die Distraktoren homogen sind (L zwischen T’s finden vs. zwischen vielen versch. Symbolen & Buchstaben)
(6) Suche ist leichter, wenn Zielreiz durch Präsenz, und nicht Absenz eines kritischen Merkmales definiert ist (Q zwischen O finden vs. O zwischen Q finden)
(7) Abstand zwischen Stimuli relativ unerheblich (in gewissen Grenzen)
bei größeren Abständen mehr Zeit für Blickbewegungen bzw. UFOV-Verschiebungen erforderlich
bei geringeren Abständen Interferenzen zwischen verschiedenen Stimuli, die wiederum in längeren Inspektionszeiten resultieren
(8) Suche nach mehreren verschiedenen Zielreizen (z.B. „T oder O“) ist schwieriger als Suche nach nur einem Typ von Zielreiz
Ausnahme: Zielreize weisen beide das gleiche kritische Merkmal auf, dass sie von den Distraktoren unterscheidet (z.B. „T oder L unter Distraktoren O, U und S“)
(9) Intensives Training – funktioniert speziell wenn Zielreiz(e) immer identisch sind, und nie als Distraktoren auftreten („consistent mapping“)
(B) Top Down
◼ (1) Suchstrategien begünstigen Auffinden des Zielreizes
Fokussierung auf bestimmte Merkmale aus Erfahrung
Z.B. räumliche Position (Medizin – Suche nach Tumoren auf Röntgenbild)
Fokussierung auf saliente Merkmale
Z.B. Zielreiz über zwei Eigenschaften (z.B. Farbe „rot“ und Größe „groß“) definiert, Häufigkeiten der beiden Eigenschaften im Suchfeld unterschiedlich häufig (z.B. nur wenige große Objekte, aber viele rote)→zunächst Aufsuchen des seltenen Merkmals (alle großen Objekte anschauen), dort dann nach häufigem Merkmal suchen (alle roten unter den großen Objekten)
◼(2) Größe des UFOV ̶ UFOV ist unterschiedlich groß (interindividuelle Differenzen) – kann
möglicherweise zum Teil trainiert werden
◼(3) Genauigkeit der visuellen Suche
Trade-Off zwischen Schnelligkeit und Genauigkeit
Typischerweise zwei Fehlertypen
Inattentional Blindness – Bereich des Zielreizes bei der Suche gescannt (bzw. Zielreiz sogar fixiert), trotzdem Zielreiz nicht identifiziert
Nicht den gesamten Suchbereich gescannt (mit UFOVs „tapeziert“) – zu frühe „stopping policy“, z.B. weil:
Nur „wahrscheinliche“ bzw. typische Regionen gescannt wurden
Die Erwartung, dass der Zielreiz präsent ist, generell gering ist
Clutter – Definition & Faktoren
„Clutter“ – Durcheinander
Beinträchtig vis. Suche bzw. insgesamt selektive & fokussierte Aufmerksamkeit
Messung: subjektiv oder anhand objektiver Eigenschaften
Objektiv: Clutter entsteht z.B. durch...
(1) Hohe Anzahl an Reizen im Suchbereich
(2) Distraktoren in unmittelbarer Umgebung des Zielreizes
• Erschwert fokussierte Aufmerksamkeit – z.B. HUD
(3) Heterogenität der Hintergrundmerkmale
(4) Fehlende Organisation der Reize im Suchbereich
Cueing – Was ist das & Faktoren Position & Zuverlässigkeit
„Cueing“ – Lenkung der visuellen Aufmerksamkeit auf einen relevanten Bereich durch einen Hinweisreiz
(1) Position des Hinweisreizes / Cues
◼ A) Zentraler Hinweisreiz (z.B. Pfeil in Richtung der relevanten Information)
Eher top-down Verarbeitung (kognitiv) – braucht etwas länger
Keine Verdeckung der Zielinformation
Eher unpräzise bei der Positionsbestimmung
◼ B) Peripherer Hinweisreiz an der Position der relevanten Information (z.B. blinkendes Licht)
Eher bottom-up Verarbeitung (perzeptuell) – schnellere Reaktionen
Präziser bei der Bestimmung der Position
Problematisch wenn zu weit in der Peripherie
Müssen salient sein (z.B. multiple Onsets = Blinken)
Dürfen eigentliche Information nicht überdecken/maskieren (Clutter)
(2) Zuverlässigkeit des Hinweisreizes
◼ 100%ige Zuverlässigkeit eher selten
◼ Je höher die Zuverlässigkeit (unterhalb von 100%)
(1) desto größer der Nutzen wenn korrekt, aber desto größer auch die Kosten wenn inkorrekt – z.B. ausbleibende Warnung („automation complacency“)
(2) desto seltener werden andere Bereiche nach relevanten Informationen gescannt („attentional tunneling“)
Grundkonzept präattentive Verarbeitung
Unsere visuelle Verarbeitung läuft in zwei Hauptphasen ab. Die erste Phase, die Präattentive Verarbeitung (oder auch globale bzw. holistische Verarbeitung), meint die automatische Organisation unserer Umwelt in Objekte und Objektgruppen und passiert parallel und unbewusst. Im Anschluss sorgt die selektive Aufmerksamkeit dafür, dass wir bestimmte Elemente genauer verarbeiten und u.U. fokussieren.
Der Emergent Feature Effekt
◼ Enge Verbindung zwischen holistischer Verarbeitung und Emergent Feature Effekt
-> Z.B. Messparameter Flugzeugmotor – alle im korrekten Bereich?
Abweichungen von der Norm werden in Abbildung B weitaus schneller erkannt als in A
Gestaltgesetze
◼ Gestaltpsychologie – Gestaltprinzipien der Gruppierung – Gestaltgesetze
(1) Gesetz der Nähe - Nahe Elemente werden gruppiert
(2) Gesetz der Ähnlichkeit - Elemente die in Bezug auf Farbe, Form, Helligkeit usw. gleichartig sind werden eher gruppiert
(3) gute Fortsetzung – Linien werden in Annahme der stetigen Fortsetzung (geradlinig oder der Krümmung folgend) gruppiert
(4) gemeinsames Schicksal – gemeinsame Bewegung
Positions - vs.objektbasierte Aufmerksamkeit (und was macht überhaupt ein Objekt aus?)
Positionsbasierte Aufmerksamkeit: Die Aufmerksamkeit wird bestimmten räumlichen Bereichen zugewandt (Spotlight-Metapher), d.h. die räumliche Nähe relevanter Information erleichtert die parallele Verarbeitung (head- up display). Probleme können z.B. Inattentional Blindness und Clutter sein.
Objektbasierte Aufmerksamkeit: Die Aufmerksamkeit wird bestimmten Objekten zugewandt, d.h. die Zusammenfassung relevanter Informationen in einem Objekt erleichtert die parallele Verarbeitung, z.B. multidimensionale Objektdisplays
◼Was macht ein Objekt überhaupt aus?
Verbundenheit oder umgebende Konturen zwischen verschiedenen Teilen
Konsistenz in der Bewegung (in Relation zu anderen Elementen der Umgebung)
Vertrautheit
(siehe auch Gestaltpsychologie)
Proximity Compatibility Principle
◼ „Kompatibilitätsprinzip der Nähe“
Leistung hängt ab vom Zusammenspiel aus (1) Aufgabennähe und (2) „Displaynähe“
◼ (1) Aufgabennähe
Hoch = wenn mehrere Elemente zur Bearbeitung einer Aufgabe erforderlich sind (= geteilte Aufmerksamkeit), d.h. Integration der vorliegenden Informationen ist erforderlich
Zu unterscheiden von Dual Task Bearbeitung, bei der zwei Aufgaben gleichzeitig bearbeitet werden & keine Informationsintegration erfolgt (=fokussierte Aufmerksamkeit)
◼(2) Displaynähe
Beeinflussbar über eine Reihe von Faktoren, grob klassifizierbar in sensorische Aspekte, objektbezogene Aspekte und Emergent Features
Sensorische Nähe
Räumliche Nähe
Farbliche „Nähe“
Objektbezogene Nähe
Verbindunge
Aneinanderstoßende Grenzen
Heterogenität / Homogenität der Objektmerkmale
Emergent Features
Homogenität
Symmetrie
3 Speicher & Eigenschaften (Atkinson & Shiffrin, 1968)
Modell von Baddeley (Haupaussagen & -komponenten, Designimplikationen)
Modell von Baddeley - Designimplikationen
(1) Verbal-phonetische vs. visuell-räumliche Kodierung
Implikationen für Interfacedesign :
(1) Räumliche Informationen: besser visuell anstatt sprachlich (dann muss nicht umkodiert werden)
(2) Informationen die verbal repräsentiert nur kurz dargeboten werden können: besser auditiv als visuell − weil echoisches Gedächtnis langsamerer Zerfall als ikonisches Ged. & besser kompatibel mit phonolog. Rehearsal
(3) Vermeidung von mehreren Informationsquellen gleicher Kodierung
(2) Zentrale Exekutive
Koordiniert Aktivität der Subsystem (Überwachungs-/Kontrollstation)
Implikation für Interfacedesign:
(1) Vor allem parallele Bearbeitung mehrerer Aufgaben problematisch
Grenzen des Arbeitsgedächtnisses
◼(1) Kapazitätsgrenze
Max. 7 Elemente – Miller (1956) „magical number seven plus or minus two“
Aber beachten:
− (1) Chunking: Zusammenfassg. v. Einzelinfos in größere bedeutungshaltige Einheiten
− (2) Entscheidend nicht Wortanzahl sondern Länge bei Aussprache
zu memorierende Informationen möglichst kurz halten, z.B.:
Navigationsinformationen (auditiv präsentiert)
Anzahl verschiedener Menüpunkte, die verglichen werden müssen
◼(2) Interferenz ̶ Ähnlichkeit bzgl. Inhalt und / oder Kodierung führt zu Störung (Interferenz)
◼(3) Zerfall ̶ Ohne Rehearsal (Wiederholen) innerhalb ca. 20 s zerfallen (vergessen)
Das Brown- Peterson- Paradigma
Brown-Peterson-Paradigma (Brown, 1959; Peterson & Peterson 1959)
◼3 Buchstaben merken (z.B. CRK)
◼ In Dreierschritten von Zahl (z.B. 431) rückwärts zählen (Unterdrückung Rehearsal) für 3-18 Sekunden
◼ Ergebnis: Erinnerungsleistung nimmt schnell ab bei Unterdrückung Rehearsal
◼ Hängt aber auch von Informationsmenge ab (Anzahl Buchstaben, schematische Abbildung, Wickens et al. 2013):
5 Designimplikationen in Bezug auf das Arbeitsgedächtnis
Generelle Implikationen für Interfacedesign:
(1) Chunkingvielfalt -> Vermeidung von langen Folgen ähnlich klingender Chunks
Beispiel -> ein Pilot soll 2 Wegpunkte abfliegen, diese sind absichtlich so unterschiedlich wie möglich benannt (RILAX -> MATIV)
(2) Kodierungsvielfalt -> Nutzung verschiedener Kodierungen (verbal vs. räumlich) für verschiedene Informationsquellen
Beispiel: Die Wegpunkte werden einerseits auditiv (per ATC) und visuell (auf dem Navi) angezeigt bzw. durchgegeben
(3) Rehearsal sicherstellen ->Sicherstellen, dass während bzw. unmittelbar vor und nach Speicherung von wichtigen Informationen keine zusätzlichen Aktivitäten auszuführen sind, die gleiche Kodierung oder sogar gleiches Material (z.B. nur Zahlen) nutzen
Beispiel: Während der Pilot den Funk verfolgt, werden andere Tätigkeiten, wie die Kontrolle der Flughöhe, unterlassen
(4) Keep order ->Nutzung von räumlicher Trennung und anderen Gestaltungsprinzipien, um Verwechslungen zu vermeiden
Beispiel: Der Bildschirm von Navi und anderen Anzeigen ist rechts vom PFD; der Klappenhebel ist weit entfernt vom Fahrwerkshebel
(5) Und ganz allgemein: Arbeitsgedächtnisbelastung im Blick behalten und Möglichkeiten zur einfachen Externalisierung von Gedächtnisinhalten schaffen (z.B. Marker, Notizfunktion)
Hauptdefinition Situation Awareness (Endsley)
◼ Situation Awareness (SA) – Situationsbewusstsein
Wichtige Voraussetzung für gute Entscheidungen in dynamischen Situationen
Fluglotsen, Piloten, Autofahrer, Leitwarten-Mitarbeiter, Chirurgen, ...
Mit +Informationsflut & komplexerer Technik: +Fehler durch –SA
Grundidee: „Situation Awareness is knowing what is going on around you.“(Endsley, 2000)
◼ Definition:
Hauptdefinition (wichtigste – populärste Definition): “Situation Awareness is
the perception of the elements in the environment within a volume of time and space,
the comprehension of their meaning,
and the projection of their status in the near future” (Endsley, 1988)
Stärker psychologische Definition:
„Situation Awareness is the continuous extraction of environmental information, integration of this information with previous knowledge to form a coherent mental picture, and the use of that picture in directing further perception and anticipating future events“ (Dominguez, 1994)
3 Stufen von Situation Awareness
(Level 1 SA) Wahrnehmung: beschreibt die Wahrnehmung von kritischen Elementen sowohl im System (z.B. Flugzeug), als auch in der Umwelt (Landebahn)
(Level 2 SA) Verstehen: beschreibt die Integration und Verknüpfung der Elemente und das Verstehen was diese Elemente bedeuten (in Bezug auf Nutzerziele)
(Level 3 SA) Vorhersage: beschreibt die Vorhersage, was in naher Zukunft in System passiert. Hier spielt Wissen zur üblichen Dynamik der Systemelemente eine Rolle. Vorhersage dient einer rechtzeitigen Antizipation von Handlungsnotwendigkeit
SA- Fehlertaxonomie (inkl. Bezug zu Stufen)
Wie kommt es zu suboptimaler SA? – Fehlertaxonomie (Endsley, 1995)
(Level 1 SA) Wahrnehmung
Relevante Informationen nicht verfügbar oder schwer zu detektieren
Fehler beim Monitoring
Fehlwahrnehmung
Vergessen der Informationen
(Level 2 SA) Verstehen
Fehlendes oder schlechtes mentales Modell
Nutzung eines falschen mentalen Modells
(Level 3 SA) Vorhersage
Quellen für Situation Awareness (Franke, 2009)
screenshot nachtragen folie 20!
6 Probleme für Generierung SA
(1) Attentional Tunneling
Zu wenig breite Wahrnehmung (enge Aufmerksamkeitsverteilung) = nur Informationen aus best. Bereichen werden in Situationsmodell aufgenommen bzw. bestimmte Informationen werden zu selten aktualisiert
(2) Begrenzte Gedächtniskapazität
Neue Informationen müssen mit bereits aufgenommenen kombiniert werden = schnell an Kapazitätsgrenze Arbeitsgedächtnis – besonders wenn Systeme viel Erinnerung notwendig machen (z.B. nur auditive Präsentation von Informationen)
(3) Überlastung mit Daten
Viele Daten & schnelle Änderung vs. Fähigkeit neue Daten zu integrieren – Daten effizient komprimieren (z.B. integrierte Anzeigen, Aggregation über Referenzperiode)
(4) Fehlplatzierte Salienz
Zu viele (wenig relevante) hochsaliente Anzeigen – Problem für Aufnahme andere Informationen (fokussierte Aufmerksamkeit)
(5) Fehlerhafte Mentale Modelle
Problem für Level 2 & 3 – falsche Repräsentation der Situation
(6) Automation & „Out-of-the-Loop“
Abnahme von SA wenn höhere Automatisierung – Problem für Übernahmesituation: System muss schnellen Aufbau ausreichender SA unterstützen
Designprinzipien für Unterstützung Situation Awareness
Schema-Bezug von Anzeigen
Nutzer haben best. Schemata (prototypische relevante Systemzustände) – Anzeigen sollten Wahrnehmung bzgl. „bestimmtes Schema trifft gerade zu“ vereinfachen
Überblicksanzeigen
Anzeigen die Gesamtüberblick über Situation/System geben zu jeder Zeit zugänglich (für globale SA)
Level 2 & 3 – Anzeigen
Anzeigen sollten direkt Informationsbedürfnisse von Level 2 & 3 adressieren (nicht erst Integration der Daten/Elemente notwendig)
Zielorientierte Anzeigen
Anzeigen so strukturieren, dass Anzeigen mit Relevanz für bestimmtes Nutzerziel gruppiert sind & Status bzgl. Zielerreichung direkt sichtbar
SA-Erfassung
SART
SPAM
SAGAT
wie wird gemessen?
kann man SAGAT uneingeschränkt empfehlen?
(1) SART - Situation Awareness Rating Technique
Subjektives Rating der eigenen Situation Awareness auf versch. Dimensionen
Erfasst nur grob inwieweit sich Personen als situationsbewusst erlebt
Korreliert eher nicht mit Leistungsmaßen
(2) SPAM - Situation Present Assessment Method
In der Situation werden ohne Unterbrechung der Tätigkeit (online) einzelne Fragen zur Situation gestellt – Erfassung von Antwortzeit & Korrektheit
(3) SAGAT - Situation Awareness Global Assessment Techniqu
Prototypischer Vertreter der „Freezing-Techniken“
Simulation wird angehalten, Anzeigen typischerweise ausgeblendet
Fragen nach aktueller Situation (z.B. Anzeigenwerte, Elemente in Umwelt, ...)
Wofür steht “SART” und wie funktioniert das Assessment?
Welche nachteile bietet SART?
Wo steht SART auf den Dimensionen direkt - indirekt und online - offline?
“SART” steht für “Situational Awareness Rating Technique
beim SART wird subjektiv auf mehreren Dimensionen bipolar gerated, z.B.:
The amount of demand on attentionnal resources (D)
Instability of the Situation i.e. likeliness to change suddenly
Complexity of the Situation i.e. degree of complication
Variability of the Situation i.e. number of variables and factors changing
Supply of attentionnal resources (perceived workload) (S)
Arousal i.e. degree of alertness or readiness for action
Concentration of attention i.e. degree to which thoughts are brought to bear
Division of attention i.e. distribution, spread of focus
Spare mental capacity i.e. mental ability available for new variables
Understanding of the situation provided (U)
Information quantity i.e. amount of knowledge received and understood
Information quality i.e. accuracy and value of knowledge communicated
Familiarity with the situation i.e. degree of prior experience and knowledge
SART wird auf den Dimensionen nicht angegeben, aber meine Einschätzung wäre, dass es sich um ein indirektes und offline- Verfahren handelt
Nachteile sind, dass SART nur grob erfasst, wie situationsbewusst sich Personen erleben und dass es nicht mit Leistungsmaßen korreliert
Wofür steht “SPAM”?
Wo ordnet sich SPAM auf den Dimensionen offline-online und direkt-indirekt ein?
Wie funktioniert SPAM?
SPAM steht für Situation present assesment method
in der Situation werden ohne Unterbrechung der Tätigkeit (online) einzelne Fragen zur Situation gestellt - erfasst wird die Antwortzeit und Korrektheit
SPAM ist direkt und online
Vorteil gegenüber SAGAT: manchmal ist es lediglich notwendig in einer gegebenen Situation (z.B. ATC) zu wissen, wo man bestimmte Informationen (z.B. Callsign eines Flugzeuges) finden kann, stattt dies immer im Arbeitsgedächtnis zu behalten
Wofür steht SAGAT?
Was ist das Besondere an SAGAT und gleichzeitig der entscheidende Unterschied zu SPAM?
Wo ordnet sich SAGAT auf der direkt- indirekt und online- offline Dimension ein?
Welche Nachteile hat SAGAT bzw. kann man dies uneingeschränkt empfehlen?
SAGAT steht für Situation Awareness Global Assessment Technique
Prototypischer Vertreter der “Freezing” Techniken
Simulation wird angehalten und wichtige Anzeigen ausgeblendet, z.B. die Position eines Flugzeugs bei ATC
Dann wird nach der aktuellen Situation gefragt, TN muss angeben, wo sich die relevanten Informationen finden lassen (z.B. Positionen der Flugzeuge im Luftraum)
SAGAT ist eine direkte und offline- Messung
Problematisch kann SAGAT beim Abfragen von gedächtnisbasierten Freezing- Techniken sein, man sollte hier nur wenig informationen unmittelbar abfragen
Definition mentales Modell
Unsere Arbeitsdefinitionen (Carroll & Olson, 1987):
„A rich and elaborate structure, reflecting the user’s understanding of
• (a) what the system contains,
• (b) how it works, and
• (c) why it works that way.
It can be conceived as knowledge about the system sufficient to permit the user to mentally try out actions before choosing one to execute.”
Grundidee: In vielen Kontexten der Mensch-Technik Interaktion ist korrektes Systemverständnis relevant (Wie funktioniert das System?)
Nutzer entwickeln subjektives Systemverständnis
Häufig genutzter Begriff: Mentales Modell
Was ist ein mentales Modell?
Lange Debatte – viele unterschiedliche Definitionen & Sichtweisen
Z.B. kognitive Psychologie vs. Human Factors / HCI
4 Kernmerkmale von mentalen Modellen in Bezug auf Mensch-Technik Interaktion - REIM
Wie werden MM konstruiert?
Welche Struktur weisen MM auf?
Kernmerkmale MM in Bezug auf Mensch-Technik-Interaktion(Wickens et al. 2013):
1 Mentale Struktur die reflektiert wie ein Nutzer ein System versteht
2 Repräsentation eines technischen Systems die ausreichend ist um bestimmte Aktionen mental zu simulieren (auszuprobieren) bevor Entscheidung treffen
3 Zur Ableitung von Erwartungen bzgl. “Wie wird das System reagieren?”
4 Typischerweise durch Interaktion mit System gebildet (spontan entwickelt oder durch spezifisches Training geformt)
◼Konstruktion mentaler Modelle
Instruktionen, Training, Erfahrung
Analogien / Metaphern
Menschen transferieren bestehendes Wissen in neue, scheinbar ähnliche Domänen
Problem – Analogien liefern keine 100%ige Genauigkeit
Struktur mentaler Modelle
Repräsentation von Objekten und deren Beziehungen zueinander – kausale Verknüpfungen (oder zumindest korrelative Beziehungen)
Modelle großer, komplexer Systeme sehr wahrscheinlich in kleinere, unabhängig voneinander funktionierende Modelle unterteilt
„Running the model“
Gedankliche Manipulation des Modells um Hypothesen über die Realität (das „Zielsystem“) zu testen
Unterscheidung konzeptuelles Modell vs. mentales Modell vs. Systembild
Zu unterscheiden:
(1) Designmodell / Konzeptuelles Modell
Das ist die Repräsentation des Systems bzw. der Maschine durch den Designer. Das Designmodell ist korrekt, konsistent und vollständig. Es ist „Erfunden“ bzw. vordefiniert.
(2) Nutzermodell / Mentales Modell
Meint die Repräsentation des Systems bzw. der Maschine durch den Nutzer. Das mentale Modell ist zumeist technisch nicht völlig korrekt und häufig unvollständig, aber funktional. Es entwickelt sich natürlich, durch Interaktion mit dem Zielsystem
(3) Systembild (System Image)
Ist das physische Erscheinungsbild des Systems, seine Arbeitsweise, seine Reaktionen, und die zugehörigen Manuale und Instruktionen
Design Guideline: Über Systembild Nutzer ein angemessenes mentales Modell vermitteln (entsprechend konzeptuellem Modell des Designers)
Begrifflichkeit Doppelaufgaben-Leistungseinbußen
Doppelaufgaben-Leistungseinbußen: Der Vergleich der Leistung in 2 Aufgaben bei gleichzeitig vs. alleiniger Bearbeitung
3 Komponenten von Multitasking
3 relevante Komponenten von Multitasking
(1) Anstrengung – Ressourcenbeanspruchung
Anstrengung, die Bearbeitung einer oder mehrerer Aufgaben erfordert bzw. die bei der Bearbeitung investiert wird – Ressourcenbeanspruchung
Verknüpft mit Aufgabenschwierigkeit
(2) Ähnlichkeit – Multiplizität der Ressourcen
Ähnlichkeit der zu bearbeitenden Aufgaben hinsichtlich der beanspruchten Ressourcen
Vielfältigkeit (Multiplizität) der Ressourcen (z.B. Modalität) – Ressourcenstruktur
Nicht nur ein „Pool“ von Ressourcen sondern mehrere (z.B. laufen vs. sprechen) Aus (1) und (2) gemeinsam ergeben sich Doppelaufgaben-Leistungseinbußen
(3) Ressourcenmanagement – Ressourcenallokation
Verteilung der Ressourcen/Anstrengung bei Bearbeitung der Aufgaben
→Theorie multipler Ressourcen
Effort inkl. Rolle von Automatizität & Performance-Ressource Function
Ausgangsgedanke:
Es sind limitierte Ressourcen zur Bearbeitung von Aufgaben vorhanden
Je mehr Ressourcen eine Aufgabe benötigt, desto weniger verbleiben für etwaige Parallelaufgaben
Automatizität – Aufgabe kann mit sehr geringer Aufmerksamkeitszuwendung ausgeführt werden
Entsteht bei:
• (1) Umfassender Übung
• (2) Sehr einfacher Reiz-Reaktions-Kombination
Entsprechend kaum Ressourcen erforderlich, keine Einschränkungen bei paralleler Bearbeitung einer zweiten Aufgabe zu erwarten (keine Doppelaufgaben-Leistungseinbußen)
(tlw. für hochautomatisierte [überlernte] Aufgaben sogar nachteilig wenn Aufmerksamkeitszuwendung)
Performance-Ressource Function
Normalfall: keine Automatizität
Aufgaben brauchen, je nach (a) Schwierigkeitsgrad und (b) Expertisegrad, ein
unterschiedliches Maß an Ressourcen
3 Arten von Aufgaben – „Performance-Ressource Function“ (Norman & Bobrow, 1975)
A – schwere Aufgabe (bzw. weniger geübt) – je stärker der Ressourceneinsatz, desto besser die Performanz - z.B. eine komplexe cognitive Task
ergo: die Aufgabe ist ressourcenlimitiert
B leichte Aufgabe (bzw. hoher Expertisegrad) – maximaler Ressourceneinsatz nicht für maximale Performanz erforderlich
C – (mittelschwere) Aufgabe, bei der zusätzliche Anstrengung nur bis zu bestimmtem Punkt eine bessere Performanz zur Folge hat, z.B. Wahrnehmungsschwelle (Beispiel: Höraufgabe, Dinge können nur bis zu einem bestimmten Grat gehört werden)
ergo: die Aufgabe ist datenlimitiert
◼ Bei 2 Aufgaben (hier: A vs. B) Entscheidung bzgl. Ressourcenallokation
A- der VL Folgen (durchgestrichen)
B - Folien Markieren (gestrichelt)
Multiplizität
Was ist die Grundidee?
Wie lauten die 4 Dimensionen?
Nicht einzelner „Ressourcentopf“, aus dem alle Aufgaben bedient werden Vielmehr versch. Aufgaben, in Abhängigkeit von ihren jeweiligen Merkmalen, durch unterschiedliche, voneinander unabhängige Ressourcen gespeist
Je ähnlicher sich Aufgaben bzgl. dieser Merkmale sind, desto größer ist die zu erwartende Interferenz Z.B. Laufen und Telefonieren vs. Textnachrichten schreiben
4 Dimensionen:
(1) Verarbeitungsstufen
(2) Verarbeitungscodes
(3) Wahrnehmungsmodalität
(4) Visuelle Kanäle (foveale vs. periphere vis. Verarbeitung; später hinzugefügt)
Details zu den 4 Dimensionen (insbes. Unterscheidungen & Implikationen)
Meint die Unterscheidung zwischen
(A) Perzeptiven/kognitiven Aktivitäten und
(B) Handlungsauswahl/-ausführung
Evidenz:
Neuropsychologische Befunde: verschiedene Gehirnareale für
(a) Sprache und Motorik auf der einen, und
(b) Wahrnehmung und Sprachverstehen auf der anderen Seite
Nachweis: z.B. wenn Schwierigkeit (Ressourcenbeanspruchung) hinsichtlich Reaktionskomponente bei Aufgabe 1 manipuliert & keine Auswirkungen auf wahrnehmungsbezogene Aufgabe 2
Entsprechend:
Interferenzen zw. ...
(a) Wahrnehmungsaufgaben &
(b) kognitiven Aufgabe
➔ obwohl untersch. Prozesse
z.B. sollten die kognitiven Prozesse eines Telefongespräches während der Autofahrt mit den Wahrnehmungsanforderungen des Autofahrens, insbesondere wahrnehmen von Veränderung, interferieren
Unterscheidung:
• (A) (manuell)-räumlich vs.
• (B) (vokal)-verbal
̶ Evidenz:
Ebenso verschiedene Gehirnareale (hier die beiden Hemisphären)
Siehe z.B. auch verschiedene Strukturen des Arbeitsgedächtnisses
Nachweis: manuelle Handlungen (manuelle Kontrolle, meist stark räumlich, z.B. Maus, Tracking, Lenken) gut gleichzeitig mit sprachlichen Aktionen ausführbar
− Z.B. (1) kontinuierliche manuelle Zielverfolgung (Tracking) geht leichter parallel mit (2) diskreter verbaler Aufgabe (wenn bei (2) verbale anstatt manuelle Reaktion)
− (Schreiben auf Tastatur = „hybrid“ = manuelle Handlung, von verbaler Kognition gespeist)
̶ Designimplikation:
• Z.B. zusätzliche manuelle Kontrolle stört Leistung in Aufgabenumgebung mit starker räumlicher Komponente (z.B. Autofahren)
◼(3) Wahrnehmungsmodalität
• (A) visuell vs. • (B) auditiv vs. • (C) taktil
Aussage:
• Starke Interferenz zu erwarten, wenn beide Aufgaben gleiche Modalität fordern
• z.B. zwei parallele visuelle Aufgaben – Autofahren und Navigationssystem bedienen
Designimplikation:
• Entsprechend sinnvoll (wenn möglich) versch. Modalitäten anzusprechen
− Z.B. stark visuell beanspruchende Displays – Teile auf auditive Präsentation„auslagern“ (z.B. Warn- und Statussounds)
− Z.B. System mit gleichzeitigen auditiven Nachrichten – lieber Teil davon visuell
− Immer noch wenig ausgereizt: taktiles Feedback (Z.B. aktives Gaspedal, Lagefeedback für Hubschrauberpiloten, ...)
(5) Details zu den 4 Dimensionen (insbes. Unterscheidungen & Implikationen)
(4) Visuelle Kanäle
◼(4) Visuelle Kanäle ̶ Unterscheidung:
• (A) Fokal (foveal) vs.
• (B) peripher
Offenbar unterschiedliche Hirnstrukturen und auch verschiedene Formen der Informationsverarbeitung
Fokales/foveales Sehen für feine Details, Muster- und Objekterkennung − Z.B. Text lesen, kleine Objekte auf Bildschirm identifzieren
Peripheres Sehen für Wahrnehmung von Richtung und Eigenbewegung − Z.B. durch Kurve steuern und auf Spur bleiben (Autofahren)
• Z.B. im Luftfahrtbereich – peripheres Sehen ausnutzen um Hinweise & Warnungen zu vermitteln (wo fokales Sehen von Piloten schon ausgelastet ist)
Modell der multiplen Ressourcen (Grundidee & Grafik Gesamtmodell) - Würfel beschriften können!!!
2 Varianten der Ressourcenzuwendung
Grundidee: Durch Ressourcenbeanspruchung & Multiplizität der Ressourcen entsteht eine Doppelaufgaben-Leistungseinbuße ➔Wie wird Einbuße verteilt?
Notwendigkeit der aktiven Ressourcensteuerung bzw. -verteilung zwischen den verschiedenen parallelen Aufgaben
Z.B.: meist wird Spurhaltung/Gefahrenvermeidung beim Fahren über Handygespräch priorisiert
Wie geht das? Aufgabe der zentralen Exekutive des Arbeitsgedächtnisses
2 Varianten der Ressourcenzuwendung:
(A) Graduelle Verteilung der Ressourcen zwischen mehreren Aufgaben
Z.B. Priorisierung durch Instruktion/Incentives
(B) Alles-oder-nichts Verteilung der Ressourcen, mit Wechsel zwischen den Aufgaben (z.B. Unterbrechungsmanagement)
Multitasker = Entscheider, z.B. „jetzt Navi-Zieleingabe & keine Aufmerksamkeit Spurhaltung“
Aufgabenwechsel Grundstruktur
+3 Hauptbefunde zu Aufgabenwechsel
Typisches experimentelles Paradigma:
Umgang mit Zahlenpaaren In trial 1 „Summe >10?“ in trial 2 „durch 2 teilbar?“
Ständiger Wechsel zwischen 2 Aufgaben (stimulus-response mapping)
Ergebnis: Vergleich Performanz 40x mit Wechsel vs. 2x20x ohne Wechsel
3 Hauptbefunde zu Aufgabenwechsel:
(1) Aufgabenwechsel mit „Kosten“ verbunden
Antwortzeiten länger bei gemischten als bei getrennten Aufgaben
(bei komplexen Aufgaben/Umgebungen bis >1 Sekunde)
(2) Kosten höher, je ähnlicher sich die Aufgaben sind (vor allem im Hinblick auf mögliche Verwechslungen)
• Z.B. wenn Stimuli klar anzeigen welche Aktionen ausgeführt werden sollen (z.B. Beispiel oben vs. Entscheidung Vokal/Konsonant in jeweils trial 2) = geringere Kosten (leichter)
(3) Kosten größer, wenn Wechsel schnell aufeinander erfolgen
Als würde es etwas dauern, um Entscheidungsregeln für andere anstehende Aufgabe zu
„laden“
Aber auch wenn mehr Zeit für Wechsel – trotzdem Kosten (als ob es physische Präsenz der Aufgabe bräuchte, um Regeln zu „laden“)
Einflussgrößen auf Wechsel 1 & 2
Nennen Sie die Einflussgrößen auf Wechsel 1 (Wechsel von Primär- auf Sekundär) - ERMTTBS
Nennen Sie die Einflussgrößen auf Wechsel 2: (Wechsel zurück auf Primäraufgabe) - BLUÄ
Einflussgrößen auf Wechsel-1 (kontinuierliche Primäraufgabe zu Nebenaufgabe)
(1) „Engagement“ in Primäraufgabe
Je gebundener man in Primäraufgabe ist, desto schwerer/unwahrscheinlicher wird Wechsel zur Nebenaufgabe (z.B. „cognitive tunneling“)
Eigenschaften/Faktoren von Engagement?
Inhärentes Interesse an Aufgabe (bzw. interessante Details/Merkmale - Immersion)
+Workload (und Stress) in Primäraufgabe
(2) Relevanz der Primäraufgabe
Je bedeutsamer die Primäraufgabe (bzw. deren korrekte Ausführung), desto
später bzw. unwahrscheinlicher der Aufgabenwechsel
(3) Modalität der Aufgabe
Auditive Aufgaben (mit flüchtiger Information) werden länger aufrechterhalten bzw. werden eher gestartet als Aufgaben, deren Informationen nicht leicht verloren gehen
(4) Teilziele
Aufgaben werden tendenziell eher dann unterbrochen, wenn bestimmte Teilaufgaben abgeschlossen sind (z.B. Unterbrechung nach Absatz besser)
Designimplikation: z.B. Hinweise/Unterbrechungen wie „neue Nachricht“ besser nach Erreichen von Teilzielen darbieten
(5) Temporäre Instabilität des Systems (kritische Dynamik)
Dynamik der Primäraufgabe (d.h. Veränderlichkeit der Bedingungen) kann dazu führen, dass in bestimmten Situation ein Aufgabenwechsel eher oder eher nicht erfolgt (z.B. wenn Querbeschleunigung od. laterale Geschwindigkeit gerade hoch bei Fahrzeugsteuerung)
(6) Bewusste Verzögerung
Um letzten aktuellen Arbeitsschritt in der Primäraufgabe a) zu memorieren oder b)
zu markieren
(7) Salienz der Nebenaufgabe
Je auffälliger, desto wahrscheinlicher die Aufmerksamkeitszuwendung
Z.B.: taktile & auditive Unterbrechungen typischerweise salienter als visuelle
Designimplikation: z.B. Unterbrechungswirkung auditiver/taktiler Signale beachten
Einflussgrößen auf Wechsel-2 (zurück zu Primäraufgabe) – „resumption lag“ & Fehlerfreiheit des Rückwechsels
(1) Bewusste Verzögerung vor Wechsel 1, um Aufgabe am richtigen Arbeitsschritt fortzusetzen = flüssigerer Rückwechsel
(2) Lange/komplexe Nebenaufgaben erschweren die Rückkehr ̶ Z.B. Zerfall von Zielrepräsentationen bzgl. Primäraufgabe durch Länge & Schwierigkeit des Rehearsals (freie Ressourcen trotz Nebenaufgabe)
(3) Unterbrechung der Sichtbarkeit der Primäraufgabe erschwert Rückkehr
Z.B. räumliche Entfernung (des Blicks) von Primäraufgabe während Nebenaufg.
(4) Ähnlichkeit zwischen Aufgaben erschwert Rückkehr
Verwechslung von Material / Überlagerungen im Arbeitsgedächtnis
Nennen Sie die 3 zentralen Kriterien für Aufgabenzuwendung
Priorisierung von Aufgaben auf höherer Ebene – was soll zuerst getan werden?
Auf untersch. Zeitskalen (z.B. Chirurg während OP vs. Student im Semester)
3 zentrale Kriterien:
(1) Dringlichkeit – Verhältnis Bearbeitungszeit / Zeit bis Deadline
(2) Wichtigkeit – Bedeutsamkeit Aufgabe (Wert der Aufgabe für Zielerreichung)
(3) Dauer der Aufgabe – Wenn lange Aufgabe begonnen – bindet Ressourcen länger (Tendenz zur Vermeidung von Aufgabenwechseln, switching costs), entsprechend häufig Tendenz, zunächst schnell zu erledigende Aufgaben abzuarbeiten
◼Optimale Priorisierung erfordert Planung
Planung selbst ressourcenintensiv, entsprechend häufig vernachlässigt
Designimplikation: Priorisierung unterstützen – z.B. 3 Aspekte repräsentieren
Nennen Sie 2 Beispiele für individuelle Unterschiede beim Aufgabenmanagement und Ressourcenzuwendung
…am Beispiel von Pilot*innen.
(1) Expertise
(1) Höhere Automatisierung der einzelnen Aufgaben
(2) Besseres visuelles Suchverhalten (+Suchstrategien)
(3) Besseres Management von Aufgabenwechseln
(4) Flexibler bei der Aufmerksamkeitsverteilung
Einiges davon direkt trainierbar, z.B.:
• Training visuellen Suchverhaltens für Fahranfänger
• Training im Umgang mit Unterbrechungen für Piloten
(2) Alterseffekte
(1) Nachlassende Flexibilität bei der Aufmerksamkeitsverteilung
(2) Probleme bei fokussierter Aufmerksamkeit→leichter abzulenken
(3) Generelle Probleme bei der Exekutiven Kontrolle (zentrale Exekutive im Arbeitsgedächtnis), die für die Ressourcenzuteilung verantwortlich ist
Indikatoren für Auswirkungen von Fahrerablenkung auf Performanz
Auswirkungen - Beeinträchtigung der Fahrperformanz (Regan, Lee, & Young, 2009 oder Young, Hammer, & Regan, 2003 für einen Überblick)
Lückenakzeptanz
Schwierigkeiten bei der Auswahl geeigneter Lücken zum Durchfahren bzw. zum Überqueren und Einordnen
Laterale / longitudinale Kontrolle
stärkere Variationen in der Spurhaltung, in Abständen zu vorausfahrenden Fahrzeugen und im Bremsverhalten (z.B. an Ampeln)
Reaktionszeiten
Zu späte oder ausbleibende Reaktionen auf kritische Ereignisse (z.B. bremsendes Fahrzeug voraus)
Blickabwendungen
Längere Blicke weg von der Straße, mit entsprechenden Folgen für die Entdeckung sicherheitsrelevanter Hinweise
Begrifflichkeit Workload
Wie hat sich der Begriff mental Workload entwickelt?
Begriffsbestimmung Mental Workload (Wickens, 2013)
Wie lautet die Definition nach Young & Stanton (2005)?
Workload
Eins der am meisten genutzten Konzepte im Bereich Human Factors / IngPsy
Fragen im Systemdesign die Workload betreffen - z.B.:
Wie komplex sind die zu bearbeitenden Aufgaben?
Könnten noch zusätzliche Aufgaben zu den bestehenden geleistet werden?
Wird der Nutzer fähig sein auf unerwartete Ereignisse zu reagieren?
... Fragen können durch Erfassung von Workload adressiert werden
Für uns im Fokus: Mental Workload
Forschungsentwicklung Mental Workload in Ergonomie-Literatur
80er: Etablierung des Konzept & Fokus auf Messung
90er: Entwicklungen von Modellen & physiologischen Messmethoden
00er: Vielfältige Anwendungen des Konstrukts
Mental Workload erfasst inwieweit Aufgaben die begrenzte Informationsverarbeitungskapazität der Person beanspruchen
Definition nach Young and Stanton (2005): “The level of attentional resources required to meet both objective and subjective performance criteria”
Kriterien können extern oder intern (Ziele) gesetzt werden
Unterscheidung Mental Workload vs. Physical Workload
Unterscheidung Mental Workload vs. Physical Workload:
Physical: Energieanforderungen an Muskeln
Mental: „Energieanforderungen“ an Gehirn
Nennen Sie die Begriffsbestimmungen von psychischcher Belastung und Beanspruchung
Skizzieren Sie den Unterschied zwischen den beiden und stellen Sie einen Bezug zu mental Workload her.
Psychische Belastung & Beanspruchung
Hauptbegrifflichkeiten im dt. Sprachraum
Belastung: Objektive, von außen auf den Menschen einwirkende Faktoren (z.B. Gewichte, Lärm, Zeitdruck)
Beanspruchung: Auswirkungen von Belastung beim Menschen
Bezug zu Mental Workload?
Nach ISO 10075-1 – „Mental Workload“ = „Psychische Belastung“ als generischer Überbegriff
Definitionen Belastung & Beanspruchung nach DIN EN ISO 10075-1
Definition “Psychische Belastung”: „Gesamtheit aller erfassbaren Einflüsse, die von außen auf den Menschen zukommen und diesen psychisch beeinflussen“
Sowohl positive als auch negative Auswirkungen möglich
Gesamtheit = es gibt keinen Plural von Belastung
Gesamtheit aller Belastungsfaktoren (ugs. „Stressoren“)
Definition Psychische Beanspruchung: „Unmittelbare Auswirkung der psychischen Belastung im Individuum in Abhängigkeit von seinen jeweiligen individuellen Voraussetzungen.“
(Früher in DIN 33405: „Die individuelle, zeitlich unmittelbare und nicht langfristige Auswirkung der psychischen Belastung im Menschen in Abhängigkeit von seinen individuellen Voraussetzungen und seinem Zustand.“)
Was meint „individuelle Voraussetzungen“?
Individuelle Merkmale wie z.B. Alter, Geschlecht, Fertigkeiten, Bewältigungsstrategien
Es gibt auch keinen Plural von Beanspruchung
Belastungsfaktoren – 4 Oberkategorien & Beispiele
A (1,2,3,4,5)
B(1,2,3,4,5)
C(1,2,3,4,5,6)
D(1,2,3)
(A) Anforderungen der Aufgabe
(1) Daueraufmerksamkeit
längere Beobachtung Radarschirm
(2) Informationsverarbeitung
Anzahl/Art der zu entdeckenden/identifizierenden/verarbeitenden Signale, Schlüsse ziehen aus unvollständigen Informationen, Entscheidung zw. alternativen Handlungsweisen
(3) Verantwortlichkeit
Für Gesundheit und Sicherheit von Mitarbeitern, für Produktionsverluste
(4) Dauer, zeitliches Muster, zeitliche Lage der Tätigkeit
Arbeitszeit, Ruhepausen, Schichtarbeit
(5) Gefahren
Untertagearbeit, Verkehr, Umgang mit Explosivstoffen
(B) Physikalische Bedingungen
(1) Beleuchtung
Leuchtdichte, Kontrast, Blendung
(2) Klimabedingungen
Temperatur, Feuchte, Luftbewegung
(3) Lärm & Vibrationen
Schalldruck, Frequenz, zeitliche Verteilung (Lärm) & Frequenz, Amplitude (Vibrationen)
(4) Wetter
Regen, Sturm
(5) Gerüche
Stechend, ekelerregend, blumig
(C) Soziale & organisatorische Faktoren
(1) Organisationstyp
Führungsstruktur, Kommunikationsstruktur
(2) Betriebsklima
Persönliche Akzeptanz, zwischenmenschliche Beziehungen
(3) Gruppenmerkmale
Gruppenstruktur, Zusammenhalt
(4) Führung
Kontrollspanne
(5) Konflikte
Zwischen Gruppen/Einzelpersonen
(6) Soziale Kontakte
Isolierter Arbeitsplatz, Interaktion mit Kunden und Patienten
(D) Gesellschaftliche Faktoren (außerhalb Organisation)
(1) Gesellschaftliche Anforderungen
Verantwortlichkeit für die öffentliche Gesundheit oder das Gemeinwohl
(2) Kulturelle Normen
Akzeptable Arbeitsbedingungen, Werte, Normen
(3) Wirtschaftliche Lage
Arbeitsmarkt
Beanspruchungsfolgen – Kategorien & Kernkonzepte (bes. Begriffe Ermüdung, Monotonie, Sättigung)
(A) Förderliche kurzfristige Effekte
(B) Förderliche langfristige Effekte
(C) Beeinträchtigende kurzfristige Effekte
(D) Beeinträchtigende langfristige Effekte
Aufwärmeffekt – bald nach Beginn einer Tätigkeit wird diese Tätigkeit mit weniger Anstrengung als am Anfang ausgeführt
Aktivierung – „innerer Zustand mit erhöhter psychischer und körperlicher Funktionstüchtigkeit“ (es gibt ein optimales Level der Aktivierung)
Lernen & Übungseffekt – kurzfristige Folge – aber dauerhafte Änderung im Verhalten
̶ Kompetenzentwicklung – „ Neuerwerb, Festigung, Verbesserung und/oder Ausdifferenzierung psychischer, emotionaler und motorischer Fähigkeiten und Fertigkeiten“
Psychische Ermüdung – „vorübergehende Beeinträchtigung der psychischen und körperlichen Funktionstüchtigkeit“
Verlust Leistungsfähigkeit nur durch Erholung (Pause) kompensierbar
Monotonie – „langsam entstehender Zustand herabgesetzter Aktivierung, der hauptsächlich mit Schläfrigkeit, Müdigkeit, Leistungsabnahme und - schwankungen, Verminderung der Umstellungs- und Reaktionsfähigkeit sowie einer Zunahme der Schwankungen der Herzschlagfrequenz einhergeht“
Z.B. bei Radarüberwachung
Unterschied Ermüdung: Effekt verschwindet bei Wechsel Tätigkeit/Anforderung
Sättigung – „Zustand der nervös-unruhevollen, stark affektbetonten Ablehnung einer sich wiederholenden Tätigkeit oder Situation, bei der das Erleben des Auf- der-Stelle-Tretens oder des Nicht-weiter-Kommens besteht“
• Symptome wie Ärger & Leistungsabfall – Unterschied Monotonie: höhere Aktivierung
Burnout-Syndrom
Beispiele für Gestaltungsgrundsätze (DIN EN ISO 10075-2)
Leitsätze in Bezug auf Ermüdung – z.B.:
(1) Mehrdeutigkeit des Aufgabenziels vermeiden (Klare Aufgabenziele & Prioritäten)
(2) Mehrdeutigkeit der Informationen vermeiden
Z.B. Bereitstellung von Bereichsinformationen (akzeptabel, nicht akzeptabel) anstatt Notwendigkeit zur Interpretation
(3) Unterscheidbarkeit von Signalen
Z.B. Veränderung Intensität von Signalen, unterschiedliche Kodierung durch Form, Farbe, Dauer, oder Zeitcharakteristiken, Reduktion
(4) Kompatibilität
Inkompatibilität mit allgemein verbreiteten Erwartungen der Benutzer vermeiden
(5) Genauigkeit der Informationsverarbeitung
Ggf. Unterstützung durch Anzeige oder Steuerungssystem bei Anforderungen an Genauigkeit > menschlische Kapazitäten (z.B. Operationen)
(6) Beanspruchung Arbeitsgedächtnis & Langzeitgedächtnis
Overload & Underload – optimales Workload
Sowohl Overload als auch Underload = suboptimales Workload
(A) Overload
Triff auf, wenn ein Nutzer mit mehr Informationen umgehen muss als für Ihn möglich (gegeben eines bestimmten Performance- Standards). Unmittelbare Folge können Ablenung und eine unzureichende Zeit für eine angemessene Informationsverarbeitung sein. Dies stellt somit eine Fehlerquelle dar.
(B) Underload
Eine zu geringe Stimulation kann zu Underload führen. Das Ergebnis: Ressourcen werden auf andere Aufgaben verteilt bzw. gehen generell zurück (z.B. Kompetenzabbau). Eine Unmittelbare Folge ist z.B. eine geringere Wachsamkeit bzw. Aufmerksamkeit. Dies stellt ebenfalls eine Fehlerquelle dar.
Implikation:
Underload kann genauso schädlich für Performanz sein wie Overload
Es gibt einen optimalen Workload-Bereich = beste Performanz
Daher: keine Garantie, dass Reduktion von Workload zu +Performanz führt (kann auch Gegenteil passieren)
Yerkes Dodson Law
Beste Leistung wird bei mittlerem Aktivationsniveau (Arousal) erreicht, Leistung nimmt bei niedrigerem und höherem Aktivationsniveau ab
Umgekehrt U-förmiger Zusammenhang zwischen Aktivationsniveau und Leistung
Außerdem:
Bei leichten Aufgaben höhere Aktivation förderlicher für Leistung
Bei schweren Aufgaben niedrigere Aktivation förderlicher für Leistung
„Ur-Experiment“: Mäuse zeigen bei mittleren Elektroschocks die beste Lernleistung (z.B. visuelle Diskriminationsaufgabe), zusätzliche Erhöhung Elektroschocks = schlechterer Leistung
Workload & die „rote Linie“ (Wickens)
Zentral Kenngröße in Systemen mit begrenzten Ressourcen:
Die Rote Linie meint den Überschneidungspunkt von genutzten Ressourcen mit der Leistung in einer Aufgabe, in Abhängigkeit von den in der Aufgabe geforderten Demands. Die Linie teilt den “Leistungsraum” in zwei Bereiche. Links der roten Linie die Reservekapazitäten, bei denen die verfügbaren noch größer sind als die genutzten Ressourcen. Rechts der Linie ist der Overload, weil hier die Aufgaben- Demands steigen, womit gleichzeitig die nötigen Ressourcen steigen, die eine Person zur verfügung stellen muss (verfügbar = genutzt). Werden die Aufgaben- Demands zusätzlich erhöht, geht die Leistung runter, weil keine Ressourcen mehr zur Verfügung stehen.
Verhältnis von genutzten zu verfügbaren Ressourcen
Verfügbare > genutzte Ressourcen: Performanz optimal
Verfügbare = genutzte Ress.:
„rote Linie“ zw.
Bereich-A) Reservekapazität
Bereich-B) Overload
Zentrale Frage im Systemdesign: Wo liegt die rote Line und wann kommt es zu Overload (dies ist bei zählbaren Variablen wie z.B. Akzeptable Geschwindigkeit von Trackingaufgaben ein einfacher Fall). Für das Arbeitsgedächtnis kennen wir die “rote Linie” - ca. 7. Chunks. Eine offene Frage bleibt: Wo ist die rote Linie für Underload und wie kann man Sie bestimmen?
Auf welchen Dimensionen lässt sich Workload beurteilen bzw. messen?
NASA-TLX & SEA
(1) Verhalten
Beachten: Performanz (Leistung) wird sich im Bereich Reservekapazität nicht ändern – aber Verhalten
Z.B. bei Aufgaben mit manueller Kontrolle: Kontrollaktivität & mittlere Kontrollgeschwindigkeit
(2) Performanz in Primäraufgabe
Inwieweit kann Person Performanz in Primäraufgabe in akzeptablen Bereich halten
Z.B. Autofahren – Güte der lateralen Spurhaltung, Fehler, ...
(3) Performanz in Zweitaufgabe
z.B. Peripheral Detection Task (PDT) – peripher eingeblendete Lichtreize registrieren – mit +Workload = längere Reaktionszeiten & mehr verpasste Signale
(4) Subjektive Maße
(5) Physiologische Maße
Herzrate & Herzratenvariabilität
+Beanspruchung = + Herzrate, -HRV
Pupillometrie
Veränderungen des Pupillendurchmessers
Beispiele für subjektive Maße
(1) NASA Task Load Index (NASA-TLX; Hart and Staveland 1988)
Am meisten genutztes Instrument zur Erfassung der erlebten subjektiven Beanspruchung
Mehrdimensional
Messung geistiger, körperlicher, zeitlicher Beanspruchung
(2) Subjective Workload Assessment Technique (SWAT; Reid and Nygren 1988)
(3) Rating Scale Mental Effort (RSME; Zijlstra 1993)
(4) SEA-Skala (Eilers, Nachreiner & Hänecke, 1986)
Eindimensionale Skala
Punktwertskala mit Werten von 0 bis 220 & verbalen Ankern an bestimmten Stellen
Begriffsbestimmung Stress (Was ist Stress?)
Was ist Stress?
Stress ist ein subjektiv intensiv unangenehmer Spannungszustand, der aus der Befürchtung resultiert, dass eine Situation eintritt, die ...
(A) stark aversiv ist
(B) zeitlich nah (auch bereits eingetreten) ist
(C) subjektiv lang andauert (andauern wird)
(D) vermutlich nicht komplett kontrollierbar ist
(E) jedoch (subjektiv) unbedingt vermieden werden sollte
Stressoren = Faktoren (externe sowie interne Stimuli), die Stressreaktion auslösen
Stressoren entsprechen Belastungsfaktoren (Schaper, 2011)
Stressreaktionen = psychische Zustände/Verhaltensweisen, Resultat von Stress
Stressreaktionen entspricht Beanspruchung (Schaper, 2011)
Transaktionales Stressmodell – Grundidee & Bewertungsprozesse
Transaktionales Stressmodell von Lazarus & Folkmann (1984)
Kognitives Stressmodell = nicht einfache Reaktion auf Reiz, sondern Betrachtung von Prozessen der kognitiven und emotionalen Bewertung einer Situation
Drei Bewertungsprozesse
(1) Primary Appraisal:
• Sind potentielle Stressoren vorhanden? Bedrohungen?
(2) Secondary Appraisal:
• Sind ausreichende Ressourcen (Möglichkeiten zur Bewältigung) und Bewältigungs-/Coping- Strategien vorhanden?
(3) Re-Appraisal:
• Sind Stressoren zu bewältigen, oder wird Situation weiterhin als bedrohlich beurteilt?
Bewältigungsstrategien (Coping-Strategien)
(A) instrumentell: Reduzierung der Bedrohung durch aktive Handlungen
(B) emotionsorientiert: Reduzierung der eigenen, stressbezogenen Gefühle
Stress entsteht, wenn Person Anforderungen aufgrund mangelnder
(a) Ressourcen (z.B. Zeitmangel) & (b) Bewältigungsstrategien nicht bewältigen kann
PASA-Skala
PASA-Skala zur Erfassung Stresserleben (Gaab, 2009)
Einsatzbereich: differenzierte Erfassung Ausmaß „subjektiv wahrgenommener Belastung“ (Gaab 2009) bezogen auf konkrete Situation
Basis: transaktionale Stresstheorie von Lazarus und Folkman (1984)
Aufbau:
Erstbewertung (primary appraisal)
Subskalen Bedrohung & Herausforderung
Zweitbewertung (secondary appraisal) = Wahrgenommene Bewältigungsmöglichkeiten
Selbstkonzept eigener Fähigkeiten & Kontrollüberzeugungen
Gesamtscore: Stressindex
Differenz zwischen Erst- und Zweitbewertung 16 Items mit 6-stufiger Antwortskala
Dauer: maximal 5 Minuten (eher 2-3 bei etwas Übung)
Akzeptable Reliabilität (Messgenauigkeit)
Definition Automatisierung (Parasuraman & Riley, 1997)
“We define automation as the execution by a machine agent (usually a computer) of a function that was previously carried out by a human.”(Parasuraman & Riley, 1997)
“What is considered automation will therefore change with time. When the reallocation of a function from human to machine is complete and permanent, then the function will tend to be seen simply as a machine operation, not as automation.” (Parasuraman & Riley, 1997)
Ein Beispiel, was früher als Automation und heute als Maschine gesehen wird -> Waschmaschine
Warum Automatisierung? – Messbare Vorteile von Automatisierung
Messbare Vorteile von Automatisierung
(1) Geringere Kosten
Z.B. Weniger Besatzung für Schiffe notwendig − 30-40 vor ca. 40 Jahren vs. 8-12 heute
(2) Größere Effizienz
Z.B. Reduzierung von Flugzeiten & Spritverbrauch durch direktere Routen
(3) Höhere Sicherheit
Mensch als Fehlerquelle ausschließen bzw. weniger Gelegenheiten für menschliche Fehler
Z.B. Systeme zur Unterstützung von medizinischen Entscheidungen
(4) Weniger Workload
Geringere körperliche Anstrengungen (Handlinggeräte)
Kognitive Ressourcen durch Abnahme von Berechnungen/Entscheidungen frei
Was wird automatisiert? (5 Klassen nach Wickens, 2013)
(1) Übernehmen von Aufgaben...
... die der Mensch nicht ausführen kann
Roboter in radioaktiven Umgebungen, komplexe Rechenoperationen, Tiefsee- Expeditionen, in der Weltraumfahrt, bei Kampfhandlungen
(2) Übernehmen von Aufgaben...
... bei denen der Mensch nur schlechte Leistungen erbringen kann
... bzw. Erbringen Leistung mit hoher Beanspruchung verbunden
Autopilot & Bodenannäherungs-Warnsystem, Diagnoseentscheidungen, z.B. Erkennen von tiefen Beinvehnenthrombosen
(3) Unterstützen des Menschen bei Aufgaben...
(a) Displays zur Darstellung von Informationen (die sonst memoriert werden müssten)
(b) prädiktive Displays (bei Vorhersage unterstützen)
(c) adaptive Displays (aktuell unnötige Informationen ausblenden)
(4) Übernehmen von Aufgaben...
...die durch Maschinen kostengünstiger zu bearbeiten sind
Z.B. telefonischer Support, Check-in am Flughafen
(5) Übernehmen von Aufgaben...
...für die nicht genügend (entsprechend ausgebildete) menschliche Bediener zur Verfügung stehen
Z.B. Steigerung Flugverkehr vs. Fluglotsen, Drohnen in der Logistik oder Bedienpersonal in der Gastronomie
Stufen der Automatisierung nach Sheridan & Verplank (1978)
Beispiele:
10: Flugzeug in manchen Bereichen
9: Staubsaugerroboter
8: Aktualisierung von bestimmten Applikationen
7: Notbremssystem im Auto
6: Google Maps bei der Bereitstellung einer alternativen Route
5: Aktualisierung bei Software
4: Handlungsempfehlung von einem System im Bereich ATC, bei dem der Fluglotse jedoch Handlung aktiv ausführen muss
3: Google maps schlägt Tankstellen in der Nähe vor, wenn Tank leer
2: Tempomat
1: Autofahren in einem alten Auto, welches noch nicht über einschlägige Unterstützungs-/Automatisierungssysteme verfügt
Die Klassifizierung von Automation nach Schritten der Informationsverarbeitung
Welche Schritte gibt es?
Beispiele zu jedem Schritt
(1) Informationsaufnahme
Unterstützen und/oder Ersetzen der menschlichen Informationsaufnahme z.B.:
Zurverfügungstellung von Informationen aus Umwelt, die Menschen sonst nicht zugänglich wären (z.B. Drohnen mit Kameras oder Entdecken von Strahlungswerten)
Organisation von Informationen (z.B. automatische Priorisierung von Flugzeugen für Fluglotsen)
Aufmerksamkeitslenkung (z.B. Hinweistöne)
(2) Informationsanalyse
Unterstützen/Ersetzen kognitiver Prozesse wie Speicherung im Arbeitsgedächtnis (Rehearsal), Schlussfolgern, usw., z.B.:
Displays, die zukünftige Systemzustände vorhersagen/anzeigen
Intelligente Alarme basierend auf der Integration von Informationen
(3) Entscheidungsselektion
Handlungsempfehlungen bzw. Vorgabe einer Handlungsauswahl an den Nutzer, z.B.:
Warnsysteme im Flugzeug, die dem Piloten bestimmte Manöver (z.B. „Steigen“) vorschlagen
Diagnosesysteme in der Medizin (z.B. Behandlungsempfehlung)
(4) Handlungsimplementation
Maschine führt Handlung aus, bzw. unterstützt Handlungsausführung, z.B.:
Autopilot
Spurhalteassistent (vs. Spurverlassenswarnung – Informationsanalyse)
Die Stufenklassifikation im Fahrzeugbereich – SAE J3016
Die 6 Übergangsarten bei Automation
-> welche 3 Grundfragen gibt es?
Nenne Beispiele von prototypischen Stufen- Übergängen
Wie lautet die Definition von Automationsvertrauen (nach Lee & See, 2004)?
Vertrauen ist Thema in unterschiedlichen Bereichen der Psychologie
Definitionsvielfalt
Z.B. zwischenmenschliches Vertrauen
z.B. Rotter (1967): “an expectancy held by an individual or a group that the word, promise, verbal or written statement of another individual or group can be relied upon”
Allen Definitionen gemein: Erwartung in Bezug auf Verhalten einer anderen Instanz (bzw. Verhaltensoutcomes)
Integration in Bezug auf Automationsvertrauen (Lee & See, 2004):
“[trust is] the attitude that an agent will help achieve an individual’s goals in a situation characterized by uncertainty and vulnerability”
Einschätzung: andere Instanz (Agent, Automatisierung) unterstützt Erreichung individueller Ziele der Person
Situation ist relevant (Schadenpotenzial) & es herrscht Unsicherheit
Einflussfaktoren auf Automationsvertrauen in 3 Gruppen nach Hoff & Bashir (2015)
Literaturüberblick von Hoff & Bashir (2015)
(1) Dispositionelles Vertrauen
Kultur, Alter, Geschlecht (aber keine besonders klaren Befunde)
Persönlichkeitseigenschaften
(2) Situationales Vertrauen
Externale Variablen (umweltbezogen), z.B. Aufgabenschwierigkeit/-komplexität, Workload
Internale Variablen (personenbezogen), z.b. Selbstvertrauen, Stimmung, Aufmerksamkeitskapazität
(3) Erlerntes Vertrauen
Systemperformanz, z.B. Verlässlichkeit, Vorhersagbarkeit, Fehlerart & -zeitpunkt
Designaspekte, z.B. Erscheinungsbild, Kommunikationsstil der Automatisierung, Transparenz/Feedback, Einfachheit der Nutzung
Und für initiales Vertrauen – Vorwissen:
Der gute Ruf einer Marke / eines Systems, Erfahrung mit ähnlichen Systemen, Verstehen des Systems
Vertrauen in Automation - Faktoren: Zuverlässigkeit vs. Kalibrierung
Zentrale Effekte im Kontext…
Over-Trust (2 Effekte) und
Under-Trust (1 Effekt)
Zentrale Effekte im Kontext Over-Trust
(1) Complacency – Nachlässigkeit
Auswirkung:
Aufgrund hoher Reliabilität unzureichende Überwachung des Systems
Bewertung:
Kurzfristig bzw. die meiste Zeit ressourcenschonend
Bei Automatisierungsfehlern allerdings problematisch
Einflussfaktoren:
(1) Zuverlässigkeit:
Je zuverlässiger die Automatisierung (unterhalb von 100%), desto höher das Vertrauen, und desto größer die Gefahr von Complacency
(2) Beanspruchung (Workload):
Complacency häufig in Situationen, in denen mehrere Aufgaben parallel bearbeitet werden müssen (Multitasking), und eine der Aufgaben durch Automatisierung unterstützt oder ganz übernommen wird = Reduktion von Beanspruchung
Teilweise rational (wenn nahezu perfekt, warum überwachen?)
(2) Kompetenzverlust & „out of the loop unfamiliarity“
(zu) häufige Nutzung automatischer Funktionen führt zu Verlust zuvor erworbener Kompetenzen (besonders bzgl. manuelle Kontrolle)
Z.B. Autopiloten, Parkassistenten
Out of the loop Effekt:
Nutzer nicht mehr mit allen ablaufenden Prozessen vertraut
Bzw. hat unzureichende Kenntnis über aktuelle Prozesse
Mit Folgen für die Detektion von Fehlern und die darauffolgende Reaktion
Design-Implikation:
− Suche nach optimalem Level Automatisierung – „out of the loop“ möglichst gering und gleichzeitig Workload möglichst reduzieren
Zentrale Effekte im Kontext Under-Trust
(1) First Failure Effekt
Erleben von Fehlern (speziell „first failure“) führt häufig zu sehr starker Abnahme im Vertrauen & zur Nicht-Nutzung von Automatisierung
Z.B. falscher Alarm – automatisierte Hinweissysteme die fälschlich Warnung ausgeben
Vertrauen geht zurück
Warnung wird von Nutzer ganz ignoriert/abgestellt
Problem: Automatisierung häufig trotz Fehlern effektiver bzw. effizienter als dauerhafte manuelle Ausführung
Zahlreiche Beispiele für Unfälle weil Warnungen ignoriert/abgestellt
Die Unterscheidung von Trust vs. Dependence
Unterscheidung von (a) Vertrauen in (Trust) und (b) Verlassen auf (Dependence) Automatisierung (Wickens, 2013)
(1) Trust (Vertrauen) ist kognitiv/affektiver Zustand der über Ratings messbar ist
(2) Dependence (Verlassen) meint das Interaktionsverhalten (z.B. Automatisierung anschalten, Anweisung befolgen, geringe Überprüfung Automatisierung)
I.d.R. korreliert, aber nicht vollständig, z.B.:
(A) Verlassen auf Automatisierung bei hoher genereller Beanspruchung trotz geringem / nicht maximalem Vertrauen
(B) Manuelle Ausführung einer Handlung trotz hohem Vertrauen in die entsprechende automatische Funktion (z.B. „möchte es selbst machen“, „bin neugierig“ )
„Trust in Automation“-Skala von Jian et al.
Negative Folgen von Automatisierung & der Grundgedanke „Ironies of Automation“
Gestaltungsempfehlungen für automatisierte Systeme
Automatisierungs-Feedback
Kritische Informationen über den aktuellen Status/ Statusveränderungen der Automatisierung liefern ;
Angemessene Automatisierung
Trade-Off zwischen Verbesserung von Routinetätigkeiten und hohem Situationsbewusstsein/ gutem Fehlermanagement auf der anderen Seite
Kalibrierung des Nutzervertrauens
Vermeidung von (ungerechtfertigtem) Misstrauen durch Vereinfachung und Training
Vermeidung von (ungerechtfertigtem) übermäßigem Vertrauen durch Informationen über Zuverlässigkeit und Erfahrung von Fehlern während des Trainings (Vermeidung des first failure effects)
2 Phasen im Entscheidungsprozess
Phase 1 (front-end) – Situationserfassung & -bewertung
Selektive Aufmerksamkeit (welche Reize werden verarbeitet?) und Diagnose (Hypothesen über zukünftigen Zustand entwerfen, dies oft iterativ und abduktiv)
Phase 2 (back-end) – Entscheidung treffen
Handlungswahl (Einschätzung von Wahrscheinlichkeit & Wert versch. Ergebnisse – auch: welches Risiko geht man ein?)
Fehlentscheidung durch Fehler in
A) Ph1 (ungenaue SitErfassg.) vs.
B) Ph2 (z.B. zu risikoreiche Handlungswahl trotz akkurater SitErfassg.)
1 Beispiel-Problem von Phase 1 (Confirmation Bias)
Problem bei Situationsbewertung (Ph1) – Confirmation Bias
Meint die aktive Suche nach Informationen, die die Hypothese bestätigen und Vernachlässigung von Informationen, die der Hypothese widersprechen.
Mögliche Ursachen:
Verringerung der kognitiven Beanspruchung – Veränderung der Hypothesen ist komplex(er)
Menschen können besser mit positiver (bestätigender) Information als mit negativer Information umgehen
... & besser mit Anwesenheit anstatt Abwesenheit eines Hinweisreizes (Ausbleiben von bestätigender Information wird weniger wahrgenommen als Auftreten bestätigender Information)
Neue Hypothese formulieren (oder sogar mehrere parallel verfolgen) = kognitiv aufwendig (eher bei aktueller Hyp. bleiben solange Evidenz einigermaßen zu aktueller Hyp. passt)
• „Desire to believe“ – Wunsch nach Konsistenz (motivationaler Faktor)
Struktur von Tracking-Aufgaben (3 Elemente, Ziel, 2 Fehlerquellen)
Diversität von Tracking-Aufgaben:
̶ Bei manchen Aufgaben eher periodisch (seltene) Entscheidungen
̶ Bei anderen Aufgaben quasi kontinuierliche Kontrollentscheidungen
◼Struktur von Tracking-Aufgaben:
(1) Kontroll-Gerät (z.B. Maus, Lenkrad,...) wird bewegt
(2) Systemoutput (z.B. Cursor) wird dadurch räumlich bewegt (über die Zeit)
(3) Zielbereich wird damit angesteuert (z.B. Auto mittig in Spur, Button)
Fazit: Ziel ist, Diskrepanz zwischen Systemoutput & Zielbereich zu reduzieren
◼ Zwei Fehlerquellen führen zu Störungen im System (Notwendigkeit Anpassung)
(a) Ziel bewegt/verändert sich (z.B. Kurvenfahrt)
(b) Störung bewegt Systemoutput weg von Zieltrajektorie (z.B. Wind)
◼ Diversität der Systemdynamik: Beziehung zwischen Bewegung Kontroll-Gerät & Systemoutput kann sehr unterschiedlich sein
Fitts‘ Law
3 Faktoren bzgl. Trackingkomplexität (inkl. 2 Unterfaktoren bei Systemlatenz)
Kontrolle 0. Ordnung -> Veränderung in Maus führt zur Veränderung im Cursor
Kontrolle 1. Ordnung -> Beziehung zwischen Lenkrad- Drehung und Fahrzeug- Heading
Kontrolle 2. Ordnung -> Beziehung zwischen Lenkrad- Drehung und Fahrzeug- Position
Einflussfaktoren auf Wahl-RT (Kompatibilität von Reiz und Reaktion)
Kompatibilität von Reiz und Reaktion
a) Räumliche Kompatibilität: Kolokation (räuml. Nähe) und Kongruenz (ähnl. Anordnung) beschleunigt Reaktion
b) Bewegungskompatibilität: Kongruenz zw. Bewegungsrichtung und im Display gezeigter Bewegung (mehr = hoch zum Beispiel)
hier spielen Populationsstereotype (z.B. rechts = mehr) und Dimensionskongruenz (z.B. Joystick statt Lenkrad im Auto) eine Rolle
c) Affordances (eine Türklinke regt zum drücken an) und Constrains (eine Tür ohne Türklinke regt nicht zum ziehen an)
Mistakes, Slips, Lapses, Mode Errors im Detail
Mistakes Regelbasiert: Wiedererkennen von Mustern in einer Situation, daher hohes Entscheidungsvertrauen. Fehler entweder durch
Anwendung einer “guten” Regel in falscher Situation
Anwendung einer “falschen” Regel
Nichtanwendung einer “guten” Regel
Mistakes Wissensbasiert: Passieren in neuen und unbekannten Situationen aufgrund von fehlenden Informationen und Wissen oder Biases.
Slips: Fehler bei der Ausführung der Korrekten Handlungsintention
Lapses: Korrekte Handlung wird nicht ausgeführt (Vergessen)
Mode Errors: Ausführung der korrekten Handlung im falschen Systemmodus (z.B. Rückwärtsgang drin und auf Gaspedal)
Zuletzt geändertvor 9 Monaten