Buffl

Sitzung 4 - Eye Tracking (Datenerhebungsmethoden)

HM
by Hanna M.

Grundlagen Eye Tracking

  • Blickbewegungsmessung(Eye-Tracking) = Messung der Blickbewegungen einer Person (oder eines Tieres) als Indikator für den Aufmerksamkeitsfokus

Messprinzip der meisten aktuellen Eye-Tracker(aber es gibt verschiedene Varianten):

  • Zwei kleine Kameras registrieren die Pupillenposition von einem oder beiden Augen sowie optional auch die Hornhaut-Reflexion zweier Infrarot-Lichtstrahlen für eine noch höhere räumliche Genauigkeit der Messung

  • Veränderungen der Pupillenposition relativ zur Betrachtungsvorlage (meist Monitor), die auf Kopfbewegungen zurückzuführen sind, werden aus dem Signal herausgerechnet

  • Bei manchen Geräten wird über eine weitere Kamera die Kopfposition erfasst, einige Geräte kompensieren Kopfbewegungen hingegen durch bewegliche Pupillen-Kameras oder entsprechende Signalverarbeitungssoftware

  • Damit das Aufnahmegerät „weiß“, in welchem räumlichen Verhältnis die Pupillen zur Beobachtungsvorlage (z. B. Bildschirm) stehen, muss vor der Aufnahme eine Kalibrierung mit anschließender Validierung durchgeführt werden

  • Geräte, die am Kopf angebracht sind, kompensieren zudem leichtes Verrutschen der Apparatur

  • Die aktuellen Eye-Tracker zeichnen mit hoher räumlicher und zeitlicher Genauigkeit (Aufnahmefrequenz bis zu 1000hz) die Blickposition auf (x-und y-Koordinate der Fixation auf der Beobachtungsvorlage) sowie viele weitere Parameter, u. a. Start-und Endzeitpunkt der Fixation (= kurzzeitiges Verweilen des Auges in einer Position), aktueller Durchgang, aufgenommenes Auge, Sakkaden(= Bewegung des Auges zwischen den Fixationen) etc.


Visuelle Aufmerksamkeit

  • meint die Beachtung von visuellen relevanten Reizen und das Ignorieren von irrelevanten visuellen Reizen

  • visuelle Aufmerksamkeit bündelt die begrenzten kognitiven Ressourcen und ist zu einem beliebigen Zeitpunkt auf einen relativ kleinen Ausschnitt der Umgebung beschränkt

  • Um also die Umwelt in seiner Komplexität und spezifische Objekte darin visuell angemessen verarbeiten zu können, sind permanente Aufmerksamkeitsverlagerungen notwendig.

  • Dabei ist ausschließlich die offene Aufmerksamkeit (overtattention) beobachtbar (Posner, 1980), welche an Blickbewegungen gekoppelt ist und durch Eye-Tracking-Technologie gemessen werden kann.

  • Die Blickrichtung kann dabei einen wichtigen Indikator für den aktuellen kognitiven Aufmerksamkeitsfokus darstellen (Auge-Geist-Hypothese; Just & Carpenter, 1976), wobei einschränkende empirische Befunde dazu berichtet wurden (z. B. Anderson et al., 2004).


AVs aus Blickbewegungen

AVs, die sich aus Blickbewegubgsdaren generieren lassen:

  • Länge einer Sakkade

  • Dauer der Fixation

  • Dauer der Fixation & Bildgröße

  • ROI & dwell time

  • basale Bildeigenschaften

  • Die Abbildung links zeigt die Häufigkeit, mit der Sakkaden einer bestimmten Länge (angegeben in Grad visuellem Winkels von 1 bis 20) vorkommen.

  • „Time-Window1“ meint die ersten 6 Sekunden nach Stimulus-Onset, „Time-Window2“ das folgende 6-Sekunden-Zeitfenster.

  • Man sieht, dass man anfangs mehr längere Sakkaden macht, um den Stimulus möglicherweise großflächig abzuscannen (p< .001).

  • Das „möglicherweise“ ist hier wichtig, denn man kann sich auch vorstellen, dass eine Person, die eine Internetseite (wie im obigen Beispiel) betrachtet, zwar viele lange Sakkaden macht, dabei jedoch immer nur zwischen zwei Punkten auf der Internetseite hin-und herspringt.

  • Hat die Person dann wirklich viel von der Seite gesehen, d.h. diese räumlich extensiv exploriert? -> Nein, wenn wir berücksichtigen, dass nur ein kleiner Teil des Sehfeldes scharf wahrgenommen wird (siehe Folie zuvor)

  • Insofern braucht man ein zusätzliches Maß, welches angibt, wie stark die Fixationen über die Internetseite streuen, d. h. wie gleichmäßig die Fixationen verstreut sind oder aber wie stark diese in einem Areal ein Cluster bilden.

  • Ein schönes Maß dafür ist die Entropie (da sie keine Annahmen über die Struktur des Stimulus macht)

  • Man sieht oben rechts am Histogramm aber, dass die häufigeren langen Sakkaden im Zeitfenster 1 tatsächlich dafür genutzt wurden, auch mehr von der Seite zu explorieren, da die Entropie im Zeitfenster 1 signifikant größer ausfiel als im Zeitfenster 2.


Probleme

Eye Tracking Systeme bieten heute hohe Aufnahmegenauigkeit, aber dennoch gibt es Probleme, die es bei der Datenauswertung-und Interpretation zu lösen gilt:


1) Wie lang muss eine Fixationsdauer mindestens sein, um eine valide Fixation zu repräsentieren? (oft werden 40-50ms als Minimalwert festgelegt)

  • Auge steht nie ganz still, daher muss man für eine Fixation genau definieren, ab wann das Auge relativ gesehen still steht

  • dies wird definiert über die Geschwindigkeit, mit der das Auge beschleunigt: Wenn ein bestimmter Schwellenwert überschritten wird und eine bestimmte Bewegungsgeschwindigkeit anhält, ist es eine Sakkade

  • Ein kurzes Unterschreiten dieses Schwellenwertes würde die Krieterien für eine Fixation somit erfüllen, aber fragwürdig, ob bei einer Fixationsdauer von 2ms von einer Fixation zu reden ist -> kann in diesem Zeitfenster den fixierten Bildbereich nicht vertieft verarbeiten

  • Daher werden 40-50ms als Minimalwert festgelegt


2) Was bedeutet eine lange oder kurze Fixationsdauer? Langeweile? Erhöhte Explorationsmotivation? -> weitere Blickbewegungsparameter notwendig

  • Wird versucht zu erklären anhand der Studie mit der steigenden Fixationsdauer über fünf Präsentationen derselben Bilder

  • Konnte schlussfolgern, dass die zunehmende Dauer der Fixationen bedeutet, dass die Probanden in späteren Präsentationsdurchgängen die Bildausschnitte intensiver (länger) betrachteten, um interessante Details auf den Bildern zu explorieren

  • ABER: lange Fixationen müssen nicht zwingend die Explorationsmotivation reflektieren. Manchmal machen probanden im Labor sehr lange Fixationen (teilweise einige Sekunden) -> waren i.d.R. müde und haben vor sich hingestarrt

  • In solchen Fällen sind die Fixationen also eher als Artefakte zu klassifizieren und sollten ggf. nicht in die Analysen aufgenommen werden, da sie die Mittelwerte über alle Fixationen beträchtlich verzerren könnten.

  • Um diese Fälle präventiv zu vermeiden, sollten daher Pausen eingelegt werden, wenn ein Experiment sehr lange (ab ca. 20min) andauert.


3) Der Eye-Tracker gibt einen ganz bestimmten Pixel (z. B. mit den Koordinaten 349x769) als Fixationsort an, doch wie groß ist das Areal um diesen Pixel herum, welches tatsächlich im Fokus der Aufmerksamkeit steht?


  • Menschen sehen nur einen relativ kleinen Bereich des Sehfeldes scharf, daher sind permanente Augenbewegungen notwendig

  • Gleichzeitig ist es aber natürlich auch so, dass wir mehr als nur einen einzigen Pixel scharf sehen können, wenn wir eine bestimmte Bildposition fixieren.

  • Das ist nicht trivial, denn der Eye-Tracker gibt uns nur die Koordinaten eines Pixels aus.

  • Wir müssen also über Modelle und auf Basis unseres Wissens über die Physiologie des Auges und Sehsystems abschätzen, wie groß der Bereich des scharfen Sehens um diesen Pixel herum ist.








Probleme

Ist die fixierte Stelle die einzige, auf die in diesem Moment die Aufmerksamkeit gerichtet war?

  • Befunde aus der EEG-Forschung legen nahe, dass dies nicht zwingend sein muss, d. h. es können durchaus mehrere (sogar räumlich getrennte) Bildbereiche gleichzeitig mit Aufmerksamkeit bedacht werden (Müller et al., 2003)

Ist die fixierte Stelle überhaupt jene, die im Aufmerksamkeitsfokus ist?

  • Der Eye-Tracker erlaubt nur das Erfassen der „offenen“ Aufmerksamkeit (overtattention), nicht jedoch der „verdeckten“ Aufmerksamkeit (covert attention)

  • Covert Attention: Ein Beispiel wäre eine Lehrkraft, die eine*n bestimmte Schüler*in mit ihren Augen fixiert, gleichzeitig aber „im Augenwinkel“ sehr aufmerksam verfolgt, was ein*e andere*r Schüler*in macht, der*die zuvor schon einmal den Unterricht gestört hat.

  • Zwar sind die Augen und damit die over tattention nicht auf diese*n Schüler*in gerichtet, doch er*sie wird dennoch mit Aufmerksamkeit bedacht.

  • Diese können wir aber mit der Methode des Eye-Trackings nicht erfassen.

Wie analysiert man z. B., ob die primären Bildeigenschaften (z. B. Farbkontraste der Betrachtungsvorlage oder sich bewegende Stimuli) das Blickverhalten beeinflusst haben (sog. Bottom-Up-Einfluss) oder ob es eher höhere kognitive Funktionen waren (z. B. das Gedächtnis, die Motivation oder Emotion; sog. Top-Down-Einfluss)?


  • Nicht nur statische Kontraste von Bildeigenschaften können mit dem Blickverhalten korrelieren.

    • Insbesondere plötzlich auftauchende Stimuli ziehen die visuelle Aufmerksamkeit auf sich, aber auch sich bewegende Stimuli.

  • In der angegebenen Studie von Hamborget al. (2012) zeigte sich beispielsweise, dass ein permanent animiertes Werbebanner deutlich mehr Fixationen auf sich zog als ein vom Layout her identisches, aber nicht animiertes Banner.


Bottom Up und Top Down Einflüsse



  • Blickverhalten wird immer bestimmt durch botton-up wirkende Einflüsse (Merkmale der Stimuli) und top-down wirkende Einflüsse (Interesse, Motivation, Emotion, Aufgabenstellung etc.).

  • Wäre es so, dass wir alle unsere Blicke konsistent über die Zeit nur an den Eigenschaften der Stimuli ausrichten würden (= ausschließlich bottom-upwirkende Einflüsse), dann sollten wir wohl kaum die oben abgebildeten Veränderungen bei einer Person über die Zeit (und die hier nicht dargestellten großen Unterschiede zwischen den Betrachter*innen) beobachten können.

  • Diese erklären sich also über top-down wirkende Einflüsse (z. B. individuelle Explorationsmotivation bzw. Interesse an den Bildern).

Wir sehen oben zwei Dinge:

  • Einerseits schaute sich die ausgewählte Person die Bilder bei jeder neuen Darbietung anders an, andererseits erkennen wir auch, dass die räumliche Ausbreitung der Fixationen während der ersten Darbietung (Stimulus ist neu) deutlich extensiver war als zur fünften Darbietung (Stimulus war mittlerweile sehr bekannt).

  • Über alle 45 Proband*innen der Studie sieht man ganz rechts auch diesen Effekt auf den sogenannten Fixation DensityMaps.

  • Die in den Bildern angegebenen Werte sind übrigens die Entropie-Werte, die die räumliche Ausbreitung der Fixationen quantifizieren (zwei Berechnungsarten, daher zwei Werte).

  • Auch an diesen sehen wir, dass mit zunehmender Bekanntheit der Stimuli das Ausmaß an räumlicher Exploration abnimmt (die deskriptiven Unterschiede sind dabei klein, aber diese stellen relativ große Unterschiede dar –die Werte variieren nicht zwischen 0 und z. B. 20, das erklärt sich über die mathematische Berechnungsmethode).


Author

Hanna M.

Information

Last changed