Was versteht man unter klassischer Konditionierung?
Eine Lernform, bei der ein neutraler Reiz (CS) durch Kopplung mit einem bedeutsamen Reiz (US) eine konditionierte Reaktion (CR) auslöst.
Was ist der Unterschied zwischen US, UR, CS und CR?
US (unbedingter Reiz): z.B. Futter
UR (unbedingte Reaktion): z.B. Speichelfluss auf Futter
CS (konditionierter Reiz): z.B. Ton
CR (konditionierte Reaktion): z.B. Speichelfluss auf Ton
Welches klassische Experiment demonstriert klassische Konditionierung?
Pawlows Hunde: Ton (CS) → Futter (US) → Speichelfluss (UR/CR)
Was ist „Konditionierung höherer Ordnung“?
Wenn ein neutraler Reiz (CS2) mit einem bereits konditionierten Reiz (CS1) gepaart wird und dadurch selbst eine CR auslöst, ohne je mit dem US gepaart worden zu sein.
Kann ein Reiz (CS2) eine Reaktion (CR) auslösen, obwohl er nie mit dem US gepaart wurde?
Ja – wenn er mit einem bereits konditionierten Reiz (CS1) gepaart wurde. Das nennt man Konditionierung höherer Ordnung.
Was besagt die S-R-Hypothese bei klassischer Konditionierung?
Der konditionierte Reiz (CS) wird direkt mit einer Reaktion (CR) verknüpft – ohne mentale Repräsentation des US.
Was besagt die S-S-Hypothese?
Der CS wird mit der mentalen Repräsentation des US assoziiert, was zur CR führt – also über eine kognitive Erwartung.
Welches Experiment belegt die S-S-Hypothese?
Die US-Entwertung: Wenn ein Tier nach Sättigung auf den CS nicht mehr reagiert → bedeutet, dass CS auf US-Repräsentation zugreift, nicht direkt auf CR.
Was zeigt das sensorische Vorkonditionieren?
Dass Reiz-Reiz-Verknüpfungen auch ohne direkten Kontakt zum US eine spätere CR auslösen können → spricht für S-S-Hypothese.
Wozu dient das Rescorla-Wagner-Modell?
Zur Erklärung des assoziativen Lernens bei klassischer Konditionierung anhand formaler Gleichungen.
Wie lautet die Lernformel im Rescorla-Wagner-Modell?
Wovon hängt die Höhe des Lernzuwachses (\Delta V) ab?
Vom Unterschied zwischen maximal möglicher und aktueller Assoziationsstärke → je überraschender der US, desto mehr wird gelernt.
Was beschreibt der Parameter c im Rescorla-Wagner-Modell?
Die Lernrate, abhängig von der Salienz (Auffälligkeit) des CS und des US – formal: c = \alpha \cdot \beta
Warum flacht die Lernkurve im Rescorla-Wagner-Modell mit der Zeit ab?
Weil der Unterschied V_{max} - V kleiner wird → weniger Überraschung → geringerer Lernzuwachs.
Warum ist das Modell eine große Errungenschaft?
Es quantifiziert Lernen und macht Vorhersagen über Stärke, Richtung und Verlauf der Assoziationen über Zeit.
Was ist latente Inhibition?
Die verzögerte Konditionierung eines CS, der zuvor mehrfach ohne US präsentiert wurde.
Warum stellt latente Inhibition ein Problem für das Rescorla-Wagner-Modell dar?
Weil das Modell für CS-Darbietungen ohne US eine Veränderung von V ausschließt (da \Delta V = 0) – obwohl es später einen Einfluss auf die Lernrate gibt.
Wie kann man latente Inhibition dennoch erklären?
Durch eine verringerte Salienz des CS nach Vor-Exposition → Lernrate c = \alpha ‘ \beta wird kleiner.
Was passiert mit der Lernrate c bei latenter Inhibition?
Sie wird niedriger, weil der CS weniger auffällig ist → geringerer Lerneffekt.
Warum berücksichtigt das Rescorla-Wagner-Modell keine latente Inhibition?
Weil es keine dynamische Veränderung der Salienz (Aufmerksamkeit) im Zeitverlauf modelliert – es nimmt \alpha als konstant an.
Was zeigte das Experiment von De Houwer et al. (2001)? (konditionierung bei Menschen)
Dass Pokémon-Figuren, die mit positiven Wörtern gepaart wurden, später positiver bewertet wurden – auch ohne bewusste Erinnerung an die Wörter.
Was ist evaluatives Konditionieren?
Eine Form der klassischen Konditionierung, bei der Einstellungen gegenüber Reizen durch Paarung mit positivem oder negativem Material verändert werden.
Welche Sinnesmodalitäten können evaluatives Konditionieren auslösen?
Visuell (Bilder), auditiv (Töne), geschmacklich (Geschmack), sozial usw.
Was ist das Picture-Picture-Paradigm?
Ein Experiment, bei dem neutrale Bilder mit positiv oder negativ bewerteten Bildern gepaart werden → Bewertung der neutralen Bilder ändert sich entsprechend.
Warum ist evaluatives Konditionieren für Werbung interessant?
Weil es zeigt, dass Einstellungen zu Marken oder Produkten durch wiederholte Reizkopplung verändert werden können – ohne bewusste Verarbeitung.
Was ist Reizgeneralisierung?
Ein gelernter Reiz löst auch bei ähnlichen Reizen eine (abgeschwächte) Reaktion aus.
Was ist Reizdiskrimination?
Die Fähigkeit, zwischen dem konditionierten Reiz und ähnlichen Reizen zu unterscheiden → nur der CS löst Reaktion aus.
Wie sieht ein Generalisierungsgradient aus?
Reaktionsstärke ist am höchsten beim trainierten Reiz (CS) und nimmt mit zunehmender Reizunähnlichkeit ab.
Was zeigt Reizgeneralisierung über das Lernen?
Dass Lernen nicht punktuell, sondern über ein Reizfeld hinweg erfolgt → flexible, aber unscharfe Reaktion.
Reizgeneralisierung zeigt:
Lernen ist flexibel: Reaktion erfolgt auf ähnliche Reize.
Lernen ist unscharf: Reaktion nimmt mit Unterschied zum ursprünglichen Reiz ab.
Das ist biologisch sinnvoll: z. B. Fluchtreaktion bei ähnlichen Schlangenfarben, auch wenn es nicht exakt dieselbe ist.
Wie können Phobien durch klassische Konditionierung entstehen?
Wenn ein neutraler Reiz (z. B. Spinne) mit einem traumatischen Ereignis (US) gekoppelt wird, kann er später allein eine Angstreaktion (CR) auslösen.
Welche Rolle spielt Reizgeneralisierung bei Phobien?
Phobische Reaktionen übertragen sich oft auf ähnliche Reize (z. B. Angst nicht nur vor Spinnen, sondern auch Käfern).
Können Phobien auch ohne direkte Erfahrung entstehen?
Ja, durch Beobachtung oder Erzählungen → vikariantes Lernen.
Eine Form der klassischen Konditionierung, bei der sich die emotionale Bewertung eines Reizes durch Kopplung mit positiven oder negativen Stimuli verändert.
Wie funktioniert evaluatives Konditionieren in der Werbung?
Produkte werden mit positiven Reizen (Strand, Musik, Glück) gepaart → positive Einstellung überträgt sich implizit auf das Produkt.
Warum ist evaluatives Konditionieren besonders effektiv?
Weil es auch ohne bewusste Aufmerksamkeit oder Erinnerung wirkt → unterschwellige Einstellungsänderung.
Wie unterscheidet sich evaluatives Konditionieren von operanter Verstärkung?
Es basiert auf Reiz-Reiz-Kopplung (klassisch), nicht auf Konsequenzen des Verhaltens (operant).
Was besagt das „Law of Effect“?
Verhaltensweisen, die zu angenehmen Konsequenzen führen, werden wahrscheinlicher; solche mit unangenehmen Konsequenzen werden unwahrscheinlicher.
Worin unterscheidet sich instrumentelle von klassischer Konditionierung?
Klassische: Lernen über Reiz-Reiz-Verknüpfung (CS–US).
Instrumentelle: Lernen über Verhalten–Konsequenz-Verknüpfung (R–Konsequenz).
Wer formulierte das Law of Effect?
Edward Thorndike.
Was ist mit „instrumentell“ gemeint?
Dass das Verhalten als „Werkzeug“ dient, um eine gewünschte Konsequenz zu erreichen.
Was zeigte Thorndikes Puzzle-Box-Experiment?
Katzen lernten, gezielt einen Hebel zu betätigen, um an Futter zu gelangen – Beleg für das Law of Effect.
Welche Lernstrategie zeigten Thorndikes Katzen?
Trial-and-Error: zufälliges Verhalten → erfolgreiche Handlung wird beibehalten.
Was war Thorndikes wichtigste Schlussfolgerung aus der Puzzle-Box?
Verhalten wird durch seine Konsequenzen geformt, nicht durch Einsicht.
Was untersuchte Skinner im Unterschied zu Thorndike?
Nicht nur zielgerichtetes Verhalten, sondern auch spontanes Verhalten und dessen Modifikation durch Verstärkung oder Bestrafung.
Was ist eine Skinner-Box?
Ein Versuchsapparat, in dem Tiere durch Betätigen eines Hebels oder Drücken einer Taste eine Konsequenz (z. B. Futter) erhalten.
Was bedeutet Reaktion-Effekt-Kontiguität?
Der Lerneffekt ist umso größer, je zeitnäher die Konsequenz auf die Reaktion folgt.
Was ist der Unterschied zwischen instrumenteller und operanter Konditionierung?
Instrumentell: zielgerichtetes Verhalten wird gelernt.
Ein Tier versucht Zielgerichtet eine Box zu öffnen um zb an futter zu kommen
Operant: auch zufälliges/spontanes Verhalten wird durch Konsequenzen geformt.
Ratte drückt ausversehen den Hebel und es kommt Futter
Die Ratte wird öfters den Hebeldrücken, obwohl es ursprünglich Zufall war
Was sind die Phasen operanter Konditionierung?
Bestimmung der Basisrate
Ermittlung wie oft ein Verhalten von alleine auftritt, um spätere Veränderungen durch Lernprozesse messen zu können.
Akquisitionsphase
Verhalten wird durch Verstärkung aufgebaut tritt immer häufiger auf.
Extinktionsphase
Verhalten wird nicht mehr verstärkt und tritt daher seltener auf
Spontanerholung
Wiederauftreten eines zuvor gelöschten Verhaltens nach einer Pause - meist schwächer als vor der Löschung.
Wie unterscheiden sich Extinktion und Vergessen?
Extinktion ist aktives Umlernen durch fehlende Konsequenz; Vergessen ist passives Nachlassen der Gedächtnisspur über Zeit.
Was ist positive Verstärkung?
Verhalten ↑ durch Hinzufügen eines angenehmen Reizes (z. B. Lob, Futter).
Was ist negative Verstärkung?
Verhalten ↑ durch Entfernen eines aversiven Reizes (z. B. Schmerz hört auf).
Was ist positive Bestrafung?
Verhalten ↓ durch Hinzufügen eines unangenehmen Reizes (z. B. Stromschlag).
Was ist negative Bestrafung?
Verhalten ↓ durch Entfernen eines angenehmen Reizes (z. B. Spielzeug wegnehmen).
Was ist ein primärer Verstärker?
Ein Reiz, der ohne vorheriges Lernen verstärkend wirkt (z. B. Nahrung, Wärme).
Was ist ein sekundärer Verstärker?
Ein ursprünglich neutraler Reiz, der durch Assoziation mit primären Verstärkern verstärkend wirkt (z. B. Geld, Lob).
Warum können sekundäre Verstärker ihre Wirkung verlieren?
Wenn sie nicht mehr mit primären Verstärkern gekoppelt werden.
Was zeigte der Crespi-Effekt?
Die Laufgeschwindigkeit von Ratten hängt von Veränderung der Verstärkungsmenge ab: Starke Reduktion → langsamer; Erhöhung → schneller.
Was ist der negative Verhaltenkontrast beim Crespi Experiment?
Eine Verringerung der Verstärkungsmenge führt zu einer geringeren Reaktionsrate als bei Tieren, die von Anfang an die kleinere Menge bekommen haben.
Was ist latentes Lernen?
Lernen, das ohne Verstärkung stattfindet und erst bei passenden Motivationsbedingungen im Verhalten sichtbar wird.
Wer führte das berühmte Experiment zum latenten Lernen durch?
Tolman & Honzik (1930).
Was ist der Unterschied zwischen Kompetenz und Performanz?
Kompetenz = erworbenes Wissen/Fähigkeiten; Performanz = tatsächlich gezeigtes Verhalten.
Warum ist latentes Lernen ein Problem für den strengen Behaviorismus?
Weil es zeigt, dass Lernen nicht immer direkt an sichtbares Verhalten und Verstärkung gebunden ist.
Was zeigte die plötzliche Leistungssteigerung in Gruppe 3 (Erst nach 11 Versuchen wurden die Ratten belohnt) des Tolman-Experiments?
Dass die Ratten das Labyrinth schon vorher gelernt hatten, aber das Wissen erst mit Verstärkung sichtbar wurde.
Was kann man tun, um bei langer Verzögerung den Lerneffekt zu verbessern?
Die kritische Reaktion direkt hervorheben (z. B. kurzer Ton als sekundärer Verstärker).
Was Besagt das Reaktion-Verstärkungs-Intervall?
Lange Verzögerung zwischen Reaktion und Verstärkung beim Lernen.
Lerneffekt wird schwächer, weil andere Verhaltensweisen dazwischen auftreten und den Zusammenhang verwässern.
Warum wird eine spätere Belohnung oft als weniger attraktiv empfunden? (Reaktion-Verstärungs- Intervall)
Weil Motivation abnimmt, wenn der Verstärker zeitlich weiter entfernt liegt.
Welche Experimente belegen, dass sofortige Belohnung oft bevorzugt wird
Taubenstudien (Rachlin & Green, 1972) und Geldwahl-Experimente mit Studenten (Kirby & Herrnstein, 1995).
Warum ist dieser Effekt (Reaktion-Verstärkungs-Intervall) in der operanten Konditionierung relevant?
Weil zeitnahe Konsequenzen den Lernprozess deutlich beschleunigen.
Was ist der Unterschied zwischen Quoten- und Intervallplänen?
Quotenpläne verstärken nach Anzahl der Reaktionen, Intervallpläne nach verstrichener Zeit.
Was ist ein fester Quotenplan (FQ)?
Verstärkung nach einer festen Anzahl von Reaktionen.
Was ist ein variabler Quotenplan (VQ)?
Verstärkung nach einer variierenden Anzahl von Reaktionen – im Durchschnitt konstant.
Welcher Verstärkungsplan führt zu höchster Löschungsresistenz?
Variable Quotenpläne (VQ).
Was ist der „Scalloping“-Effekt und bei welchem Plan tritt er auf?
Anstieg der Reaktionsrate kurz vor Ende des Intervalls, typisch bei festen Intervallplänen (FI).
Warum führen variable Pläne zu gleichmäßigem Verhalten?
Weil die Verstärkung unvorhersehbar ist, was konstante Reaktionsbereitschaft fördert.
Welche Lernverläufe gibt es bei intermittierenden Verstärkungspläne?
Was ist Humphrey’s Paradox?
Seltener verstärktes Verhalten ist schwerer zu löschen als häufig verstärktes Verhalten.
Wie erklärt die Diskriminationshypothese dieses Paradox?
Bei seltener Verstärkung wird das Ausbleiben der Verstärkung weniger deutlich wahrgenommen.
Das Verhalten ist schwerer zu löschen, wenn die Verstärkung selten war, weil der Organismus das Ausbleiben der Verstärkung schwerer von normaler Variabilität unterscheiden kann.
Was ist Reizgeneralisierung in der operanten Konditionierung?
Übertragung einer gelernten Reaktion auf ähnliche Reize.
Was zeigt der Generalisierungsgradient?
Die Reaktionsrate ist am höchsten beim Trainingsreiz und sinkt mit zunehmender Reizunähnlichkeit.
Warum ist Reizgeneralisierung adaptiv?
Sie ermöglicht flexibles Verhalten in leicht veränderten Situationen.
Wie kann man Reizgeneralisierung reduzieren?
Durch gezieltes Diskriminationstraining, bei dem nur der exakte Trainingsreiz verstärkt wird.
Zuletzt geändertvor einem Monat