VL 4 Operantes Konditionieren

Buffl

Allgemeine II

by Karla M.

Was sind Verstärkerpläne (Schedules of Reinforcement)

Kontinuierliche Verstärkung: jedes Verhalten wird verstärkt (jedes Mal Futter)

partielle Verstärkung: Verhalten wird nur manchmal verstärkt (nur manchmal Futter)

Was wird hiermit beschrieben:

langsameres Lernen
keine Pausen nach Verstärkung

Variabler Intervallplan

Was wird hiermit beschrieben:

schnelles Lernen
kaum Pausen
sehr löschungsresistent

Variabler Quotenplan

Was wird hiermit beschrieben:

Post Reinforcement Pause -> abhängig von Quote u. Anstrengung

Fester Quotenplan

Was wird hiermit beschrieben:

Verhalten wird kurz vor Verstärker öfters gezeigt
Pause nach Verstärkung
langsameres Lernen

Fester Intervallplan

Wann schnelleres Lernen: Quoten- oder Intervallplan

Quotenplan immer schnelleres Lernen

-> man muss bestimmte Anzahl an Verhalten zeigen für Verstärkung beiQuotenplan

Wann Pausen: Variabler oder Fester Plan

Festen Plan

was wird hiermit beschrieben:

Man bekommt Provision nach 5 Verkäufen von Autos aber manchmal auch schon nach 2

Variabler Quotenplan

was wird hiermit beschrieben:

Einkaufverhalten -> am 24. Dezember Verstärker durch Freude der Familie

dan 12 Monate ohne, dass Verstärker findet-> Pause dann Beschleunigung

Fester Intervallplan

was wird hiermit beschrieben;

Bus kommt in 10 Minuten und je näher man sich geplanter Abfahrtszeit nähert,desto eher schaut man auf Straße ob Bus schon da ist, obwohl Verhalten erst verstärkt wird, wenn Bus herangefahren kommt

Fester Intervallplan

Nenne zwei Arten von Verstärkung

Kontinuierliche Verstärkung
Partielle Verstärkung

Nenne die 4 Arten der partiellen Verstärkung

Fester Quotenplan
Variabler Quotenplan
Fester Intervallplan
Variabler Intervallplan

Kontinuierliche Verstärkung

jedes Verhalten wird verstärkt

was ist cumulative recorder

Gerät, um kumultiv Verhalten und Verstärkung aufzuzeichnen

partielle Verstärkung

nur manchmal wird Verhalten verstärkt

Wer war Skinner

Psychologen als Ingenieure der Gesellschaft

viele Tierversuche

Behaviorist

Effekt Fester Intervallplan

FL-5min: das erste Verhalten nach diesem Zeitintervall wird verstärkt -> ansonsten ist Anzahl Verhalten irrelevant

EFFEKT:

Langsameres Lernen
Nach Verstärkung längere Pause
Kurz vor Ende des Intervalls wird Verhalten wieder häufiger gezeigt, aber dennoch früher als notwendig
(also Verhalten kurz bevor Verhalten fällig wird)

z.B. Ende Dezember kümmert man sich erst um Weihnachtsgeschenke und Verhalten wird dann beschleunigt, nach dem es oftmals kaum gezeigt wurd
z.B.. wenn Bus kommt und man weiss er kommt in 1 min (und man wartet seit 5min) dann schaut man öfters ob Bus doch schon kommt obwohl Verhalten erst in 1 min verstärkt wird

Effekt vom Festen Quotenplan

Beispiel FR 10: Verstärker erfolgt immer nach 10x Verhalten, Dauer irrelevant (z.B. jede 10. Meldung in VL wird mit Lob verstärkt)

EFFEKT:

Verhalten wird häufiger ausgeführt, aber nach Verstärkung wird kurz Pause eingelegt (Verhalten wird kurz gestoppt)
-> Post- Reinforcement-Pause
Dauer der Post-Reinforcement- Pause ist abhängig voon Anstrengung und Quote

Effekt vom Variablen Quotenplan

Beispiel VR10: Verstärker erfolgt durchschnittlich nach 10x Verhalten -> Dauer irrelevant. Aber Verstärker manchmal auch früher oder später

EFFEKT:

sehr schnelles Lernen
Fast keine Pausen nach Verstärkung
-> abhängig von minimaler Quote
-> mehr Verhalten als mit festem Quotenplan da keine Pausen
sehr löschungsresistent (Verhalten wird lange gezeigt auch wenns kein Verstärker gibt da man noch weiter auf Verstärkung hofft )

Inwiefern unterscheiden sich die Verstärkerpläne in ihrer Wirkung

Effektivität -> Wie schnell wird das Verhalten erlernt
Was passiert kurzfristig nach Verstärkung
Wie schnell verändert sich Verhalten, wenn Verstärker ausbleibt ? (Stabilität)

effekt Variabler Intervallplan

VL-5min: das erste Verhalten wird durchschnitlich nach diesem Zeitintervall verstärkt, aber mal ist es früher oder später so weit -> Anzahl Verhalten irrelevant
Langsameres Lernen
keine Pausen nach Verstärkung (anders als beim festen Intervallplan) —> denn auch hier weiss man nicht wann das nächste Mal Verhalten verstärkt wird

-> oft in sozialen Interaktionen z.B. sagen nicht wenn jemand tuschelt “ alle 5 Minuten wenn jemand tuschelt, sag ich etwas”, sondern variabel

Wozu gehört folgendes:

-> oft in sozialen Interaktionen z.B. sagen nicht wenn jemand tuschelt “ alle 5 Minuten wenn jemand tuschelt, sag ich etwas”, sondern variabel

Variabler Intervallplan

Wozu gehört folgendes:

Provision immer nach 5 Verkäufen von Autos

Fester Quotenplan

Wieso bei Variablen Quotenplan schnelles lernen und bei Variablen Intervallplan langsames lernen

Bei variablen Quotenplänen (VR) hängt die Verstärkung von der Anzahl der Reaktionen ab, jede Reaktion könnte belohnt werden, deshalb lernen Tiere/Menschen schnell und reagieren stark

-> Bei variablen Intervallplänen (VI) hängt die Verstärkung nur von der verstrichenen Zeit ab, egal wie oft man reagiert, daher ist die Lernrate langsamer.

Arten der partielle Verstärkung

Qotenplan: Fester Plan in welchem Rhythmus Verhalten verstärkt wird (z.B. jedes dritte /siebte Mal)

-> Fester Plan: JEDES dritte Mal

-> Variabler Plan: Manchmal jedes dritte Mal, manchmal jedes siebte Mal

Intervallplan: Zeitlicher Rhytthmus wann Verhalten verstärkt wird (z.B. immer nach drei Minuten)

-> Fester Plan: alle 3 Minuten

-> Variabler Plan: alle 2 minuten, dann 4 , dann 5 (aber im Mittel dann 3 Minuten Intervallplan)

Bei welchem Plan Post Reinforcement Pause

Fester Quotenplan

Was ist Backward chaining

Letztes Element der Kette wird zuerst verstärkt
Dann nur Verstärkung, wenn auch voriges Element folgt
Spätere Elemente werden Verstärkerer höherer Ordnung für frühere Elemente
—> EFFEKTIVER und weniger frustrierend als Forward Chaining

Beispiel:

Erst muss man Platz aufsuchen, dann beim zweiten Mal muss man in Hörsaal gehen und man weiss schon wie Platz aufsuchen funktioniert. Dann beim dritten Mal muss man Institut betreten und die nächsten Zwei Schritte kennt man ja schon etc.

Bei welchem Plan Post Reinforcement Pause

Fester Quotenplan

Was ist die Skinner Box

kontrollierte Umgebung für automatisierte Verhaltensexperimente
Apparatur zur Messung eines spezifischen Verhaltens z.B. Hebeldrücken, Picken
Verhalten löst Verstärkung (Futter) oder Bestrafung aus
-> häufig erweitert durch z.B. diskriminative Stimuli

z.B. Ratte lernt, dass sie Hebel drücken muss, um Futter (positiver Verstärkung) zu bekommen

Wie lässt sich Verhatensrepertoire erweitern

Shaping

Effekt fester Quotenplan

z.B. Verstärker erfolgt immer nach 10 x Verhalten, Dauer irrelevant

-> Nach Verstärkung: Post Reinforcement Pause d.h. Verhalten wird kurz pausiert

—> Dauer der Pause abhängig von Anstrengung und Quote

Wie Trotzanfälle shapen

Eltern verstärken Trotz-Verhalten durch Aufmerksamkeit, Süßigkeiten zur Beruhigung usw -> positive Verstärkung

aber Eltern werden auch zunehmend resistenter
-> dadurch werden Anforderungen für Verstärker erhöht = extremere Trotz-Anfälle um Verstärker zu bekommen
Shaping extremeren Trotz-Verhaltens des Kindes (durch Eltern verstärkt)

GEGENSEITIGES SHAPING-> Shaping wirkt wechselseitig

Shaping des Klein-Beigebe-Verhaltens der Eltern
-> durch Bravsein des Kindes verstärkt, dadurch, dass es durch Aufmerksamkeit/Süssigkeiten sich beruhigt (positive Verstärkung)
- Kind verstärkt Verhalten der Eltern

Was zeichnet die effektive Bestrafung aus

Kontingenz: wenig Verhalten ohne Bestrafung und wenig Bestrafung ohne Verhalten

Kontiguität: Bestrafung MUSS sofort erfolgen (zeitliche Nähe)

Intensität: stärkere Bestrafung führt zu stärkerer Unterdrückung

Starke Bestrafung direkt am Anfang wirkt besser als graduelle Erhöhung der Stärke

Was ist Shaping

erweitert das Verhaltensrepertoire
langsam an Zielverhalten herantasten
Verstärkung von kleinsten, zufälligen Annäherungen an das Zielverhalten
Dann zunehmende Anforderungen für Verstärkung
Optimal: unmittelbar nach Verhalten verstärken und geringe Verstärker nutzen-> Clicker als Verstärker statt Futter

Nenne ein Beispiel fürs Shaping

Tier beibringen einmal um sich selbst zu drehen

-> machen das von sich aus eigentlich nicht

Verstärkung einsetzen bei kleinster Annäherung an Zielverhalten (z.B. Taube dreht Kopf)
mit Zeit erhöht man Anforderung (wie weit Taube Kopf drehen muss)
irgendwann wird Taube lernen, dass sie Kopf ganz drehen muss um Verstärker zu bekommen

- > funktioniert umso besser je schneller Verstärkung folgt

Was ist Applied Behavorial Analysis

Anwendung von Lernprinzipien zur Hilfe bei Problemverhalten

Beispiele:

z.B. Rauchentwöhnung

Token Economy -> gezieltes Einsetzen von Verstärkung für erwünschtes Verhalten (z.B. sternchen in Schule bekommen)
Discrete Trial Training , Early Intensive Behavioral Intervention
-> Menschen grundlegenes Verhalten wie z.B.sich anziehen können beibringen
-> Training bei Entwicklungsstörungen

Was ist die Kumulative Aufzeichnung von Verhalten und Verstärkung

Geräte registrierten Verhalter und Verstärker

Was ist Forward Chaining

Erstes Element der Kette wird zuerst verstärkt
Dann Erhöhung der Anforderung:
nur Verstärkung, wenn auch nächster Schritt der Kette folgt

z.B. erst: zur Uni fahren = Verstärkung, dann nur Verstärker wenn zur Uni fahren UND Institut betreten etc.
-> solange bis also alle Handlungen der Kette durchlaufen wurden

Was ist Chaining

Komplexes Verhalten besteht aus einer Kette von Handlungen mit einer bestimmten Reihenfolge

z.B. Beute suchen, auflauern, jagen, fangen, beißen
Zur Uni fahren, Institut betreten, in Hörsaal gehen, Platz suchen
- > kennen zwar einzelne Handlungen aber nicht Handlungskette bzw Reihenfolge

Voraussetzung: Lernen einer Kette von Verhaltensweisen, die bereits im Verhaltensrepertoire sind (z.B. durch vorheriges Shaping)

2 Arten: Forward Chaining/Backward Chaining

Was ist richtig im Bezug auf effektive Bestrafung

Erkläre das Experiment zur effektiven Bestrafung

Mild, dann Harte Bestrafung

Phase 1

Tiere werden nicht bestraft = Verhalten wird weiterhin gezeigt
Andere Tiere werden mild bestraft = kurz geringeres Verhalten, dann aber schnell wird wieder Verhalten gezeigt

Phase 2

beide Tiergruppen werden hart bestraft
Gruppe 1 (kennt keine Bestrafung): Reagieren stark und reduzieren stark + dauerhaft Verhalten)

Gruppe 2 (kennt milde Bestrafung): Reagieren nur bisschen und nicht dauerhaft

—> Langsame Erhöhung der Bestrafung wirkt nicht so effektiv (gewöhnen sich quasi dran)

Harte, dann milde Bestrafung

Phase 1

Tiere werden nicht bestraft = Verhalten wird weiterhin gezeigt
Andere Tiere werden HART bestraft = reduzieren Häufigkeit und dauerhaft Verhalten

Phase 2

beide Tiergruppen werden mild bestraft
Gruppe 1 (kennt keine Bestrafung) reduziert Häufigkeit des Verhaltens , Gruppe 2 reduziert auch stark Verhalten, aber nur kurzfristig

-> Direkt Harte Bestrafung, dann milde wirkt effektiv

——-> Graduelle Erhöhung von Bestrafung nicht effektiv, graduelle Senkung von Bestrafung ist effektiv

Was sind Nachteile von Bestrafung + Alternativen

Negative emotionale Reaktion (Furcht/Stress/Aggression)
Neues Vermeidungsverhalten statt Unterdrückung des Problemverhaltens!
-> Nicht nur Häufigkeit des problematischen Verhaltens wird unterdrückt, sondern Tier lernt sich Strafe zu entziehen durch Schummeln/Flucht etc.
teils generelle Unterdrückung, auch von unproblematischem Verhalten
Unerwünschtes Verhalten häufig schwieriger zu kontrollieren als erwünschtes LIEBER: z.B. eher positiver Verstärker einsetzen um erwünschtes Verhalten zu fördern)

Alternativen:

Extinktion des problematischen Verhaltens durch Eliminierung des Verstärkers
-> unerwünschtes Verhalten durch eliminierung des Verstärkers hemmme
Akquistion von erwünschtem Verhalten durch Verstärkung
-> also erwünschtes Verhalten durch positiven Verstärker unterstützen

Was sind potenzielle Alternativen von Bestrafung

Extinktion des problematischen Verhaltens indem man Verstärker eliminiert
Akquisition von erwünschtem Verhalten durch Verstärkung
-> Alternatives Verhaltens
-> Inkompatible Verhalten

Effekt Variabler Quotenplan

VR10: Verstärker erfolgt durchschnittlich nach 10x Verhalten

-> Dauer Irrelevant

aber auch mal frühr oder später

schnelles Lernen
Fast keine Pausen nach Verstärkung ->abhängig von minimaler Quote
—> mehr Verhalten als mit festem Quotenplan
sehr löschungsresistent und hartnäckig, da man nicht weiß, wann Verstärkung folgt

Was ist das Problem damit komplexe Verhaltenssequenzen zu erlernen

Wie macht man das ?

Was soll man Verstärken, wenn das Zielverhalten nie auftritt bzw. nicht im Verhaltensrepertorie ist?

Verstärkung im Bezug auf Slot Machines /Glücksspiel

“ Skinner Box für Menschen”

unmittelbare Verstärkung
Variabler Quotenplan (Variable Ratio Schedule)
->ab und zu Verstärkung, aber nicht vorhersehbar
-> sehr löschungsresistent
Viele kleine Gewinne (positiver Verstärkung)
-> near Misses

Wichtig

-> Quoten und Intervalle können progressiv sein

->zunehmend mehr Verhalten für eine Verstärkung erforderlich (Intervall- und Quotenplan können auch kombiniert werden etc)

Geringere Quoten, lange Intervalle und hohe Variabilität -> größere Löschungsresistenz
Verstärkerpläne können komplexer sein

Join Course

Preview

Author

Karla M.

Information

Last changed
3 months ago

Report course