Was sind Verstärkerpläne (Schedules of Reinforcement)
Kontinuierliche Verstärkung: jedes Verhalten wird verstärkt (jedes Mal Futter)
partielle Verstärkung: Verhalten wird nur manchmal verstärkt (nur manchmal Futter)
Was wird hiermit beschrieben:
langsameres Lernen
keine Pausen nach Verstärkung
Variabler Intervallplan
schnelles Lernen
kaum Pausen
sehr löschungsresistent
Variabler Quotenplan
Post Reinforcement Pause -> abhängig von Quote u. Anstrengung
Fester Quotenplan
Verhalten wird kurz vor Verstärker öfters gezeigt
Pause nach Verstärkung
Fester Intervallplan
Wann schnelleres Lernen: Quoten- oder Intervallplan
Quotenplan immer schnelleres Lernen
-> man muss bestimmte Anzahl an Verhalten zeigen für Verstärkung beiQuotenplan
Wann Pausen: Variabler oder Fester Plan
Festen Plan
was wird hiermit beschrieben:
Man bekommt Provision nach 5 Verkäufen von Autos aber manchmal auch schon nach 2
Einkaufverhalten -> am 24. Dezember Verstärker durch Freude der Familie
dan 12 Monate ohne, dass Verstärker findet-> Pause dann Beschleunigung
was wird hiermit beschrieben;
Bus kommt in 10 Minuten und je näher man sich geplanter Abfahrtszeit nähert,desto eher schaut man auf Straße ob Bus schon da ist, obwohl Verhalten erst verstärkt wird, wenn Bus herangefahren kommt
Nenne zwei Arten von Verstärkung
Kontinuierliche Verstärkung
Partielle Verstärkung
Nenne die 4 Arten der partiellen Verstärkung
jedes Verhalten wird verstärkt
was ist cumulative recorder
Gerät, um kumultiv Verhalten und Verstärkung aufzuzeichnen
partielle Verstärkung
nur manchmal wird Verhalten verstärkt
Wer war Skinner
Psychologen als Ingenieure der Gesellschaft
viele Tierversuche
Behaviorist
Effekt Fester Intervallplan
FL-5min: das erste Verhalten nach diesem Zeitintervall wird verstärkt -> ansonsten ist Anzahl Verhalten irrelevant
EFFEKT:
Langsameres Lernen
Nach Verstärkung längere Pause
Kurz vor Ende des Intervalls wird Verhalten wieder häufiger gezeigt, aber dennoch früher als notwendig
(also Verhalten kurz bevor Verhalten fällig wird)
z.B. Ende Dezember kümmert man sich erst um Weihnachtsgeschenke und Verhalten wird dann beschleunigt, nach dem es oftmals kaum gezeigt wurd
z.B.. wenn Bus kommt und man weiss er kommt in 1 min (und man wartet seit 5min) dann schaut man öfters ob Bus doch schon kommt obwohl Verhalten erst in 1 min verstärkt wird
Effekt vom Festen Quotenplan
Beispiel FR 10: Verstärker erfolgt immer nach 10x Verhalten, Dauer irrelevant (z.B. jede 10. Meldung in VL wird mit Lob verstärkt)
Verhalten wird häufiger ausgeführt, aber nach Verstärkung wird kurz Pause eingelegt (Verhalten wird kurz gestoppt)
-> Post- Reinforcement-Pause
Dauer der Post-Reinforcement- Pause ist abhängig voon Anstrengung und Quote
Effekt vom Variablen Quotenplan
Beispiel VR10: Verstärker erfolgt durchschnittlich nach 10x Verhalten -> Dauer irrelevant. Aber Verstärker manchmal auch früher oder später
sehr schnelles Lernen
Fast keine Pausen nach Verstärkung
-> abhängig von minimaler Quote
-> mehr Verhalten als mit festem Quotenplan da keine Pausen
sehr löschungsresistent (Verhalten wird lange gezeigt auch wenns kein Verstärker gibt da man noch weiter auf Verstärkung hofft )
Inwiefern unterscheiden sich die Verstärkerpläne in ihrer Wirkung
Effektivität -> Wie schnell wird das Verhalten erlernt
Was passiert kurzfristig nach Verstärkung
Wie schnell verändert sich Verhalten, wenn Verstärker ausbleibt ? (Stabilität)
effekt Variabler Intervallplan
VL-5min: das erste Verhalten wird durchschnitlich nach diesem Zeitintervall verstärkt, aber mal ist es früher oder später so weit -> Anzahl Verhalten irrelevant
keine Pausen nach Verstärkung (anders als beim festen Intervallplan) —> denn auch hier weiss man nicht wann das nächste Mal Verhalten verstärkt wird
-> oft in sozialen Interaktionen z.B. sagen nicht wenn jemand tuschelt “ alle 5 Minuten wenn jemand tuschelt, sag ich etwas”, sondern variabel
Wozu gehört folgendes:
Provision immer nach 5 Verkäufen von Autos
Wieso bei Variablen Quotenplan schnelles lernen und bei Variablen Intervallplan langsames lernen
Bei variablen Quotenplänen (VR) hängt die Verstärkung von der Anzahl der Reaktionen ab, jede Reaktion könnte belohnt werden, deshalb lernen Tiere/Menschen schnell und reagieren stark
-> Bei variablen Intervallplänen (VI) hängt die Verstärkung nur von der verstrichenen Zeit ab, egal wie oft man reagiert, daher ist die Lernrate langsamer.
Arten der partielle Verstärkung
Qotenplan: Fester Plan in welchem Rhythmus Verhalten verstärkt wird (z.B. jedes dritte /siebte Mal)
-> Fester Plan: JEDES dritte Mal
-> Variabler Plan: Manchmal jedes dritte Mal, manchmal jedes siebte Mal
Intervallplan: Zeitlicher Rhytthmus wann Verhalten verstärkt wird (z.B. immer nach drei Minuten)
-> Fester Plan: alle 3 Minuten
-> Variabler Plan: alle 2 minuten, dann 4 , dann 5 (aber im Mittel dann 3 Minuten Intervallplan)
Bei welchem Plan Post Reinforcement Pause
Was ist Backward chaining
Letztes Element der Kette wird zuerst verstärkt
Dann nur Verstärkung, wenn auch voriges Element folgt
Spätere Elemente werden Verstärkerer höherer Ordnung für frühere Elemente
—> EFFEKTIVER und weniger frustrierend als Forward Chaining
Beispiel:
Erst muss man Platz aufsuchen, dann beim zweiten Mal muss man in Hörsaal gehen und man weiss schon wie Platz aufsuchen funktioniert. Dann beim dritten Mal muss man Institut betreten und die nächsten Zwei Schritte kennt man ja schon etc.
Was ist die Skinner Box
kontrollierte Umgebung für automatisierte Verhaltensexperimente
Apparatur zur Messung eines spezifischen Verhaltens z.B. Hebeldrücken, Picken
Verhalten löst Verstärkung (Futter) oder Bestrafung aus
-> häufig erweitert durch z.B. diskriminative Stimuli
z.B. Ratte lernt, dass sie Hebel drücken muss, um Futter (positiver Verstärkung) zu bekommen
Wie lässt sich Verhatensrepertoire erweitern
Shaping
Effekt fester Quotenplan
z.B. Verstärker erfolgt immer nach 10 x Verhalten, Dauer irrelevant
-> Nach Verstärkung: Post Reinforcement Pause d.h. Verhalten wird kurz pausiert
—> Dauer der Pause abhängig von Anstrengung und Quote
Wie Trotzanfälle shapen
Eltern verstärken Trotz-Verhalten durch Aufmerksamkeit, Süßigkeiten zur Beruhigung usw -> positive Verstärkung
aber Eltern werden auch zunehmend resistenter
-> dadurch werden Anforderungen für Verstärker erhöht = extremere Trotz-Anfälle um Verstärker zu bekommen
Shaping extremeren Trotz-Verhaltens des Kindes (durch Eltern verstärkt)
GEGENSEITIGES SHAPING-> Shaping wirkt wechselseitig
Shaping des Klein-Beigebe-Verhaltens der Eltern
-> durch Bravsein des Kindes verstärkt, dadurch, dass es durch Aufmerksamkeit/Süssigkeiten sich beruhigt (positive Verstärkung)
Kind verstärkt Verhalten der Eltern
Was zeichnet die effektive Bestrafung aus
Kontingenz: wenig Verhalten ohne Bestrafung und wenig Bestrafung ohne Verhalten
Kontiguität: Bestrafung MUSS sofort erfolgen (zeitliche Nähe)
Intensität: stärkere Bestrafung führt zu stärkerer Unterdrückung
Starke Bestrafung direkt am Anfang wirkt besser als graduelle Erhöhung der Stärke
Was ist Shaping
erweitert das Verhaltensrepertoire
langsam an Zielverhalten herantasten
Verstärkung von kleinsten, zufälligen Annäherungen an das Zielverhalten
Dann zunehmende Anforderungen für Verstärkung
Optimal: unmittelbar nach Verhalten verstärken und geringe Verstärker nutzen-> Clicker als Verstärker statt Futter
Nenne ein Beispiel fürs Shaping
Tier beibringen einmal um sich selbst zu drehen
-> machen das von sich aus eigentlich nicht
Verstärkung einsetzen bei kleinster Annäherung an Zielverhalten (z.B. Taube dreht Kopf)
mit Zeit erhöht man Anforderung (wie weit Taube Kopf drehen muss)
irgendwann wird Taube lernen, dass sie Kopf ganz drehen muss um Verstärker zu bekommen
- > funktioniert umso besser je schneller Verstärkung folgt
Was ist Applied Behavorial Analysis
Anwendung von Lernprinzipien zur Hilfe bei Problemverhalten
Beispiele:
z.B. Rauchentwöhnung
Token Economy -> gezieltes Einsetzen von Verstärkung für erwünschtes Verhalten (z.B. sternchen in Schule bekommen)
Discrete Trial Training , Early Intensive Behavioral Intervention
-> Menschen grundlegenes Verhalten wie z.B.sich anziehen können beibringen
-> Training bei Entwicklungsstörungen
Was ist die Kumulative Aufzeichnung von Verhalten und Verstärkung
Geräte registrierten Verhalter und Verstärker
Was ist Forward Chaining
Erstes Element der Kette wird zuerst verstärkt
Dann Erhöhung der Anforderung:
nur Verstärkung, wenn auch nächster Schritt der Kette folgt
z.B. erst: zur Uni fahren = Verstärkung, dann nur Verstärker wenn zur Uni fahren UND Institut betreten etc.
-> solange bis also alle Handlungen der Kette durchlaufen wurden
Was ist Chaining
Komplexes Verhalten besteht aus einer Kette von Handlungen mit einer bestimmten Reihenfolge
z.B. Beute suchen, auflauern, jagen, fangen, beißen
Zur Uni fahren, Institut betreten, in Hörsaal gehen, Platz suchen
- > kennen zwar einzelne Handlungen aber nicht Handlungskette bzw Reihenfolge
Voraussetzung: Lernen einer Kette von Verhaltensweisen, die bereits im Verhaltensrepertoire sind (z.B. durch vorheriges Shaping)
2 Arten: Forward Chaining/Backward Chaining
Was ist richtig im Bezug auf effektive Bestrafung
Erkläre das Experiment zur effektiven Bestrafung
Mild, dann Harte Bestrafung
Phase 1
Tiere werden nicht bestraft = Verhalten wird weiterhin gezeigt
Andere Tiere werden mild bestraft = kurz geringeres Verhalten, dann aber schnell wird wieder Verhalten gezeigt
Phase 2
beide Tiergruppen werden hart bestraft
Gruppe 1 (kennt keine Bestrafung): Reagieren stark und reduzieren stark + dauerhaft Verhalten)
Gruppe 2 (kennt milde Bestrafung): Reagieren nur bisschen und nicht dauerhaft
—> Langsame Erhöhung der Bestrafung wirkt nicht so effektiv (gewöhnen sich quasi dran)
Harte, dann milde Bestrafung
Andere Tiere werden HART bestraft = reduzieren Häufigkeit und dauerhaft Verhalten
beide Tiergruppen werden mild bestraft
Gruppe 1 (kennt keine Bestrafung) reduziert Häufigkeit des Verhaltens , Gruppe 2 reduziert auch stark Verhalten, aber nur kurzfristig
-> Direkt Harte Bestrafung, dann milde wirkt effektiv
——-> Graduelle Erhöhung von Bestrafung nicht effektiv, graduelle Senkung von Bestrafung ist effektiv
Was sind Nachteile von Bestrafung + Alternativen
Negative emotionale Reaktion (Furcht/Stress/Aggression)
Neues Vermeidungsverhalten statt Unterdrückung des Problemverhaltens!
-> Nicht nur Häufigkeit des problematischen Verhaltens wird unterdrückt, sondern Tier lernt sich Strafe zu entziehen durch Schummeln/Flucht etc.
teils generelle Unterdrückung, auch von unproblematischem Verhalten
Unerwünschtes Verhalten häufig schwieriger zu kontrollieren als erwünschtes LIEBER: z.B. eher positiver Verstärker einsetzen um erwünschtes Verhalten zu fördern)
Alternativen:
Extinktion des problematischen Verhaltens durch Eliminierung des Verstärkers
-> unerwünschtes Verhalten durch eliminierung des Verstärkers hemmme
Akquistion von erwünschtem Verhalten durch Verstärkung
-> also erwünschtes Verhalten durch positiven Verstärker unterstützen
Was sind potenzielle Alternativen von Bestrafung
Extinktion des problematischen Verhaltens indem man Verstärker eliminiert
Akquisition von erwünschtem Verhalten durch Verstärkung
-> Alternatives Verhaltens
-> Inkompatible Verhalten
Effekt Variabler Quotenplan
VR10: Verstärker erfolgt durchschnittlich nach 10x Verhalten
-> Dauer Irrelevant
aber auch mal frühr oder später
Fast keine Pausen nach Verstärkung ->abhängig von minimaler Quote
—> mehr Verhalten als mit festem Quotenplan
sehr löschungsresistent und hartnäckig, da man nicht weiß, wann Verstärkung folgt
Was ist das Problem damit komplexe Verhaltenssequenzen zu erlernen
Wie macht man das ?
Was soll man Verstärken, wenn das Zielverhalten nie auftritt bzw. nicht im Verhaltensrepertorie ist?
Verstärkung im Bezug auf Slot Machines /Glücksspiel
“ Skinner Box für Menschen”
unmittelbare Verstärkung
Variabler Quotenplan (Variable Ratio Schedule)
->ab und zu Verstärkung, aber nicht vorhersehbar
-> sehr löschungsresistent
Viele kleine Gewinne (positiver Verstärkung)
-> near Misses
Wichtig
-> Quoten und Intervalle können progressiv sein
->zunehmend mehr Verhalten für eine Verstärkung erforderlich (Intervall- und Quotenplan können auch kombiniert werden etc)
Geringere Quoten, lange Intervalle und hohe Variabilität -> größere Löschungsresistenz
Verstärkerpläne können komplexer sein
Last changed7 days ago