Was ist die Grundidee der Spieltheorie?
-> Teil der positiven Analyse, Verhaltensvorhersage
=> Betrachtung von “strategischer Interaktion”
Wie sind alle Spieler gestaltet?
Jeder Spieler…
… Überlegt, was die anderen sich überlegen und tun werden,
… Und versucht, seine Interaktion darauf zu optimieren (= bestmöglich verbessern)
=> Eigennütziges Handeln
Was sind die Zutaten für ein Spiel?
Spieler
Handlungsmöglichkeiten (≠ „Strategien“ = „Handlung X wenn A“)
Strategie ➜ Zusammenhang zwischen Beobachtung und Handlung
Auszahlungen als Funktion der Handlung
(Informationsmengen: was weiß welcher Spieler wann?)
Was sind Simultane Spiele?
Alle handeln gleichzeitig, d.h. ohne zu wissen, was die anderen tun (kein: wenn-dann)
Darstellen in Matrixform
Strategieraum = Handlungsraum
Beispiel: Stein, Schere, Papier
Was für eine Strategie wird im Beispiel Gefangen-Dilemma verfolgt?
=> Dominante Strategie
Was bedeutet Dominanz?
=> Strategie zur Entscheidung
Strategie A "dominiert" Strategie B, wenn
A nie (d.h. egal was der andere macht) schlechter ist als B, aber wenigstens bei manchen Strategien des anderen Spielers besser ist als B.
Was für eine Strategie ist die dominierte?
Dominierte Strategie ⇒ eine Strategie, die von einer anderen Strategie dominiert wird ➤ wird rational nie gewählt
Was für eine Strategie ist die dominante?
Dominante Strategie⇒ eine Strategie, die alle anderen Strategien dominiert ➤ wird rational immer gewählt
Was bedeutet iterativ?
=> auf Wiederholung beruhend
Wie lautet die Definiton des Nash-Gleichgewichts?
Jeder verhält sich so, dass er eine "beste Antwort" auf das Verhalten des / der anderen gewählt hat.
=> Niemand kann allein von der GG-Verhaltenskombination abweichen, ohne sich zu verschlechtern
Auffinden: Pfeile gehen nur rein in dieses Feld
Wie werden sich REM-Spieler (rationale, eigennutzenmaximierende) verhalten, wenn Sie das Spiel kennen und wisse, dass alle anderen Spieler es kennen und das voneinander auch wissen etc. (common knowlegde)?
NGG: in reinen Strategie?
=> jeder Spieler wählt genau eine Verhaltensweise/Strategie
Was ist eine gemischte strategie?
=> Spieler wählt zufällig (mit bestimmten Wahrscheinlichkeiten) zwischen Verhaltensweisen
NGG: in gemischten Strategien?
-> jeder wählt beste Antwort auf gemischte Strategie der anderen
mindestens zwei Spieler wählen jeweils mit bestimmten Wahrscheinlichkeiten eine von mehreren Verhaltensweisen/Strategien
Spieler wählen zufällig (mit bestimmten Wahrscheinlichkeiten) zwsichen Verhaltensweisen
Was wäre, wenn sich der andere stochastisch verhielte?
→jeder Spieler verhält sich „mal so, mal so“, nicht vorhersehbar, allerdings mit bestimmten Wahrscheinlichkeiten
z.B.:
Matching Pennies: Spieler werfen Münze, statt zu entscheiden
Stein-Schere-Papier: Spieler wählen zufällig St–Sch–Pa
enforcement game: „Täter“ „entscheidet“ spontan ob er‘s tut, Polizist kontrolliert „unvorhersehbar“ (=zufällig)
Wie berechnet man NGG in gemischten Strategien?
Was bedeutet die “Evolutorische Betrachtung”?
Ständig wiederholendes "random matching" von Paaren
Verhaltensroutinen, die jeder selten ändern kann
Wenn Möglichkeit zur Änderung, dann beste Antwort
Was bringt die Evolutorische Betrachtung für Nutzen?
Aussagen über Stabilität von Nash-GG in gemischten Strategien (und damit Relevanz von Verhaltensvorhersagen)
Nash-GG ist „stabil“,
wenn die Dynamik, die sich daraus ergibt,
dass Strategien mit höheren erwarteten Payoffs mit
höherer Wahrscheinlichkeit als Routine gewählt werden,
bei kleinen Abweichungen vom GG zu diesem zurück führt.
Nash-GG ist „instabil“,
wenn diese Dynamik
bei kleinen Abweichungen vom GG immer weiter weg führt.
=> Vorstellung von Entwicklungen von Gesellschaften und deren Verhalten im Zeitverlauf und abseits von Gleichgewichten.
Was bedeutet Sequentielle Spiele?
Mindestens ein Spieler kennt vor einer Entscheidung mindestens eine Entscheidung eines anderen Spielers (wenn-dann)
Reaktion auf das Beobachtete handeln des anderen
Darstellung in Baumform
Strategieraum viel komplizierter als Handlungsraum
Beispiel: Schach, Skat, Poker, Mensch ärgere dich nicht
Was müssen für Zutaten für einen Spielbaum vorliegen?
genau 1 Quelle / Ursprung / Anfangsknoten
= Entscheidungspunkt des ersten Spielers (evtl. Natur)
weitere Knoten
= weitere Entscheidungspunkte von Spielern
und dazwischen Äste
= Verbindungen zwischen Knoten
= Entscheidungsmöglichkeiten
Endknoten mit Auszahlungen
= Enden des Spiels
Verbindungslinien
= Knoten innerhalb einer Informationsmenge
Was ist eine “Strategie”?
=> durch Beobachtung vorherigen Verhaltens bedinigte Handlungsanweisung, also z.B.:
“Wenn X gespielt wurde, dann mache ich R.
Wenn Y gespielt wurde, dann mache ich Q.
Wenn etc….”
Wann ist das NGG teilspielperfekt?
=> Nash-GG ist „teilspielperfekt“ wenn das Nash-GG in jedem Teilspiel (= das Spiel ab einem bestimmten Knoten) wieder ein Nash-GG ist
Wie ist die Teilspielperfektheit zu finden?
=> leicht zu finden durch „Rückwärts-Induktion“:
was ist die beste letzte Entscheidung?
was ist die beste vorletzte Entscheidung, wenn unterstellt wird, dass jeweils die beste letzte Entscheidung gewählt wird?
…
Was sind unendlich wiederholte Spiele?
Nächste Wiederholung immer mit einer ausreichend großen
Wahrscheinlichkeit > 0, ≤ 1
„Schatten der Zukunft“ bleibt immer (gleich) groß
⇒ Angst vor Bestrafung in der Zukunft kann kooperatives Verhalten fördern
sogar im Gefangenen-Dilemma
Folk-Theorem: jeder Grad an Kooperation kann langfristig erreicht werden
Bsp: „grimmige Kooperation“
Eine symmetrische Gleichgewichtsstrategie ist die "grimmige Kooperation":
Kooperiere, solange niemand defektiert hat; danach defektiere immer.
Was ist das Folk-Theorem?
Bei ausreichend hoher Bewertung der Zukunft und ausreichend hoher Fortsetzungswahrscheinlichkeit sind alle durchschnittlichen Rundenauszahlungen erreichbar, die…
Was ist ein zentrales Ergebis der Betrachtung von unendlich wiederholten Spielen?
Bei ausreichend hoher Bewertung der Zukunft und ausreichend hoher Fortsetzungswahrscheinlichkeit wird Kooperation selbst im Gefangenen-Dilemma zu einem Nash-Gleichgewicht.
Problem: es gibt dann viele Nash-Gleichgewichte, in denen beide einigermaßen oft kooperieren, und manche sind für den einen Spieler besser und andere für den anderen.
Mögliche Lösung für das Problem: Recht gibt Hinweise, was zu tun ist.
Was sagen Experimente daraus?
➥ Menschen kooperieren bei wiederholten Gefangenendilemmata am Anfang doch, erst in den letzten Runden setzt sich die Defektion durch.
Beachte: das ist kein Nash-Gleichgewicht, denn mindestens ein Spieler kann bei jeder noch so komplizierten Strategie etwas früher anfangen zu defektieren, ohne etwas zu verlieren, aber mit einem Gewinn aus der ersten Defektion.
Last changed8 months ago