Wiederholte Spiele
Wiederholte SpieleYves Breitmoser, EUV Frankfurt (Oder)
1ÜberblickLangfristige Beziehung Zwei Akteure treffen sich regelmäßig, ohneabsehbares Ende, und können jeweils kooperativ oder unkooperativ seinBeispiele Lebenspartner, Firmen, Kollegen, Politiker, . . .FragenUnter welchen Umständen entwickelt/ergibt sich Kooperation?Wie wird unkooperatives Verhalten bestraft? (TFT, Grim?)Themen1 Klassische Theorie2 Eine Welle aktueller Experimente3 Diskrepanz zwischen Theorie und Empirie4 Eine neue Theorie5 Empirische Bestätigung
2Das BasismodellStylisierte Situation: Gefangenendilemma Entscheidung zwischenkooperativem (c) und unkooperativem (d) VerhaltenKooperation ist mit Anstrengung verbunden, nicht individuell optimal, abergünstig für Gegner/PartnerBeidseitige Kooperation ist sozial optimalcdc 3, 3 0, 4d 4, 0 1, 1Langfristige Beziehung: Wiederholtes GefangenendilemmaBasisspiel wird unbegrenzt wiederholt, je eine Interaktion pro PeriodeDiskontierung zukünftiger Auszahlungen mit Faktor δSimulation im Labor durch Fortsetzungswahrscheinlichkeit δ nach jederPeriode
BeispieleFortsetzungswahrscheinlichkeit δ = 0.75c dc 3, 3 0, 4d 4, 0 1, 1Runde 1Runde 2Runde 3Runde 4∑Spieler 1c 0c 3c 3c 06Spieler 2d 4c 3c 3d 414Runde 1Runde 2Runde 3Runde 4∑Spieler 1c 0d 1d 1d 13Spieler 2d 4d 1d 1d 17Was Sie vielleicht gewählt hätten:nach (c, c) vermutlich c, nach (d, d) vermutlich dnach (c, d), (d, c): weniger entschieden, nahe Indifferenz
5Klassische Theorie 1: Das Folk TheoremFolk TheoremJedes individuell rationale Auszahlungsprofil kann sich im teilspielperfektenGleichgewicht bei Diskontfaktoren hinreichend nahe 1 ergeben.Individuell rational Jeder Spieler erhält mindestens seine Minimax-AuszahlungMinimax-Auszahlung Die Auszahlung, die man mindestens erreichen kann:min s−i max si π i (s i , s −i )Im Basisspielc dc 3, 3 0, 4d 4, 0 1, 1✻4 ❇ ❜3 ❇❇❜❇❜❇❇1❜ ❜ ❜ ❜❜❜ ❜ ❜ ❜❇❜ ❇❜ ❜ ❜ ❜❜ ❇ ❜❜ ❜ ❜ ❜❜ ❜ ❜❜ ❇❜❇ ❇❇❇ 0 0 1 3 4✲
6Klassische Theorie 2: Evolutionäre StabilitätTit-for-Tat Beginn mit c, danach imitiere den Gegnerc nach (·, c) und d nach (·, d)Streng reziproke Strategie, kein TSP-Ggw“optimal” bei unbekannter Strategie der Gegner(Axelrod, 1980), unschlagbar bei δ ≈ 1c, cd, cc, dd, dWin-Stay-Lose-Shift Beginn mit c, spiel c nach (c, c) und (d, d), spiel dnach (c, d) oder (d, c)“Lernstrategie”: Wechsel der Aktion falls Auszahlungklein (π i < 3), Wiederholung der Aktion sonstKurzer “Streit” nach d, keine “Bestrafung”Ist ein TSP-Ggw, wenn eine Runde (d, d) reichtEffektiv durch möglichen Wiederaufbau nach (d, d);effektiver als TFT wenn Gegner c nach (c, c) spielenc, cd, cc, dd, d
7Etwas konkretere FragenSetzt Kooperation ein, wenn Grim ein TSP-Ggw ist?Ergibt sich die Beliebigkeit der Folk Theoreme?Spielen wir Grim, TFT oder WSLS?Grim Beginn mit c, Spiel c ⇔ (c, c)TFT Beginn mit c, Spiel c ⇔ (c, c) oder (d, c)WSLS Beginn mit c, Spiel c ⇔ (c, c) oder (d, d)Nutzen wir überhaupt Memory-1 Markov-Strategien?Ist die Strategiewahl eine Frage der Parameter? Bspw. bei δ = 0.75c dc dcdc 3, 3 0, 4d 4, 0 1, 1c 2, 2 0, 3d 3, 0 1, 1c 3, 3 0, 5d 5, 0 1, 1
8Kürzlich: Viele experimentelle StudienDal Bo (2005, AER): Vergleich unendlich zu endlich, verschiedene δ und LängenKooperation steigt bei höherem δ, aber Koop nicht schon bei δ ≈ δ GrimDuffy and Ochs (2009, GEB): fixed rematching vs. random rematchingBlonski, Ockenfels, Spagnolo (2011, AEJ-Micro): Koop-Schwelle δ = δ ⋆Axiomatische Charakterisierung und experimentelle BestätigungDal Bo und Frechette (2011, AER): Bestätigung des Kriteriums δ ≥ δ ⋆Ökonometrische Schätzung der Strategien kein stabiles MusterBruttel und Kamecke (2012, TD): Drei Methoden zur Bestimmung der StrategienErgebnisse ziemlich robust, Memory-1 Markov passt ganz gut bei einem GDFudenberg, Rand und Dreber (2012, AER): Aktionen mit NoiseAuch Schätzung der Strategien Tit-for-2-tats (TF2T), 2-Tits-for-tat (2TFT)
Interessantes Ergebnis: BOS-SchwelleBlonski, Ockenfels, Spagnolo (2011, BOS) fanden eine empirischeBedingung für Koop, durch Dal Bo und Frechette (2012, DF) bestätigt:Aber:systematische Koop ⇔ δ ≥ p dc + p dd − p cd − p ccp dc − p cd=: δ ⋆δ ⋆ ist durch Axiome über Parameter (p cc , p cd , p dc , p dd , δ) charakterisiert(Invarianz bzgl. linearer Transformation; δ-Monotonie; Additive Separierbarkeit vonp cc − p dd , p dc − p cc, p dd − p cd ; Gleiche Gewichte von p dc − p cc und p dd − p cd )Es gibt keine strategische Interpretation, weder theoretisch noch empirischGegensatz zu bspw. δ GrimForschungsfragen1 Gibt es eine strategische Interpretation von δ ⋆ ? (Existenz eines Ggws)2 Spielen die Experimentteilnehmer ein Ggw, das bei δ ⋆ entsteht?Dazu ein erster Blick auf die Durchschnittsstrategien . . .
10Das “Semi-Grim Puzzle”c dc a, a 0, bd b, 0 1, 1Standard. ParameterDurschnittsstrategie ist “Semi-Grim”b a δ ˆσ cc ˆσ dc ˆσ cd ˆσ ddBlonski, Ockenfels und Spagnolo (2011)2.5 1.5 0.75 0.912 ≫ 0.128 ≈ 0.226 ≫ 0.0321.429 1.286 0.875 0.968 > 0.088 ≈ 0.234 ≫ 0.0272.5 1.5 0.875 0.971 ≫ 0.28 ≈ 0.211 ≫ 0.0392.4 1.8 0.75 0.887 ≫ 0.117 ≈ 0.244 > 0.0373 2 0.75 0.908 > 0.286 ≈ 0.285 ≫ 0.0224.667 3 0.75 0.854 ≫ 0.254 ≈ 0.195 > 0.064Dal Bo und Frechette (2011)2.923 1.538 0.75 0.946 ≫ 0.38 ≈ 0.358 ≫ 0.032.923 2.769 0.5 1 ≫ 0.21 ≈ 0.371 ≫ 0.0372.923 2.154 0.75 0.959 ≫ 0.555 > 0.328 ≫ 0.1032.923 2.769 0.75 0.976 ≫ 0.347 ≈ 0.28 ≈ 0.074Duffy und Ochs (2009)3 2 0.9 0.924 ≫ 0.37 ≈ 0.347 ≫ 0.123Fudenberg, Rand und Dreber (2012)5 4 0.875 0.935 ≫ 0.465 ≈ 0.465 ≫ 0.078
Empirie vs. TheorieZwei KernbeobachtungenBOS-Schwelle Teilnehmer kooperieren systematisch bei δ ≥ δ ⋆Semi-Grim-Puzzle Die durchschnittlichen Strategien sind strukturell robustund haben die Form σ cc > σ dc ≈ σ cd > σ ddRelation zu Teilspielperfektheit/Folk Theoremen:Die BOS-Schwelle liegt über der Existenzbedingung kooperativer GgwsPluralität der Folk-Theorem-Gleichgewichte widerlegtRelation zu evolutionärer Stabilität (TFT, WSLS):Beobachtungen σ dc ≈ σ cd und σ cd > 0 widersprechen TFTBeobachtungen σ dd < σ cd und σ dd < σ dc widersprechen WSLSPassen andere, weniger prominente Ideen der theoretischen Literatur?
Moderne Theorie 1: Imperfektes MonitoringIdee Vollständig gemischtes Ggw ⇒ Indifferent in allen States⇒ Indifferent egal in welchem State Gegner ist/glaubt zu sein⇒ Robust bzgl. mangelnder AufmerksamkeitSei ˜π s ′ ,s ′′ := π s ′ ,s ′′(c) − π s ′ ,s′′(d) derKooperationsanreiz im State (s ′ , s ′′ )Dann gilt bei “einfachem” Basisspielcdc a, a 0, a + 1d a + 1, 0 1, 1˜π cc − ˜π cd = (σ dc − σ cc ) · µ ˜π cc − ˜π dc = (σ cd − σ cc ) · µ˜π cc − ˜π dd = (σ dd − σ cc ) · µ ˜π cd − ˜π dc = (σ cd − σ dc ) · µmit µ = δ (1 − δ) (a − 1) (σ dc + σ cd − σ cc − σ dd )/r und r > 0˜π cc = 0 und σ dc + σ cd = σ cc + σ dd ⇒ in allen States indifferentDiese σ sind vollständig gemischte (belief-freie) Gleichgewichte
Moderne Theorie 2: NutzenperturbationLogit Gleichgewichte Robustheit bzgl. Nutzenperturbationen mitExtremwert-Verteilung (Typ 1)Definition der Logit-Ggwsσ cc = 1/ ( 1 + exp{−˜π cc /µ} ) σ cd = 1/ ( 1 + exp{−˜π cd /µ} ) . . .mit Kooperationsanreizen ˜π cc := π cc (c) − π cc (d) usw.Limiting-Logit ergibt sich bei µ → 0 (Varianz gegen 0)Eigenschaften der Limiting-Logit Ggws mit 1-Memory1 σ cc > σ dd ⇒ σ cd = σ dc (keine Reziprozität) und σ cc > σ cd,dc2 Belief-freies, limiting-logit Ggw existiert ⇔ δ ≥ δ ⋆3 Dies ist ein gemischtes Ggw mit Form σ cc > σ cd = σ dc > σ ddTheoretisch könnte das vieles erklären
BeweisskizzenDefinition der Logit-Ggwsσ cc = 1/ ( 1 + exp{−˜π cc /µ} ) σ cd = 1/ ( 1 + exp{−˜π cd /µ} ) . . .bei µ → 0, mit Kooperationsanreizen ˜π cc := π cc (c) − π cc (d) usw., wobei˜π cc − ˜π dd = (σ dd − σ cc ) · κ˜π cd − ˜π dc = (σ cd − σ dc ) · κPunkt 1:σ cc > σ dd⇒Logit˜π cc > ˜π dd⇒Linksκ < 0⇒Rechts˜π cd − ˜π dc und σ cd = σ dcPunkte 2,3:1 belief-free ⇒ σ cc > σ dd ⇒Logitσ cd = σ dc⇒Existδ ≥ δ ⋆2 Eines der Belief-freien MPEs mit σ cd = σ dc ist limiting logit(Anwendung des Satzes über implizite Funktionen)3 belief-free und σ cd = σ dc ⇒ σ cc > σ cd = σ dc > σ dd14
Empirische Analyse zur Überprüfung der TheorieAnhand mehrerer Datensätze zur Ableitung robuster MusterBOS11 und DF11: viele Treatments bei δ ≈ δ ⋆Entstehung von KooperationDO09 und FRD12: je ein Treatment mit hohem δ und robuster KoopRobustheits-Test der gefundenen ErgebnisseIn den anderen Treatments dort gilt “fixed rematching” oder “Noise”Grenzen bisheriger Studien zur Schätzung der Strategien (DF11, FRD12)Konzentration auf reine StrategienNeben A-Defect und Grim hauptsächlich Betrachtung ungleichgewichtigerHeuristiken (A-Coop, TFT, Win-Stay-Lose-Shift, Tit-for-2,3-Tats)Keine Erklärung des Semi-Grim Puzzles σ cc > σ cd = σ dc > σ dd
17Memory-1 historiesTr cc dc cd ddcccccccdccdccdccMemory-2 historiescd dcdd ccBlonski, Ockenfels und Spagnolo (2011)63 ++2 ++ +7 ++ ++ + +4 ++ ++ + ++ −−8 ++ ++ ++ ++ −5 ++ ++ ++ ++ + +9 ++ ++ + + +1 ++ ++ ++ ++ − ++10 ++ ++ + ++ − +Dal Bo und Frechette (2011)1 ++ ++ + ++ + −3 ++ ++ ++ ++2 ++ ++ ++ ++ + ++5 ++ ++ ++ ++ +4 ++ ++ ++ ++ − −−6 ++ ++ ++ ++Duffy und Ochs (2009)++ ++ ++ ++ − + ++Fudenberg, Rand und Dreber (2012)++ ++ ++ ++cddcdccddcddddcddddc
18Treatment parameters H 0 : σ cc = σ dd H 0 : σ dc = σ cd H 0 : σ cc = σ cd,dc = σ ddb a δ σ cc σ dd σ dc σ cd σ cc σ cd,dc σ ddBlonski, Ockenfels und Spagnolo (2011)1.43 1.29 0.52.5 1.5 0.5 0.923 ≫ 0.011 0.186 ≈ 0.09 0.93 ≫ 0.142 > 0.011.25 1.12 0.75 0.97 ≫ 0.004 0.33 ≈ 0.218 0.976 ≫ 0.276 ≫ 0.0041.43 1.29 0.75 0.994 ≫ 0.002 0.373 ≈ 0.289 1.001 ≫ 0.333 ≫ 0.0012.5 1.5 0.75 0.886 ≫ 0.038 0.189 ≈ 0.154 0.888 ≫ 0.172 ≫ 0.0371.43 1.29 0.88 0.914 ≫ 0.032 0.237 ≈ 0.207 0.916 ≫ 0.222 ≫ 0.0312.5 1.5 0.88 0.915 ≫ 0.053 0.318 ≈ 0.236 0.922 ≫ 0.279 ≫ 0.0512.4 1.8 0.75 0.913 ≫ 0.03 0.206 ≈ 0.172 0.915 ≫ 0.189 ≫ 0.0293 2 0.75 0.801 ≫ 0.051 0.318 ≈ 0.266 0.807 ≫ 0.295 ≫ 0.0494.67 3 0.75 0.872 ≫ 0.053 0.28 ≈ 0.163 0.874 ≫ 0.223 ≫ 0.051Dal Bo und Frechette (2011)2.92 1.54 0.5 0.795 ≫ 0.031 0.428 > 0.207 0.816 ≫ 0.327 ≫ 0.032.92 2.15 0.5 0.811 ≫ 0.118 0.383 ≫ 0.255 0.822 ≫ 0.323 ≫ 0.1162.92 1.54 0.75 0.899 ≫ 0.041 0.414 > 0.3 0.906 ≫ 0.36 ≫ 0.0392.92 2.77 0.5 0.929 ≫ 0.072 0.244 ≈ 0.319 0.917 ≫ 0.28 ≫ 0.0772.92 2.15 0.75 0.945 ≫ 0.167 0.548 > 0.364 0.948 ≫ 0.454 ≫ 0.1572.92 2.77 0.75 0.98 ≫ 0.106 0.383 ≈ 0.303 0.981 ≫ 0.342 ≫ 0.104Duffy und Ochs (2009)3 2 0.9 0.957 ≫ 0.134 0.38 ≈ 0.342 0.958 ≫ 0.361 ≫ 0.133Fudenberg, Rand und Dreber (2012)5 4 0.88 0.949 ≫ 0.171 0.483 ≈ 0.466 0.95 ≫ 0.474 ≫ 0.169Ergebnis σ cc > σ dd ist universell, σ cd = σ dc ist nicht systematisch verletzt,σ cc > σ cd,dc ist universell
Pooling von σ ∅ und σ cc ?Test H 0 : σ ∅ = σ cc wichtig für spätere Strategieanalyse und fürallgemeines Verständnis von KooperationAnalyse Regression von Koop auf (σ ∅ , σ cc , σ cd , σ dc , σ dd ), mit RandomEffects, Bootstrapping der p-Werte von H 0 : σ ∅ = σ ccσ ccσ ∅BOS: 0.923 ≫ 0.2170.97 ≫ 0.0440.994 ≫ 0.150.886 ≫ 0.2430.914 ≫ 0.3720.915 ≫ 0.3930.913 ≫ 0.5530.801 ≫ 0.350.872 ≫ 0.595σ ccσ ∅DF: 0.795 ≫ 0.0620.811 ≫ 0.1940.899 ≫ 0.2630.929 ≫ 0.4080.945 ≫ 0.7680.98 > 0.955DO: 0.957 ≫ 0.696FRD: 0.949 ≫ 0.825Ergebnis σ ∅ < σ cc ist universell – Kooperation ergibt sich durch Anpassenvon σ ∅ , scheinbar nicht durch Anpassen der Strategie19
Analyse 2: Teilnehmer spielen Semi-Grim StrategienConstant Gen Grim Gen Coop Gen TFT Gen WSLS Semi-Grim(α, α, α, α) (1, α, α, α) (1, α, 0, 0) (1, 0, α, 0) (1, 0, 0, α) (1, α, α, 0)Weight α Weight α Weight α Weight α Weight α Weight αBlonski, Ockenfels und Spagnolo (2011)1 0.017− − − − − − − − − −(−) (0.013)− − − − − − − − − − 1 (−)0.143(0.094)− − − − − − − − − − 1 (−)0.286(0.082)− − − − − − − − − − 1 (−)0.326(0.072)− − 0.12(0.049)− − 0.025(0.025)0.05(0.042)0.053(0.039)0.052(0.042)0.037(0.056)0.218(0.077)0.244(0.088)0.259(0.167)0.412(0.067)0.252(0.054)0.8(0)− − 0.118(0.096)0.361(0.094)Dal Bo und Frechette (2011)− − 0.045(0.033)0.355(0.077)0.008(0)0.016(0.011)− − − − − − 0.88(−)− − − − − − 0.975(−)0.055(0.054)0.868(0.224)0.985(0.082)− − − − 0.831(−)0.031(0.045)0.985(0.118)− − 0.5(−)− − − − − − − − 0.948(−)− − − − − − − − 0.963(−)0.14(0.048)− − 0.325(0.071)− − 0.299(0.105)− − 0.226(0.084)0.023(0.025)0.5(0)Duffy und Ochs (2009)0.144 0.34(0.048) (0.047)0.074(0.071)0.553(0.129)0.647(0.069)0.005(0)0.137(0.093)0.703(0.103)0.796(0.109)− − 0.069(0.047)− − 0.157(0.062)− − 0.141(0.061)0.402(0.119)0.146(0.073)0.97(0.241)0.873(0.146)0.997(0.046)0.88(0.161)0.952(0.065)− − 0.885(−)− − 0.348(−)− − 0.533(−)− − − − 0.299(−)− − − − 0.628(−)− − − − − − 0.902(−)− − − − − − − − 0.856(−)Fudenberg, Rand und Dreber (2012)0.083(0.05)0.419(0.164)− − − − − − − − 0.917(−)0.167(0.048)0.18(0.04)0.277(0.071)0.43(0.042)0.193(0.047)0.221(0.044)0.276(0.064)0.446(0.083)0.508(0.046)0.552(0.117)0.358(0.054)0.227(0.041)0.385(0.033)0.434(0.065)
21Analyse 3: Teilnehmer spielen Semi-Grim GgwsTestbare Implikation Systematische Koop ⇔ B-free, LimLog Ggw existiertDa Strategie weitgehend konstant: Entscheidende Frage ist, wann beginntKooperation in Runde 1Kooperation in Runde 1Analysestrategie1 Logistische Regression Pr(Koop) =1 − 1/ ( 1 + exp{a + b · (δ − δ ⋆ )} )●●●2 Test, ob Interzept a signifikant●●●Ergebnis Teilnehmer kooperieren systematisch(≥ 50%) ⇔ δ ≥ δ ⋆ −0.4 −0.2 0.0 0.2 0.4δ − δ *Probability of observing c in round 10.0 0.2 0.4 0.6 0.8 1.0a = 0.123(0.124)⋆⋆b = 7.237(0.838)
●●●●●●●●●●●●●●●●●●●●●●●●●●●Testbare Implikation: Komparative Statikσ cc ist fallend in δ, σ cd,dc ist weitgehend konstant, σ dd ist steigendσ cc ∼ δ − δ ⋆σ cd,dc ∼ δ − δ ⋆σ dd ∼ δ − δ ⋆Individual probability of playing c after cc0.0 0.2 0.4 0.6 0.8 1.0Individual probability of playing c after cd0.0 0.2 0.4 0.6 0.8 1.0● ● ●●Individual probability of playing c after dd0.0 0.2 0.4 0.6 0.8 1.0−0.4 −0.2 0.0 0.2 0.4⋆⋆a = 2.196(0.035)δ − δ *⋆⋆b = 2.156(0.177)−0.4 −0.2 0.0 0.2 0.4⋆⋆a = −0.797(0.022)δ − δ *⋆b = 0.38(0.111)−0.4 −0.2 0.0 0.2 0.4⋆⋆a = −2.611(0.041)δ − δ *⋆⋆b = 1.829(0.198)σ cc ∼ Predσ cd,dc ∼ Predσ dd ∼ PredIndividual probability of playing c after cc0.0 0.2 0.4 0.6 0.8 1.0Individual probability of playing c after cd,dc0.0 0.2 0.4 0.6 0.8 1.0Individual probability of playing c after dd0.0 0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0⋆⋆a = 7.728(0.488)Prediction of limiting−logit, belief−free MPE⋆⋆b = −5.954(0.551)0.0 0.2 0.4 0.6 0.8 1.0a = −0.045(0.115)Prediction of limiting−logit, belief−free MPE⋆⋆b = −1.181(0.197)0.0 0.2 0.4 0.6 0.8 1.0Prediction of limiting−logit, belief−free MPE⋆⋆a = −2.779(0.062)⋆⋆b = 4.529(0.418)
23Also nicht belief-free, limiting-logit? Beinahe gleichzeitig entstehen verschiedenealternative Semi-Grim GgwsKlassifikation individueller Strategien (Finite-Mixture Modell)3 × Semi-Grim Bsp. (σ cc , σ cd , σ dc , σ dd )BF Lim-Logit 1 > σ cc > σ cd = σ dc > σ dd > 0 (0.9, 0.5, 0.5, 0.1)Eff Symm BF 1 = σ cc > σ cd = σ dc > σ dd > 0 (1, 0.6, 0.6, 0.2)Eff LimLog SG 1 = σ cc > σ cd = σ dc > σ dd = 0 (1, 0.2, 0.2, 0)5 × Nicht-Semi-Grim (nicht σ cc > σ cd = σ dc > σ dd )Always Defect σ cc = σ cd = σ dc = σ dd = 0 (0, 0, 0, 0)TFT σ cc = σ dc = 1, σ cd = σ dd = 0 (1, 0, 1, 0)Grim σ cc = 1, σ dc = σ cd = σ dd = 0 (1, 0, 0, 0)Weak WSLS σ cc = 1, σ dc = σ cd = 0, σ dd > 0 (1, 0, 0, 0.4)Asymm BF σ cc = 1, σ cd > σ dc > σ dd > 0 (1, 0.8, 0.2, 0)
24Efficient MPEs that are not Semi-GrimSemi-Grim MPEsδ − δ ⋆ A-Def Grim TFT W-WSLS Asymm BF LimLog BF Eff Symm BF Eff LimLog SGBlonski, Ockenfels und Spagnolo (2011)-0.3 1 (−)− − −-0.3 1 (−)-0.15 − 1 −(−)-0.05 − − − − − − − 1 (−)-0.05 0.537(0.079)− 0.161(0.062)− − − 0.303(−)0.075 − − − − − − 0.029(0.03)0.075 − − − − − 0.24(0.083)0.083 − 0.434(0.084)0.083 0.116(0.068)0.179 0.089(0.057)Dal Bo und Frechette (2011)-0.316 1 (−)-0.105 − 0.458(0.077)-0.066 − 0.315(0.072)0.105 − 0.448(0.077)− − 0.566(−)−0.971(−)0.76(−)−− − − − − − 0.884(−)− − − − 0.323(0.094)0.196(0.073)0.139(0.064)− 0.588(−)− 0.346(−)−−− − − 0.546(−)− − − − 0.15(0.057)0.145 − − − − − 0.199(0.08)0.355 − − − − − 0.092(0.045)Duffy und Ochs (2009)0.233 − − 0.095(0.049)Fudenberg, Rand und Dreber (2012)0.475 − − 0.137(0.064)− − 0.312(0.075)− − 0.165(0.057)0.415(0.103)0.403(−)0.386(−)− 0.908(−)0.298(0.081)0.423(0.082)0.296(−)0.275(−)
25Wie viele wählen eine der Semi-Grim Strategien?Individual probability of playing a Semi−Grim strategyPr(Semi-Grim) ∼ a + b · (δ − δ ⋆ )0.0 0.2 0.4 0.6 0.8 1.0a = 0.271(0.302)●●●−0.4 −0.2 0.0 0.2 0.4δ − δ *●●●⋆b = 9.662(2.319)Individual probability of playing a Semi−Grim strategyPr(Semi-Grim) ∼ a + b · Pr(Koop)0.0 0.2 0.4 0.6 0.8 1.0●●●0.0 0.2 0.4 0.6 0.8 1.0a = 0.161(0.275)Probability of observing c in round 1●●●⋆b = 6.357(1.333)ErgebnisseAb δ = δ ⋆ spielen Teilnehmer Semi-Grim Ggws systematisch (≥ 50%)Ab δ = δ ⋆ sind dies GleichgewichtsstrategienAb δ = δ ⋆ kooperieren sie auch in Runde 1 systematisch (≥ 50%)Andere kooperative Strategien werden nicht systematisch genutzt (δ ≥ δ ⋆ )
ZusammenfassungTeilnehmer nutzen Semi-Grim Strategien und kooperieren wenn siegleichgewichtig werden – Betrachtung gemischter Ggws sehr fruchtbarWiderlegung der klassischen Theorie durch Empirie, zugunsten einerTheorie basierend auf belief-freien, limiting-logit GleichgewichtenDies erklärt das Semi-Grim-Puzzle und die Präzision der BOS-SchwelleBei δ > δ ⋆ : Entscheidung zwischen Effizienz, Belief-Freiheit und Robustheit(Limiting-Logit)Aufteilung recht gleichförmig auf die drei entsprechenden Ggws,Kaum Masse bei anderen Ggws (Grim, TFT) bei δ > δ ⋆Was lernen wir über langfristige Beziehungen?Verhalten im Labor ist intuitiv: kurze Bedenkzeit, keine KommunikationDazu passt die Spieltheorie (überraschend?) gutIn Realität erweiterter Strategieraum (Argumentation, verbale Retaliation)