Nullsummenspiele mit simultanen Zügen ¨Uberblick Ein einfaches ...

econ.euv.ffo.de

Nullsummenspiele mit simultanen Zügen ¨Uberblick Ein einfaches ...

Überblick

Mehrere Entscheider agieren simultan, vollständige Information

Nullsummenspiele mit simultanen Zügen

Alle Entscheider müssen gleichzeitig Vorstellungen über Gegner entwickeln

Jetzt: Gleichgewichte sind eindeutig und soziale Präferenzen sind sekundär

v.a. wenn sich Auszahlungen zu Null/Konstante addieren (Nullsummenspiel)

strategische Überlegungen sind dominant (sonst ergeben sich zusätzlich

strategische und soziale Koordinationsprobleme – kommt später)

Yves Breitmoser, EUV Frankfurt (Oder)

Themen

Ratespiele, Strategische Dominanz, Nash-Gleichgewicht

gemischte Strategien, Quantal-response Gleichgewichte, Level-k

Matching pennies, gemischte Gleichgewichte, Existenz

Zusammenhang Beliefs und Strategien

1

Ein einfaches Ratespiel

Ratespiel

Jeder von Ihnen tippt eine Zahl aus dem Interval [0, 100]. Jede reelle Zahl

ist erlaubt, einschliesslich der Intervalgrenzen. Von allen Tipps berechnen

wir dann den Durchschnitt x und multiplizieren den mit 2/3. Die Person,

deren Tipp am nächsten an diesem Wert 2/3 · x ist, gewinnt.

Notieren Sie bitte Ihre Tipps.

Was haben Sie sich dabei gedacht?

2

Beauty Contests

Das strategische Problem:

Es gewinnt der, der am besten die Tipps der anderen vorhersagt

Bzw. der, der am besten vorhersagt, was die anderen vorhersagen

Oder noch eine Stufe weiter?

Keynes bezeichnete dieses Spiel als “Beauty Contest”

Es ähnelt Preisauschreiben wie “Tor des Monats”, wo unter allen

Teilnehmern, die auf den Sieger tippten, ein Preis verlost wird

Wenn man gewinnen möchte, sollte man nicht auf den eigenen Favoriten

tippen, sondern auf das, was man für den Favoriten der Mehrheit hält

Bzw. auf das, was man glaubt, was die Mehrheit für den Favoriten der

Mehrheit hält

Ähnliche Probleme bspw. in Auktionen oder auf Aktienmärkten

Es geht nicht darum, was man selbst für richtig hält, sondern was die

anderen für richtig halten

Oder was man glaubt, was die Mehrheit glaubt, was die anderen für richtig

halten

3


Schrittweises Denken und Denktiefe

Gibt es solches “schrittweises” Denken? Kann man das in den Daten

erkennen? Woran könnte man Denkschritte erkennen?

Konkret: Wie kann man die Denkschritte in Zahlen (“Tipps”) ausdrücken

Es gewinnt der, der am besten die Tipps der anderen vorhersagt

Bzw. der, der am besten vorhersagt, was die anderen vorhersagen, was die

Tipps der anderen wären, usw.

Die Stufen haben keinen Anfang, sie sind zirkulär

Jeder gehört zu den “anderen” aus Sicht der “anderen”

Worauf wir uns vielleicht einigen können: Jeder, der einen Tipp abgibt,

hat eine grobe Vorstellung über das Verhalten der anderen, und

versucht, einen dazu passenden Tipp abzugeben

Formalisierung

1. Jeder hat eine grobe Vorstellung über das Verhalten der anderen

Formal “Belief”: subjektive Wahrscheinlichkeiten über deren Strategien

2. Jeder versucht, einen zu seinem Belief passenden Tipp abzugeben

Formal: eine gute oder beste Antwort auf seinen Belief

Angenommen das stimmt. Dann ergeben sich folgende Fragen:

Sind alle Beliefs richtig? (= Gleichgewicht)

Falls nicht, haben zumindest alle die gleichen falschen Beliefs?

Woher kommen dann die Beliefs, bzw. wie werden sie geformt?

Wählen alle Personen die besten Antworten auf ihre Beliefs?

Falls nicht, können wir die Fehler darstellen und quantifizieren?

Antworten: Nein; Könnte sein; Schwer zu sagen; Nein; Einigermaßen.

4

5

Richtige Beliefs + Beste Antworten = Nash-Ggw

Betrachten wir ein diskretes Ratespiel: Spieler i = 1, . . . , n wählen aus den

Aktionen A i = {0, 1, . . . , 100}

Strategie

Eine Strategie σ i ist eine Wahrscheinlichkeitsverteilung über die eigenen

Aktionen a i ∈ A i . Hier ist σ i (a i ) die Wahrscheinlichkeit, mit der man a i

wählt. Die Summe aller Wahrscheinlichkeiten ist 1: ∑ a i ∈A i

σ i (a i ) = 1.

Liste gegnerischer Strategien: σ −i = (σ 1 , . . . , σ i−1 , σ i+1 , . . . , σ n )

Erwartete Auszahlung von σ i gegen σ −i sei π i (σ i , σ −i )

Richtige Beliefs: Man kennt/ahnt die Strategie der anderen

Nash-Gleichgewicht

Ein Strategieprofil σ = (σ 1 , . . . , σ n ) ist ein Nash-Ggw, wenn für alle Spieler

i gilt: σ i ist eine beste Antwort auf σ −i : σ i ∈ arg max σ


i

π i (σ ′ i , σ −i).

Eigenschaften der Nash-Gleichgewichte

Reines Gleichgewicht Alle Spieler wählen eine ihrer Aktionen mit

Wahrscheinlichkeit 1

Gemischtes Gleichgewicht Mindestens ein Spieler “randomisiert”

Im diskreten Ratespiel mit n > 3: Es gibt zwei (reine) Nash-Ggws

Alle wählen 0 (mit Wahrscheinlichkeit 1)

Alle wählen 1 (bzw. die kleinste Zahl größer als 0)

Allgemeine Eigenschaften von Nash-Gleichgewichten

Mindestens ein Nash-Gleichgewicht existiert immer; das kann gemischt sein

Die Anzahl der Nash-Gleichgewichte ist “fast immer” ungerade

Wenn man mischt (randomisiert), dann muss man indifferent zwischen den

Aktionen sein, über die man randomisiert (sonst würde man die bessere

Strategie immer wählen)

Da indifferent, gibt es keinen Grund, genau wie im Ggw zu randomisieren

Aber Purifizierbarkeit: Erklärung durch Verhalten in ähnlichen Spielen

6

7


Bosch-Domenech, 1694 THE Montalvo, AMERICAN ECONOMIC REVIEW Nagel, DECEMBER Satorra 2002 (2002)

1. Lab experiments (1-5) 2. Classroom experiments (6,7)

0.16 0.16

0.14 ?

0.14

average: 35.13

I

'

012- a 3 0.12 average: 26.84

0.10 0.10-

C 0.08- D 0.08

_ Z

0.06 0.06

? 0.04- 0.04

0.02- 1!

0o.oo ,l,.l...... t............

,- 0.02

= o.oo, 1t lll, . l . ..., l .......

0 15 22 0 22 33 50 33 50 100 15 100

choices

choices

3. Take-home experiments (8,9) 4. Theorists experiments (10-13)

n 0.16 0.22

.0)


Anwendung der Logit-Gleichgewichte in Ratespielen

Mit illusorischem Clustering: Gegner verteilen sich auf m ≤ n − 1 Cluster

562 Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569

Falsche Beliefs + Beste Antworten = Dominanz

Belief ˜σ −i : die Liste gegnerischer Strategien, mit der i rechnet

Rationalität

Spieler i ist rational, wenn seine Strategie σ i eine beste Antwort auf seinen

Belief ˜σ −i ist. Der Belief ˜σ −i ist hier beliebig.

Gegenseitiges Wissen von Rationaliät

Alle Spieler sind rational und wissen, dass alle Spieler rational sind.

Je höcher λ, desto näher am Nash-Ggw 0

Je höher Cluster-Anzahl m, desto breiter die Verteilung

Mit kleinem m ist das vielleicht eine passende Darestellung der “Masse”

Allgemeinwissen von Rationalität

Alle Spieler sind rational, wissen, dass alle Spieler rational sind, wissen,

dass alle wissen, dass alle rational sind, usw.

12

13

Note: Similarly to Fig. 5, the choice probabilities are rescaled (by taking them to the power of 0.25) to accentuate the effects on the [0, 1] scale. Further,

m = 4intheNImodels.

Fig. 6. QRE and NI predictions.

Anwendung von Rationalität

payoff of choosing x i ∈ X := {0, 0.001, 0.002,...,1} if all opponents play according to the strategy σ ′ ∈ (X), and define

the discrete logit choice probabilities for given λ and m as

Ein rationaler Spieler wählt

σ ( x i |λ,σ ′) = { exp λ · π ( x i |m,σ ′)}/ ∑also Strategien, die beste Antworten sind (auf

{

exp λ · π ( x ′ i |m,σ′)} . (11)

beliebige Beliefs). Das schließt u.a. alle dominierten Strategien aus.

x ′ i ∈X

Dominanz

The quantal response equilibrium is defined as follows. (In the analysis, I will consider mixture models with up to K = 4

such QRE components.)

Strategie σ i dominiert σ

i ′ , wenn sie gegen jede gegnerische Strategie zu

einer höheren Auszahlung führt: π i (σ i , σ −i ) > π i (σ

i ′, σ −i) ∀σ −i .

Definition 3.2 (QRE). Given λ ∈ R + , the QRE choice probabilities σ ∈ (X) satisfy σ = σ (·|λ,σ ).

In p-beauty contests, it seems plausible to assert uniqueness of QREs for moderate λ, but a general result confirming

this assertion is not available. The QREs underlying my analysis are the ones located along the principal branch, which is a

result of using the following simple homotopy method (for more elaborate methods, see Turocy, 2005, 2010). Starting at a

known Im solution Ratespiel: (i.e. the one for λ = 0 initially), I increase λ in steps of at most 0.25, and after each increase of λ, Isolve

for the respective QRE by function iteration. If the function iteration does not converge, the step size is reduced. Thanks to

Stetig, Aktionen aus dem Interval [0, 100]: man sollte nicht 100 wählen

the simplicity of the beauty contest game, this simple method worked well.

Noisy introspection, Diskret, Aktionen in contrast, isaus defined derasMenge follows. {0, . . . , 100}: man sollte nicht 100 wählen

Definition 3.3 (NI). Fix λ ∈ R + , μ ∈[0, 1), and for all k ∈ N 0 define λ k = λ · μ k . The NI choice probabilities are σ 0 , where for

all k 0, σ k = σ (·|λ k , σ k+1 ).

Schwache Dominanz

Strategie σ i dominiert σ

i ′ , wenn sie gegen jede gegnerische Strategie zu

Essentially, NI captures a continuum of subjective beliefs ranging from uniform randomization (μ = 0) to equilibrium

(μ ≈ 1). The unifying idea is that players believe their precision exceeds their opponents’ precision by factor μ −1 , who in

einer schwach

turn believe to be μ

höheren Auszahlung führt, π −1 as precise as their opponents (including me), and i (σso i , σ

on, −i ) ≥ π

consistently i (σ

for an i ′, σ infinite −i) ∀σ

number −i ,

of steps.

Inund the analysis, zu einer I will assume streng a maximum höheren of K Auszahlung = 100 induction steps gegen and μmindestens 0.95. In order toein model σ −i

choices . based on a

larger number of induction steps or larger μ, the equilibrium concept QRE can be adopted virtually without loss.

Fig. 6 illustrates the differences between QRE and noisy introspection for various λ and μ ∈{0.1, 0.3, 0.6, 0.9}. Basically,

QRE distributions have larger variance than NI distributions, and for m 7 and intermediate λ, they exhibit an increasingly

pronounced Im Ratespiel: bimodal shape. alles Thus, über some2/3 players · 100 may play ≈ the 66.67 right ist tail, while schwach other players dominiert play those playing the right

14

Anwendung: Gegenseitiges Wissen von Rationalität

Im Ratespiel: Wenn man weiß, dass alle rational sind, dann kann man

schließen, dass keiner 100 wählen wird.

Im diskreten Ratespiel {0, . . . , 100}: Dann sollte man weder 100 noch 99

wählen.

Aber 98 ist z.B. eine beste Antwort auf den Belief, dass alle Gegner 99

wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität

Mit jeder weiteren Wissensstufe können wir dann eine weitere Zahl

eliminieren, bis schließlich nur noch 0 und 1 übrig sind

Nur 0 und 1 sind “rationalisierbar” (d.h. nach ∞ Stufen noch übrig)

Rationalisierbarkeit

Schritt 1: Eliminiere alle Strategien, die keine besten Antworten sein können

Schritt 2: Eliminiere alle Strategien, die nun keine besten Antworten sein können

. . . usw. Alle Strategien, die am Ende übrig sind, heißen rationalisierbar.

Im stetigen Ratespiel [0, 100]: Keine weiteren Konsequenzen

Bspw. 99.9 ist eine beste Antwort auf den Belief, dass alle Gegner 99.99

wählen, und dieser Belief ist konsistent mit dem Wissen um Rationalität

15


Sind das die ursprünglich angesprochenen

Denkschritte?

Wohl nicht.

In den meisten Experimenten war die Schrittgröße höchstens .01

Damit benötigt man 5000 Schritte, um von 100, über 99.99, 99.98 usw. bis

unter 50 zu kommen

Für die meisten Teilnehmer ist das aber schon nach dem ersten Schritt klar

Dann vielleicht die Schritte aus “schwacher Dominanz”

Schritt 1: 100 · 2/3 ≈ 66.7

Schritt 2: 100 · (2/3) 2 ≈ 44.4

Schritt 3: 100 · (2/3) 3 ≈ 29.6, . . .

Hatte jemand diese Zahlen im Kopf?

Das Level-k Modell

Intuitives Problem des obigen Ansatzes: Zu Beginn betrachtet er alle

Strategien als gleich plausibel

(0, 0, . . . , 0) ist genauso plausible wie (100, . . . , 100)

Diese Vielfalt im ersten Schritt ist das “Worst-Case” Szenario

Unbewusst eliminieren wir aber bestimmte Strategien wie (100, . . . , 100)

schon vor dem ersten Schritt

Idee: Der tatsächliche erste Schritt basiert auf einer Gleichverteilung

Im Durchschnitt wählen die Gegner also 50, die beste Antwort darauf ist ca.

2/3 · 50 = 33

Schritt 2: Angenommen, man glaubt, der durchschnittliche Gegner denkt

auch so, dann sollte ich einen Schritt weiter gehen: Beste Antwort auf 33 ist

2/3 · 33 = 22

Weitere Schritte: 14.81, 9.87, 6.58, . . .

Dies ist das Level-k Modell strategischen Denkens. Hatte jemand diese

Schritte im Kopf?

16

17

Zur Erinnerung: Hier die Daten

1694 THE AMERICAN ECONOMIC REVIEW

DECEMBER 2002

Ist das eine Erklärung?

1. Lab experiments (1-5) 2. Classroom experiments (6,7)

0.16 0.16

0.14 ?

0.14

average: 35.13

I

'

012- a 3 0.12 average: 26.84

0.10 0.10-

C 0.08- D 0.08

_ Z

0.06 0.06

? 0.04- 0.04

0.02- 1!

0o.oo ,l,.l...... t............

,- 0.02

= o.oo, 1t lll, . l . ..., l .......

0 15 22 0 22 33 50 33 50 100 15 100

choices

choices

3. Take-home experiments (8,9) 4. Theorists experiments (10-13)

n 0.16 0.22

.0)


Level-k mit logistischen Fehlern (Logit Level-k)

Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569 561

Rationalisierbarkeit + Logit = Noisy Introspection

Es gibt noch eine weitere Idee: Nicht beste Antwort auf beste Antwort auf

beste Antwort . . . , wie in Rationalisierbarkeit, sondern:

Noisy Introspection

Logit Antwort auf Logit Antwort auf Logit Antwort

wobei jeder glaubt, er hat eine leicht höhere Präzision als die Gegner

Bspw. jeder glaubt, er ist doppelt so präzise wie seine Gegner

Präzision λ verdoppelt sich in jedem Schritt

Rückwärts: Ich habe 100, meine Gegner 50

Jeder Gegner hat 50, glaubt seine Gegner hätten 25

Die mit 25 glauben, ihre Gegner hätten 12.5, usw.

Note: The plots are “proportional” representations of the choice probabilities in the discrete beauty contest with 1001 choices (0, 0.001, 0.002,...,1).

The actual choice probabilities had been taken to the power of 0.25, as they often are very close to zero and hardly visible on a [0, 1] axis.

Die Fig. 5. Level-k predictions for various precision levels (n = 30 and m = n − 1).

Übergänge müssten glatter sein – zumindest die 70% “Rest” orientieren sich

nicht an den Leveln

f i (x i ) = { exp λ k · π(x i |m, f k−1 ) }/ ∫ 1

{ exp λ k · π(˜x i |m, f k−1 ) } d˜x i . (9)

20

Dieses Modell der Noisy Introspection führt zu folgenden Vorhersagen . . .

21

0

The population as a whole is modeled as a finite mixture (McLachlan and Peel, 2000) of K discrete subject types (“components”).

This approach is particularly feasible to describe the discrete structure of iterated reasoning and has therefore

562 become standard practice in level-k andY. related Breitmoser analyses. / Games and Formally, σ k , k ∈ K , denotes the parameter(s) defining type k

and ρ k denotes its relative frequency in the population, with ∑ Economic Behavior 75 (2012) 555–569

Vergleich Logit-Ggw und Noisy ρ k∈K k = 1. The log-likelihood Introspection

of the finite mixture model

(σ k , ρ k ) k∈K given the observations o = (o m) m=1,...,M is

Ergebnis: Was passt am besten?

M∑ ∑

LL(σ ,ρ|o) = ln ρ k · f k (o m|σ k ), (10)

m=1

k0

using f k (x|σ k ) as the density of the level-k strategy. Since the density of a pure strategy approximates infinity, likelihood

and log-likelihood of any “pure” level-k model approximate infinity—for almost all parameterizations—if this pure strategy

is observed at least once. This renders likelihood maximization in continuous beauty contests inadequate, but the continuity

assumption does not seem reasonable in the first place. For subjects picking numbers such as 0.32335 do not seem to

deviate from say 0.323 based on expected payoff calculations. Digits beyond the third one seem to be chosen randomly and

can therefore be rounded off. In the following, I assume that the smallest choice unit is 0.001 and that the strategy set is

{0, 0.001, 0.002,...,1}. Observations off this grid are rounded toward the nearest number on the grid.

Fig. 5 illustrates how the logistic level-k model approaches the original level-k model (Fig. 2) as λ is increased uniformly

for all components (below, I will allow for level-specific precision λ k ). It complements the above analysis—as precision

increases, the peak of level 1 becomes thinner, approaching the cluster at 0.33 observed in the data sets (Fig. 1), but the

distribution of level-2 choices becomes flatter, and thus the overall choice pattern actually diverges from the observations.

Further, a plethora of level-k components would be required to explain the overall distribution of choices, while high-level

concepts as defined next may be able to explain these non-clustered choices jointly, as part of a single component.

The two best-known concepts of high-level reasoning in this context are quantal response equilibrium (QRE, McKelvey

and Palfrey, 1995) and noisy introspection (NI, Goeree and Holt, 2004). The QRE concept considered here is the logit equilibrium,

which adds (extreme-value distributed) utility perturbations to Nash equilibrium, and NI adds utility perturbations

to an iterative concept similar to rationalizability. To define these concepts formally, maintain π(x i|m, σ ′ ) as the expected

Umfangreiche ökonometrische Analyse . . .

Masse der Teilnehmer (70%) wird am besten durch Logit-Ggw (QRE)

erfasst

Die drei Massepunkte:

33 Level-1 oder Noisy Introspection

22 Noisy Introspection (Level 2 oder 3 streng genommen sind anders)

0 QRE oder Noisy Introspection mit hoher Präzision (= Nash-Ggw)

Es gibt hier kein echtes “schrittweises Denken”. Die Hoch-Level-Konzepte

QRE und NI erklären alles bis auf 33 besser, und 33 selbst genauso gut.

Note: Similarly to Fig. 5, the choice probabilities are rescaled (by taking them to the power of 0.25) to accentuate the effects on the [0, 1] scale. Further,

m = 4intheNImodels.

NI-Verteilungen sind etwas spitzer als Logit-Ggw (QRE) Verteilungen

Fig. 6. QRE and NI predictions.

22

payoff of choosing x ∈ X := {0, 0.001, 0.002,...,1} if all opponents play according to the strategy σ ′ ∈ (X), and define

23


566 Y. Breitmoser / Games and Economic Behavior 75 (2012) 555–569

Die Erklärung passt ziemlich gut

Weitere Experimente

Fazit der Ratespiele: Die meisten Teilnehmer haben eine hohe Denktiefe in

folgendem Sinne

Sie spielen eine passende Antwort auf einen Belief

Dieser Belief ist eine verschwommene Vorstellung der Aktionen der anderen;

Bspw. Wahrscheinlichkeitsverteilung, die nicht “einfach” ist (nicht Level-k)

Diese Verteilung lässt sich i.A. ganz gut als Logit-Ggw darstellen (Level ∞),

mit geringer bis mittlerer Präzision

Darauf antworten sie mit ähnlicher oder höherer Präzision

Die Ratespiele sind die bekanntesten Beispiele zur Analyse der Denktiefe

Ähnlich den Diktatorspielen zur Analyse sozialer Präferenzen

Note: The predictions of the models with the “estimated numbers of components” (highest number of components that is not significantly improved upon

at α = 0.1) are plotted on top of the histograms of the respective data set, and the predictions are aggregated to match the bins of the histograms.

The broken line is the kernel estimate labeled “Kernel-0.5” in Fig. 1.

Aber nicht die einzigen Spiele. Hier kommen noch ein paar . . .

Fig. 7. Predictions of the Noisy Introspection models with the estimated numbers of components.

observations around 0.222 is not compatible with level-k if applied strictly (Fig. 2), that this mode or any higher-level

mode are not noticeable in the empirical density estimates (Fig. 1), and that players choosing numbers such as 0.2 seem to

explicitly choose “intermediate” numbers (as reported by Bosch-Domenech et al., 2002). The latter is not compatible with

the level-k idea where players believe to be exactly one step ahead of their opponents, while it is compatible with noisy,

high-level concepts such as quantal response equilibrium and noisy introspection.

The quantitative analysis confirmed the hypothesis (see Tables 1 and 2). The majority of subjects belong to a quantal

response equilibrium component. The remaining subjects distribute across three mass points (around 0.333, 0.222, and at or

near 0) that reflect highly precise responses to specific beliefs. The first two mass points relate intuitively to level-k beliefs,

since they follow from beliefs with means around 0.5 (leading to choices of 0.333 if n is large) and means around 0.333

(leading to choices of 0.222). The latter cannot be explained adequately as level 2, however, even if we allow for logistic

choice. The best response to a belief with mean 0.333 and low variance is not near 0.222, and level-1 choices with high

variance (low precision) do not have mean 0.333. Since modes at 0.222 are compatible with noisy introspection and the

remaining choices (including level 3 and higher) are found to form the QRE component, only the level-1 choices 0.333 are

left to be classified. Level-1 choices are included in many model families as a special case, e.g. level-k, NI, and heterogeneous

QREs (Rogers et al., 2009), which underlines their epistemological robustness in addition to their psychometric relevance

(Georganas et al., 2010). Thus, the underlying question is along which model family rooted in level-1 (the “principle of

insufficient reason”) strategic reasoning develops as it becomes sophisticated. By the above results, this seems to be the

NI family rather than the level-k family. Since the estimated models fit well, with pseudo-R 2 between 0.5 and 0.9, this

conclusion appears robust.

Further research may investigate the robustness of these results with respect to other beauty contest variants (varying

e.g. p) and with respect to related games where level-k reasoning has been shown to improve upon standard models

(such as auctions, L see Crawford and R Iriberri, 2007). Also, one may relax the independence L of irrelevant Ralternatives (IIA)

assumption underlying multinomial logit, as in beauty contests, the choice sets are ordered and can be partitioned into

subsets by iteratively eliminating dominated strategies. If subjects do not ignore such orderedness or partitioning, their

O choices violate (1, IIA0) and can be(0, modeled 1) more accurately using orderedO GEV or nested (5, logit 0) models (0, (see e.g. 1) McFadden,

1984).

Matching-Penny Spiele

Zwei Spieler entscheiden gleichzeitig. Spieler 1 wählt O (oben) oder U

(unten), Spieler 2 wählt L (links) oder R (rechts).

Spieler 1 wählt die Zeile, Spieler 2 wählt die Spalte. Daraus ergibt sich das

Auszahlungsprofil (π 1 , π 2 ), d.h. 1’ Auszahlung ist die erste Zahl.

U (0, 1) (1, 0)

U (0, 1) (1, 0)

Angenommen, Sie sind Spieler 1. Was würden Sie wählen? Und nun?

24

Angenommen, Spieler 2 wählt 50-50. Was würde Spieler 1 machen?

Logit σ 1 (O) =

exp{λ·π 1 (O)}

exp{λ·π 1 (O)}+exp{λ·π 1 (U)}

L

R

O (1, 0) (0, 1)

U (0, 1) (1, 0)

L

R

O (5, 0) (0, 1)

U (0, 1) (1, 0)

Erwartete Auszahlung

π 1 (O) .5 · 1 + .5 · 0 = 0.5 .5 · 5 + .5 · 0 = 2.5

π 1 (U) .5 · 0 + .5 · 1 = 0.5 .5 · 0 + .5 · 1 = 0.5

Logit σ 1 (O)

λ = 0.5

λ = 1

λ = 2

exp{.5·0.5}

exp{.5·0.5}+exp{.5·0.5} = 0.5

exp{1·0.5}

exp{1·0.5}+exp{1·0.5} = 0.5

exp{2·0.5}

exp{2·0.5}+exp{2·0.5} = 0.5

exp{.5·2.5}

exp{.5·2.5}+exp{.5·0.5} = 0.73

exp{1·2.5}

exp{1·2.5}+exp{1·0.5} = 0.88

exp{2·2.5}

exp{2·2.5}+exp{2·0.5} = 0.98

25

Matching-Penny Spiel Spieler sagen gleichzeitig “Kopf” oder “Zahl”;

Spieler 1 gewinnt, wenn beide das gleiche sagen; Spieler 2 gewinnt sonst

26

Spieler 1 würde mit erhöhter W-keit O wählen (im rechten Spiel)

Daher sollte 2 R öfter als 50-50 spielen, woraufhin 1 seltener O spielt

Wo pendelt es sich im Gleichgewicht ein?

27


Nash-Gleichgewichte im Matching-Penny Spiel

L

R

O (x, 0) (0, 1)

U (0, 1) (1, 0)

Es gibt keine reinen Nash-Gleichgewichte, d.h. keine gegenseitig besten

Antworten in reinen Strategien.

Beste Antwort auf O ist R, auf R ist U, auf U ist L, auf L ist O

Es gibt also nur ein gemischtes Ggw, d.h. beide Spieler wählen zufällig.

Man wählt aber nur zufällig, wenn man indifferent ist – der Gegner muss so

mischen, dass man selbst indifferent ist

Bzw. man selbst muss so mischen, dass Gegner indifferent: Damit macht

man es dem Gegner so schwer wie möglich, den “Penny” zu gewinnen

Das gemischte Nash-Gleichgewicht L R

Notation:

σ O

σ L

Wahrscheinlichkeit, dass 1 Aktion O wählt; σ U = 1 − σ O

Wahrscheinlichkeit, dass 2 Aktion L wählt; σ R = 1 − σ L

O (x, 0) (0, 1)

U (0, 1) (1, 0)

Spieler 1 ist indifferent, wenn π 1 (O) = π 1 (U). Daraus ergibt sich für 2:

σ L · x + (1 − σ L ) · 0 = σ L · 0 + (1 − σ L ) · 1 ⇔ σ L = 1

1 + x

Spieler 2 ist indifferent, wenn π 2 (L) = π 2 (R). Daraus ergibt sich für 1:

σ O · 0 + (1 − σ O ) · 1 = σ O · 1 + (1 − σ O ) · 0 ⇔ σ O = 1 2

Spieler 1’ Verhalten sollte unabhängig von x sein, das von 2 nicht

28

29

Ochs (1995)

Drei Spiele: x = 1, x = 9, x = 4

Ergebnisse

Bei x = 1 ist alles wie vorhergesagt (50-

50 Wahrscheinlichkeiten)

Bei x > 1 spielt 2 zwar seltener L (bzw.

A hier), aber noch zu oft

Spieler 1 antizipiert das, ist nicht indifferent

und spielt öfter O (bzw. A hier)

als im Nash-Ggw

Oder anders herum?!

Spieler 1 reagiert auf den eigenen Payoff

(Own Payoff Effect), spielt zu oft O, und

2 antizipiert das, spielt daher öfter R als

im Ggw

Können wir das mit dem Logit-Ggw

erklären?

30

McKelvey, R.D. McKelvey Palfrey et al. / J. of Economic undBehavior Weber & Org. 42 (2000) (2000): 523–548 Passt 525 Logit?

Table 1

Payoff tables for Games A–D

Game A Game B Game C Game D

L R L R L R L R

U 9,0 0,1 9,0 0,4 36,0 0,4 4,0 0,1

D 0,1 1,0 0,4 1,0 0,4 4,0 0,1 1,0

Die Nash-Ggw sind:

2. Payoff magnitude effects and quantal response equilibria

Games A, B, C: Oben (Up) mit σ 1 = 1/2, Links mit σ 2 = 1/10

The (Sie Quantal sind strategisch Response model äquivalent, incorporates daerror nur into die the Auszahlungen best responseeines of players oderinbeider a Spieler mit

game.

einer

Thus,

Konstante

the perfectly

multipliziert

rational model

werden)

of choice usually assumed to govern players’

actions is replaced by a probabilistic one where better responses are more likely to be

Game D: Oben (Up) mit σ

played, but no action is played with certainty. 1 = 1/2, Links mit σ 2 = 1/5

The logistic specification of the QRE, which we use here, measures error in terms of

a precision parameter, λ, which is inversely related to the variance of the error. 5 If the

expected utility to strategy j for agent i is denoted by u ij , then the probability that i will use

Im Logit-Ggw: Spieler antizipieren Fehler gegenseitig

strategy j is given by the Logit formula

Hypothese Es ist Logit-Ggw

zu oft “Up”, Logit-Antwort (≠ beste Antwort) ⇒ zu oft L ⇒ zu oft “Up”

Test: Wenn eλuij

Logit, dann sollte die Payoff-Magnitude relevant sein

p ij = ∑k ,

eλuik

where k runs over the available strategies for agent i.Ifλ=0, then players are exp{λ·π acting entirely 2 (L)}

randomly (i.e. completely unresponsive to payoffs), while for λ=∞, exp{λ·π players’ 2 (L)}+exp{λ·π actions are 2 (R)}

equivalent In B towurde perfect expected 2’s Auszahlungen utility maximizing mit behavior. 4 multipliziert

Table Bei1 Logit presentsist the games das identisch studied in this zur paper. Multiplikation Game A is the same der as Präzision a payoff matrix λ mit 4

studied recently by Ochs (1995). Games B and C are variations of Game A which only

involve payoff magnitude changes. In Game B, the column player’s payoffs of Game A are

multiplied by a factor of 4. In Game C, both the row and the column player’s payoffs of

Beispiel Game A vs. Game B bei σ 2 (L) =

Spieler 2 sollte daher dichter am Nash-Gleichgewicht σ 2 (L) = 1/10 sein

31


for each of the games. At this very high level of aggregation, the effects of varying payoff

magnitude 2 do not appear B to be particularly 0.647 strong, and therefore, 0.237 provide at most weak 300

A 0.623 0.243 300

support of the hypotheses. Increasing the column players’ payoffs from Game A to Game

Ergebnisse

B3 has little effect R.D. onMcKelvey theBbehavior et al. / J. of Economic those players, 0.607 Behavior but & Org. it appears 42 (2000) 0.363 to523–548 make the row players 300 525

C 0.570 0.393 300

somewhat less likely to play action U. The latter is predicted by the payoff magnitude

Table 1

hypotheses. 4

Payoff tables for Increasing Games A–Dthe C row players’ payoffs 0.623in Game C appears 0.163to have the effect300

of

decreasing the frequencyB of the action U and0.693 decreasing that of action 0.180 L. The latter effect 300

Game A Game B Game C Game D

is 5 consistent with the hypothesis, A but the former 0.623one is not. The effects 0.187 of altering payoff 300

L R L R L R L R

magnitude vary within the C individual sessions. 0.590 Finally, notice that0.197 for none of the games 300 is

Uit 6 the case9,0 that the observed 0,1 C behavior 9,0 corresponds 0,4 0.593to that 36,0 predicted0,4 0.273 by the Nash 4,0equilibrium.

0,1 300

D 0,1 1,0 A 0,4 1,0 0.607 0,4 4,0 0.223 0,1 1,0 300

7 A 0.640 0.230 300

Table 3

D 0.457 0.313 300

2. Experimental Payoff magnitude results by session effects and game and quantal response equilibria

8 D 0.643 0.343 300

Session Game

A

U

0.683

L

0.243

n

300

The Quantal Response model incorporates error into the best response of players in a

1Aggregate A 0.680 0.643 0.317 0.241 1800 300

game. Thus, the perfectly rational model of choice usually assumed to govern players’

B 0.573 0.630 0.197 0.244 1200 300

actions is replaced by a probabilistic one where better responses are more likely to be

2 BC 0.647 0.594 0.237 0.257 1200 300

played, but no action is played AD with certainty. 0.623 0.550 0.243 0.328 300 600

The logistic specification of the QRE, which we use here, measures error in terms of

3 B 0.607 0.363

a precision parameter, λ, which is inversely related to the variance of the error. 5 300

If the

C 0.570 0.393 300

Die expected Nash-Ggw utility to strategy sind: j for agent i is denoted by u ij , then the probability that i will use

4 C 0.623 0.163 300

strategy j is given by the Logit formula

Games A, B, C: BOben (Up) mit σ 0.693 = 1/2, Links mit 0.180 σ = 1/10 300

5 Game p ij = D:

∑k eλuij Oben , (Up) A mit σ = 1/2, 0.623 Links mit σ = 0.187 1/5

300

eλuik C 0.590 0.197 300

6 C 0.593 0.273 300

Ergebnisse

where k runs over the available A strategies for agent 0.607 i.Ifλ=0, then players 0.223 are acting entirely 300

randomly (i.e. completely unresponsive to payoffs), while for λ=∞, players’ actions are

7 A 0.640 0.230 300

equivalent Fehlverhalten to perfect expected Dwie bei utilityOchs: maximizing 0.457

zu oft behavior. “Up”, zu

0.313

oft “L”

300

Table 1 presents the games studied in this paper. Game A is the same as a payoff matrix

8 Payoff-Magnitude D ist praktisch 0.643irrelevant

0.343 300

studied recently by Ochs A (1995). Games B and 0.683C are variations0.243 of Game A which only 300

involve payoff magnitude changes. In Game B, the column player’s payoffs of Game A are

Aggregate A 0.643 0.241 1800

multiplied by a factor of 4. In Game C, both the row and the column player’s payoffs of

B 0.630 0.244 1200

Game A are multiplied by C a factor of 4. Game0.594 D was included primarily 0.257 as a replication 1200 of

Ochs (1995) study. D 0.550 0.328 600

VOL 98 NO 3 All SELTEN four AND games CHMURA haveSTATIONARY

unique mixed CONCEPTS strategy FOR EXPERIMENTAL Nash equilibria. 2X2-GAMES Since Nash 951 equilibria are

insensitive to positive affine transformations in the payoffs, they are identical for Games

Selten A, B, and C. und Constant Letting sum pChmura games denote the probability (2008)

Nonconstant the row sum player games chooses U and q denote the

probability the column player chooses L, these equilibrium probabilities are p ∗ =0.5 and

q ∗ 10

10

=0.1. For Game D, the Nash equilibrium is at p ∗ =0.5 and q ∗ =0.2. Thus, the predictions

of Nash equilibrium are easily

18

summarized: 6 12

22

(i) in all games, the row players’ choice

Game 1

Game 7

10

14

5 For a formal and more detailed explanation of QRE, see McKelvey and Palfrey (1995, 1996, 1998). Those

papers also provide discussion about the conceptual interpretation of λ.

6 This actually glosses over a subtle issue of multiple equilibria that arises due to the experimental protocol.

Consider an experiment with 16 subjects (eight row and eight column), where subjects are randomly repaired with

a newSpieler opponent every 1 wählt time they replay Zeile 13 the game. (O oder This creates U) many new equilibria. 16 For example, having four of

Game the row 2

Game 8

players always play U and the other four row players always 11 play D is not inconsistent with equilibrium,

since, Spieler from the column 2 wählt players’ point Spalte of view, (L this isoder indistinguishable R) from all eight of the players independently

randomizing 50/50 between U and D. There are a continuum of multiple equilibria of this sort. However, aggregate

choice frequencies are the same in all such equilibria.

Game 4

Auszahlung von Spieler 1 ist links oben, die von 2 rechts unten

14

17

Frage Game 3 Sind O und L unterschiedlich Game 9 häufig in den Spielen?

10

13

Wenn Nash oder Logit-Ggw, dann nicht

Bei Logit gilt ja additive Separierbarkeit (nur Differenzen zählen)

σ 1 (O) =

11

Game 10

11

Game 5 In Game 7 wurde zu Game 1’ Auszahlung 11 von O und U (bei R) jeweils 4 addiert

10

13

exp{λ · π 1 (O)}

exp{λ · π 1 (O)} + exp{λ · π 1 (U)} = 1

1 + exp{λ · (π 1 (U) − π 1 (O))}

Differenz π 1 (U) − π 1 (O) bleibt konstant, Logit-Ggw daher auch

32

34

Goeree, Holt und Palfrey (2003): Neue Analyse

Weder Nash- noch Logit-Gleichgewichte passen hier

Gegen Nash-Ggw spricht der “Own Payoff Effect”

Logit Ggw erklärt “Own Payoff Effect” ganz gut,

aber gegen Logit spricht der fehlende “Payoff Magnitude Effect”

These: Was noch fehlt, ist Risiko-Aversion

Abnutzender Grenznutzen des Geldes Schwächung der Payoff-Magnitude

Ökonometrische Analyse bestätigt: So passt Logit sehr gut zu den Daten,

J.K. Goeree et al. / Games and Economic Behavior 45 (2003) 97–113 105

mit konstanten, plausiblen Risiko-Aversions-Maßen in allen Fällen

Table 3

Maximum likelihood estimates; asymptotic standard errors in parentheses

Experiment r µ p R (obs) p R (pred) p U (obs) p U (pred) Log L

(# observations)

Games 1–3 0.42 0.010 0.50 0.50 0.50 0.50 −2071.9

(Ochs, 1995) (0.06) (0.003) 0.66 0.66 0.54 0.56 (1560)

0.74 0.74 0.60 0.59

Game 4 0.44 0.150 0.35 0.35 0.47 0.47 −455.8

(this paper) (0.07) (0.060) (340)

Games A–D 0.42 0.039 0.77 0.74 0.64 0.65 −5898.8

(McKelvey et al., 2000) (0.02) (0.004) 0.76 0.76 0.63 0.57 (4800)

0.75 0.77 0.59 0.58

0.68 0.65 0.55 0.59

Game 4. Asymptotic standard errors are in parenthesis, and indicate that r is significantly

different from one (risk neutrality) and µ is significantly different from zero (no error).

Thus both error and risk aversion are significant components for explaining deviations

Selten

fromund the minimax

Chmura

strategies of his(2008), game. 7

vollständig

VOL 98 NO 3 SELTEN AND CHMURA STATIONARY

Note that the risk aversion estimate for the Ochs (1995) data is virtually identical

to the other risk aversion estimates in the table. 8 This suggests Constant that sum games the binary lottery

procedure failed to induce risk neutrality. While the risk aversion

10

estimates are stable, 10

the error parameter estimates are not, which we conjecture to be caused by differences 18 in

Game 1

Game 7

10

Insgesamt payoff 6 scales, × 2 Spiele subject pools, and procedures. For example, some sessions were done by

hand and others were computerized. Furthermore, subjects in Ochs’ experiments played

the mixed extension of the game. Another relevant factor is the scale and normalization

Links Sechs

of payoffs.

Konstant-Summen-Spiele

For instance, the estimated error parameter would be 100 times 13 as high when

Game 2

Game 8

(strategisch payoffs äquival. are measured zu Nullsummenspielen)

in pennies instead of dollars. We attempted to construct comparable

payoff measures, but the appropriate normalizations become less obvious when payoffs

are in lottery tickets (as in Ochs, 1995) or when only one out of ten decisions is selected

Rechts Sechs Nicht-Konst-Sum-Spiele

ex post to determine earnings, as in our lottery choice experiment discussed below. 14

Game 3

Game 9

10

(Beste Antworten We also estimate äquiv. thezuquantal Links, response Addition model for the four matching pennies games in

von Konstanten McKelvey et zual. Auszahlungen: (2000); see Appendix zu BSpieler

for game payoffs and aggregate results. The third

1 wenn 2 R spielt, zu 2 wenn 1 O spielt)

11

7 Game 4

Game 10

Observed autocorrelation in some people’s decisions might be due to heterogeneity in individual risk

Dies sollte

attitudes.

hat

Onekeinen can accommodate

Einfluss

such heterogeneity

auf Vorhersagen

von Therefore, Nash a system undof simultaneous Logit haben equations has to be solved to determine the likelihood function for each

by specifying a random effects model, which requires that

there be a separate choice probability for each possible draw from the distribution of risk aversion parameters.

iteration over the parameter space, which includes an error parameter Game and the 5 mean and variance of theGame distribution 11

of risk aversion parameters. We estimated such a model for Game 4 and the estimated mean and variance of the

Es hat risk aber aversion Einfluss distributionauf are 0.55 Vorhersagen and 0.40, respectively. des

8 Pooling the data from all the experiments in Table 3 and imposing a common risk aversion parameter yields

Konzeptes

estimated

der

error

Autoren

parameters of

(Impulse-Balance-

µ = 0.010 (0.002) in Games 1–3, µ = 0.139 (0.047) in Game 4, µ = 0.039 (0.004)

Ggw) – inpasst Games A–D es and besser? the estimated risk parameter is r = 0.42 (0.01). Game The

6

Game 12

loglikelihood is −8426.6, which is

virtually identical to the sum of the three loglikelihoods in Table 3: −8426.5. Hence, one cannot reject the

hypothesis that the risk aversion parameter is constant across the games in Table 3.

33

CONCEPTS FOR EXPERIMENTAL 2X2-GAMES 951

Nonconstant sum games

12

22

14

16

11

17

13

13

11

10

10

U up D down

L left R right

Player 1 's payoff in the uppeMeft corner

Player 2's payoff in the lower-right corner

35


Ergebnisse (nach Brunner, Camerer, Goeree, 2011)

VOL. 101 NO. 2

p(left)

1.0

0.9

0.8

0.7

0.6

0.5

1.0

0.9

0.8

0.7

0.6

0.5

Q

Brunner ET Al.: Stationary Concepts: Comment

Game 1 Game 2 Game 3

Game 4 Game 5 Game 6

0 0.1 0.2 0.3 0.4 0.5 0 0.1 0.2 0.3 0.4 0.5 0 0.1 0.2 0.3 0.4 0.5

p(up)

Nash

QRE

Action-sampling

Payoff-sampling

Impulse balance

Observation

0.035

0.03

0.025

0.02

0.015

0.01

0.005

0

Figure 2. Visualization of the Theoretical Equilibria and the

Observed Average in the Constant Sum Games (cf. SC 2008, Figure 8)

Sampling variance S

Theory specific component T

Nash QRE Payoff−s. Action−s. Impulse−b.

Figure 3. Overall Mean Squared Distances of the Five Stationary Concepts

Compared to the Observed Average (cf. SC 2008, Figure 12)

(correcting their Figure 12). It is notable that all models fit substantially better in

the last block than in the first block, as one would hope for reasonable concepts of

stationary behavior (which are not necessarily designed to explain early behavior).

It is also the case that impulse balance equilibrium is the best model in the first

block of 100 periods, the worst in the second block of 100 periods, and is best using

Die geschätzten Präzisionsparameter

1033

Oben Darstellung der Vorhersagen

und der empirischen Ergebnisse

Unten Darstellung der mittleren

Abweichungen der Konzepte

Unterschiede zwischen Konzepten

sind insignifikant und unerheblich

In anderen Spielen muss auch

Risiko-/Verlustaversion berücksichtigt

werden, aber insgesamt

passt Logit-Ggw (QRE) gut

36

Weizsäcker (2003)

Hypothese Wahrheit liegt zwischen QRE und Level-1

QRE: Gegner sind genauso präzise wie ich;

Level-1: Gegner agieren rein zuällig

Asymmetric Logit Ggw (ALE): Gegner sind weniger präzise als ich, aber

nicht rein zufällig (sie haben Präzision ˜λ mit 0 < ˜λ < λ)

Jeder spielt ein subjektives Ggw, gegen Gegner mit geringer Präzision

Daten Von insgesamt 22 Spielen (2 × 2, 2 × 3, 3 × 3) aus drei

vorhergehenden Experimenten

Stahl und Wilson (1994, 1995), Costa-Gomes, Crawford und Broseta (2001)

Hauptergebnisse

Hypothese bestätigt: Teilnehmer ignorieren Anreize der Gegner weitgehend,

sie betrachten nur die eigenen Anreize (Asymmetrie)

Strenge Gleichgewichts-Annahme passt hier nicht

Vergleich “Random-Utility” (Logit, bzw. ALE) mit “Noisy-Nash”

(Nash-Ggw plus Fehler) zeigt, dass Logit-Ansatz die Fehler gut erfasst

Costa-Gomes and Weizsäcker (2008)

37

Durchschnittliche eigene Präzision: λ = 4.08

Durschnittliche angenommene Präzision für Gegner: ˜λ = 2.18

Verteilung der Präzisionsparameter

158 G. Weizsäcker / Games and Economic Behavior 44 (2003) 145–171

14 Spiele mit eindeutigen Nash-Ggws

3×3 Spiele für erhöhte Komplexität und Variation

( erlaubt präzisere Analyse)

Manche Spiele Dominanz-lösbar, verschiedene

Konzepte mit unterschiedlichen

Vorhersagen

734 REVIEW OF ECONOMIC STUDIES

736 REVIEW OF ECONOMIC STUDIES

TABLE 1

Games classified by strategic structure and models’ predicted actions

Game Dominance Rounds of Nash Naïve L2 D1 Optimistic

solvable dominance L 1

(a)

Fig. 3. Estimated densities of ALE parameters using pooled data. (a) Depicts the estimated density f γ (λ i | ρ,K);

(b) the estimated density f γ (˜λ j |˜ρ, ˜K).

(b)

#1 Y 2,3 T-L M-L T-M T-L B-M

#2 Y 3,2 M-L M-M T-L M-L T-R

#3 Y 2,3 B-R T-M B-M B-M M-M

#4 Y 3,2 M-M T-L T-M T-M T-R

#5 Y 2,3 T-M B-L T-L T-L M-L

#6 Y 3,2 B-M M-R M-M M-M M-L

#7 Y 2,3 M-R B-R M-R M-R T-M

#8 Y 3,2 B-R B-L B-R B-R T-M

#9 Y 3,4 T-R T-L M-R T-M M-L

#10 Y 4,3 B-L T-L B-M M-L T-M

#11 N –,– M-M B-M M-R B-M T-L

#12 N –,– B-L M-R M-M M-R T-L

#13 N –,– T-R T-M B-R T-M M-L

#14 N –,– T-L B-M M-M B-M T-R

Note:

The games are ordered as in Table 1, but with decisions ordered as they appeared to the

subjects; the equilibrium is identified by underlining its pay-offs.

38

of each of their decisions, enabling them to infer their opponents’ choices. This feature simplifies

our data analysis because subjects could not condition their decisions in the course of a session

on the outcomes of previous decisions.

The subjects were paid according to their action choice in one randomly chosen game, at a

FIGURE 1

Games

39


14 0·41 0·47 0·21 0·25

Average 0·30 0·33 0·20 0·25

Note: Feasible range is [0, 2].

Überblick über Aktionen und Beliefs

744 REVIEW OF ECONOMIC STUDIES

Analyse der Aktionen

NE Nash-Ggw; L1 Level 1; D1 Level 1 nach Elim. Domin. Strats; L2 Level 2;

Opt. Optimistic (Gegner spielt die Strategie, die mir am besten passen würde);

LE Logit-Ggw; ALE Asymmetric Logit-Ggw; NI Noisy Introspection

c○ 2008 The Review of Economic Studies Limited

FIGURE 3

Action frequencies and average belief statements (pooled across treatments and isomorphic player roles, numbering

according to Row player’s perspective)

c○ 2008 The Review of Economic Studies Limited

FIGURE 4

(a) Empirical p.d.f. and (b) empirical c.d.f. of number of subjects with x best-responses to stated first-order beliefs

decision-making processes, either when they choose their actions or when they state their beliefs.

The observed inconsistencies may or may not be statistically significant, once the noise is

Links Allgemeine Verteilung von Aktionen und appropriately Beliefs. taken into account. The structural approach in Section 4 will show that when this

is done most deviations are indeed significant.

How much does it cost subjects that their actions and stated beliefs are not consistent with

Rechts Häufigkeit von Aktionen, die Beste Antworten auf die eigenen Beliefs sind.

each other? We address this issue by two sets of calculations. First, we simulate the subjectively

expected losses, by taking the subjects’ stated beliefs as their “true” underlying beliefs. Under

this simplifying assumption (which we avoid elsewhere in the paper, but which is convenient

TABLE 9

for our purposes here), we can measure the losses that the subjects would have to expect from

Ergebnis Weit verteilte Aktionen Estimates of und low-parameter Beliefs, models using their

50% actionchoices, data derrelative Teilnehmer

to the actions that are thespielen best responses toin their stated

50%

beliefs.

Second, we determine the ex post realized losses, by asking whether changing their actions to

NE L1 D1 L2 Opt. best responses to their LEown stated beliefs would ALE actually have increased their earnings, NI given the

der Spielen Beste Antworten auf die eigenen Beliefs

(ex ante unknown) observed behaviour of their opponents.

A1

1A

λ a

0·60

0·53

ln L

−611·66

−643·01

λ a

6·13

7·60

ln L

−541·90

−540·90

λ a

3·73

3·53

ln L

−571·94

−602·03

λ a

1·31

1·46

ln L

−593·08

−618·89

λ a

0·65

0·90

ln L First consider λ a the subjectively ln L expected λ a ˜λa losses, which ln Leach subject λ a could calculatelnbyL

asking

the question “By how much is my action in a given game a suboptimal response to my stated belief

in the same 3·34game?” −565·87 Notice that for 6·13 each0·00 subject−541·90 and in each game, 6·48 these1·17 losses have −539·11 an upper

−607·91

−628·22 bound that is 3·73 a function −581·18 of the belief 7·65 that the 0·00subject −540·83 states and of 7·65 the set 0·69 of possible −539·75 pay-offs

1A1A 0·75 −699·82 7·09 −602·36 3·84 −652·99 1·49 −676·66 0·84 −694·96 3·87 −637·33 7·10 0·00 −602·35 7·23 1·01 −599·56

The of

1AQ 1·00 −680·15 6·27 −609·69 3·60 −644·64 2·26 −629·39 0·59

c○ 2008

−685·05

Review

4·81

Economic Studies

−585·98

Limited

8·41 0·70 −555·18 8·93 2·21 −542·35

1A1AC 0·57 −672·97 7·85 −556·83 3·48 −633·05 1·34 −652·37 0·59 −669·99 3·34 −625·96 5·94 0·00 −603·99 6·10 1·27 −600·33

Pooled 0·69 −3310·02 6·99 −2855·22 3·63 −3105·03 1·57 −3177·03 0·71 −3288·29 3·88 −3005·67 7·01 0·00 −2853·47 7·19 1·25 −2832·80

ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.

Analyse der Beliefs

TABLE 10

Estimates of low-parameter models using belief statement data

NE L1 D1 L2 Opt. LE ALE NI

λ bs ln L λ bs ln L λ bs ln L λ bs ln L λ bs ln L λ a λ bs ln L λ a ˜λa λ bs ln L λ a ˜λa λ bs ln L

A1 0·00 −4769·63 0·00 −4769·63 0·00 −4769·63 0·18 −4717·64 0·00 −4769·63 7·59 0·00 −4769·63 0·00 28·20 0·20 −4716·89 87·19 20·06 0·20 −4748·54

1A 0·00 −5008·11 0·00 −5008·11 0·04 −5007·74 0·23 −4924·41 0·00 −5008·11 8·08 0·11 −5000·79 0·00 21·70 0·28 −4921·45 76·76 18·42 0·35 −4943·00

1A1A 0·00 −5485·07 0·00 −5485·07 0·00 −5485·07 0·22 −5402·75 0·00 −5485·07 9·02 0·00 −5483·38 0·03 40·10 0·22 −5402·56 96·65 24·17 0·26 −5443·67

1AQ 0·00 −5365·83 0·00 −5365·83 0·00 −5365·83 0·29 −5233·33 0·00 −5365·83 8·09 0·18 −5348·37 0·07 27·22 0·32 −5230·81 75·33 18·65 0·41 −5273·67

1A1AC 0·00 −5246·59 0·00 −5246·59 0·10 −5243·82 0·20 −5177·45 0·00 −5246·59 8·29 0·06 −5244·40 0·00 28·76 0.22 −5176·13 62·49 15·47 0·26 −5205·22

Pooled 0·00 −25875·2 0·00 −25875·2 0·00 −25875·2 0·22 −25464·6 0·00 −25875·2 8·09 0·07 −25860·9 0·00 28·76 0·24 −25458·6 79·79 19·64 0·29 −25630·0

ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2, Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.

Ergebnis ALE und L2 passen am besten, NI geht noch, Rest passt nicht

Fazit: Aktionen sind L1, Beliefs sind L2; ALE passt insgesamt

Wahl einer Aktion: Wenig Hineinversetzen in Gegner, Ignorieren seiner

Anreize, Annahme Gegner randomisiert fast gleichförmig

Wahl eines Beliefs: ≈ Wahl einer Aktion aus seinen Augen (wenig

Hineinversetzen in mich, ignorieren meiner Anreize)

Insgesamt konsistent, aber nicht rational: Die abgefragten Beliefs passen

nicht zu den Beliefs, die implizit meine Aktionen rechtfertigen

756 REVIEW OF ECONOMIC STUDIES

40

c○ 2008 The Review of Economic Studies Limited

TABLE 9

Estimates of low-parameter models using action data

NE L1 D1 L2 Opt. LE ALE NI

λ a ln L λ a ln L λ a ln L λ a ln L λ a ln L λ a ln L λ a ˜λa ln L λ a ˜λa ln L

A1 0·60 −611·66 6·13 −541·90 3·73 −571·94 1·31 −593·08 0·65 −607·91 3·34 −565·87 6·13 0·00 −541·90 6·48 1·17 −539·11

1A 0·53 −643·01 7·60 −540·90 3·53 −602·03 1·46 −618·89 0·90 −628·22 3·73 −581·18 7·65 0·00 −540·83 7·65 0·69 −539·75

1A1A 0·75 −699·82 7·09 −602·36 3·84 −652·99 1·49 −676·66 0·84 −694·96 3·87 −637·33 7·10 0·00 −602·35 7·23 1·01 −599·56

1AQ 1·00 −680·15 6·27 −609·69 3·60 −644·64 2·26 −629·39 0·59 −685·05 4·81 −585·98 8·41 0·70 −555·18 8·93 2·21 −542·35

1A1AC 0·57 −672·97 7·85 −556·83 3·48 −633·05 1·34 −652·37 0·59 −669·99 3·34 −625·96 5·94 0·00 −603·99 6·10 1·27 −600·33

Pooled 0·69 −3310·02 6·99 −2855·22 3·63 −3105·03 1·57 −3177·03 0·71 −3288·29 3·88 −3005·67 7·01 0·00 −2853·47 7·19 1·25 −2832·80

ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2 Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.

Ergebnis NI passt leicht besser als ALE und L1, Rest passt nicht

TABLE 10

Estimates of low-parameter models using belief statement data

Verbal NE Teilnehmer L1 spielen D1 rechtL2 präziseOpt. Antwort LEauf recht “verwaschene” ALE NI Beliefs

λ bs ln L λ bs ln L λ bs ln L λ bs ln L λ bs ln L λ a λ bs ln L λ a ˜λa λ bs ln L λ a ˜λa λ bs ln L

(d.h. Beliefs nahe Gleichverteilung), Bestätigung von Weizsäcker (2003)

A1 0·00 −4769·63 0·00 −4769·63 0·00 −4769·63 0·18 −4717·64 0·00 −4769·63 7·59 0·00 −4769·63 0·00 28·20 0·20 −4716·89 87·19 20·06 0·20 −4748·54

1A 0·00 −5008·11 0·00 −5008·11 0·04 −5007·74 0·23 −4924·41 0·00 −5008·11 8·08 0·11 −5000·79 0·00 21·70 0·28 −4921·45 76·76 18·42 0·35 −4943·00

1A1A 0·00 −5485·07 0·00 −5485·07 0·00 −5485·07 0·22 −5402·75 0·00 −5485·07 9·02 0·00 −5483·38 0·03 40·10 0·22 −5402·56 96·65 24·17 0·26 −5443·67

1AQ 0·00 −5365·83 0·00 −5365·83 0·00 −5365·83 0·29 −5233·33 0·00 −5365·83 8·09 0·18 −5348·37 0·07 27·22 0·32 −5230·81 75·33 18·65 0·41 −5273·67

1A1AC 0·00 −5246·59 0·00 −5246·59 0·10 −5243·82 0·20 −5177·45 0·00 −5246·59 8·29 0·06 −5244·40 0·00 28·76 0.22 −5176·13 62·49 15·47 0·26 −5205·22

Pooled 0·00 −25875·2 0·00 −25875·2 0·00 −25875·2 0·22 −25464·6 0·00 −25875·2 8·09 0·07 −25860·9 0·00 28·76 0·24 −25458·6 79·79 19·64 0·29 −25630·0

ALE, Asymmetric Logit Equilibrium; L1, Level-1; L2, Level-2; LE, Logit Equilibrium; NE, Nash equilibrium, NI, Noisy Introspection; Opt., Optimistic.

Zusammenfassung

Menschen spielen keine Nash-Gleichgewichte

Zufällige Abweichungen (logistische Fehler, zufälliger Nutzen)

Systematische Abweichungen

Wesentliche systematische Abweichung: Menschen

unterschätzen/ignorieren die Anreize Anderer

Sie haben ein vereinfachtes Modell der Entscheidungen anderer im Kopf,

insgesamt stark verrauschte Beliefs, teils nahe Gleichverteilung

Menschen reagieren jedoch auf Änderung eigener Anreize

Passend sind bspw. Asymmetric Logit Equilibrium und Noisy Introspection

Präzision und Asymmetrie schwanken recht stark zwischen Spielen und

zwischen Menschen Vorhersagen und robuste Anwendung schwierig

Noch lange kein Konsens in der Literatur

756 REVIEW OF ECONOMIC STUDIES

41

42

43

More magazines by this user
Similar magazines