3 Dynamische Spiele mit vollständiger Information 3.1 ...
3 Dynamische Spiele mit vollständiger Information 3.1 ...
3 Dynamische Spiele mit vollständiger Information 3.1 ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Spieltheorie (Winter 2009/10) 3-1 Prof. Dr. Ana B. Ania<br />
3 <strong>Dynamische</strong> <strong>Spiele</strong> <strong>mit</strong> <strong>vollständiger</strong><br />
<strong>Information</strong><br />
Literaturhinweise zu Kapitel 3:<br />
Osborne (2004), Kapitel 5-7<br />
Gibbons (1992), Kapitel 2<br />
MasColell, Whinston, Green (1995), Kapitel 7 und 9A+B<br />
Fudenberg und Tirole (1991), Kapitel 3 und 4<br />
<strong>3.1</strong> Rückwärtsinduktion<br />
Bisher hatten wir Situationen betrachtet, in denen beide<br />
Parteien simultan über ihre Strategie entscheiden müssen.<br />
Jetzt betrachten wir etwas kompliziertere zeitliche Strukturen.<br />
Dabei beschränken wir uns zunächst auf <strong>Spiele</strong> <strong>mit</strong><br />
<strong>vollständiger</strong> und perfekter <strong>Information</strong>, d.h., alle <strong>Spiele</strong>r<br />
spielen sequentiell, und jeder <strong>Spiele</strong>r beobachtet alle vorangegangenen<br />
Züge.<br />
Klaus M. Schmidt 2007
Spieltheorie (Winter 2009/10) 3-2 Prof. Dr. Ana B. Ania<br />
Die Zeitstruktur eines Spiels<br />
①<br />
<br />
①<br />
<br />
<br />
<strong>Spiele</strong>r 2<br />
<strong>Spiele</strong>r 1<br />
Aktion 1 Aktion 2<br />
<br />
①<br />
<br />
<br />
<br />
<strong>Spiele</strong>r 2<br />
Aktion 3 Aktion 4 Aktion 3 Aktion 4<br />
<br />
a<br />
c<br />
b<br />
d<br />
Beispiel 1: IBM vs. Intel<br />
<br />
e<br />
g<br />
f<br />
h<br />
Abb. <strong>3.1</strong>: Ein Spielbaum<br />
In den frühen 70er Jahren ist Intel der einzige Lieferant<br />
von IBM für bestimmte Computerchips. IBM steht vor der<br />
Wahl, entweder Intel als einzigen Lieferanten zu behalten<br />
oder einen zweiten Lieferanten (AMD) aufzubauen.<br />
Ohne einen zweiten Lieferanten kann Intel seine Monopolmacht<br />
ausnutzen. Dann würde IBM einen Gewinn von 10<br />
und Intel einen Gewinn von 90 erhalten. Intel kündigt jedoch<br />
an, auf das Ausnutzen der Monopolstellung zu verzichten<br />
und die Gewinne gleichmäßig aufzuteilen (jeder bekommt<br />
einen Gewinn von 50). Wenn sich IBM entscheidet, AMD<br />
als zweiten Lieferanten aufzubauen, erhält IBM einen Gewinn<br />
von 40 und Intel einen Gewinn von 30.
Spieltheorie (Winter 2009/10) 3-3 Prof. Dr. Ana B. Ania<br />
Sollte IBM eine zweite Lieferantenbeziehung aufbauen oder<br />
darauf verzichten?<br />
Zeichnen Sie den Spielbaum für dieses Spiel.<br />
Bestimmen Sie die Normalform für dieses Spiel.
Spieltheorie (Winter 2009/10) 3-4 Prof. Dr. Ana B. Ania<br />
Beispiel 2: Marktzutrittsspiel<br />
Zutreter<br />
①<br />
<br />
<br />
<br />
0<br />
2<br />
N E<br />
<br />
①<br />
k<br />
<br />
<br />
−1<br />
−1<br />
Monopolist<br />
n<br />
<br />
2<br />
1<br />
Abb. 3.2: Marktzutrittsspiel<br />
Der Marktzutreter entscheidet, ob er eintritt (E) oder<br />
nicht (N).<br />
Der Monopolist entscheidet, ob er kämpft (k) oder nicht<br />
kämpft und sich den Markt teilt (n).<br />
Ein sequentielles Spiel <strong>mit</strong> endlich vielen Stufen und perfekter<br />
<strong>Information</strong> wird von hinten (durch Rückwärtsinduktion)<br />
gelöst.<br />
Monopolist: Gegeben, dass der Zutreter eingetreten ist,<br />
ist es für mich optimal, den Markt zu teilen.<br />
Zutreter: Wenn ich zutrete, wird der Monopolist den<br />
Markt teilen. Also sollte ich zutreten.<br />
Das Ergebnis der Rückwärtsinduktion ist also (E,n).
Spieltheorie (Winter 2009/10) 3-5 Prof. Dr. Ana B. Ania<br />
Rückwärtsinduktion und Nash-Gleichgewicht<br />
Das Ergebnis der Rückwärtsinduktion ist ein Nash-GG:<br />
Gegeben, dass der Zutreter E spielt, ist für den Monopolisten<br />
n optimal.<br />
Gegeben, dass der Monopolist n spielt, ist für den Zutreter<br />
E optimal.<br />
❅❅<br />
Z<br />
N<br />
E<br />
❅<br />
M<br />
❅<br />
❅<br />
k<br />
n<br />
0, 2 0, 2<br />
-1, -1 2, 1<br />
Abb. 3.3: Normalform des Marktzutrittsspiels<br />
Analyse der Normalform zeigt, dass es noch ein zweites<br />
Nash-GG gibt: (N,k).<br />
Diese Strategie des Monopolisten ist nicht optimal, wenn<br />
der Zutreter E spielen sollte. Aber: Im Nash-GG (N,k) tritt<br />
der Zutreter eben nicht ein, also ist dieser Fall irrelevant.<br />
Trotzdem ist das Nash-GG (N,k) nicht überzeugend. Der<br />
Monopolist “droht”, zu kämpfen, falls der Zutreter zutritt.
Spieltheorie (Winter 2009/10) 3-6 Prof. Dr. Ana B. Ania<br />
Das ist eine unglaubwürdige Drohung, weilesnicht<br />
im Interesse des Monopolisten liegt, sie im Fall des Falles<br />
tasächlich wahr zu machen.<br />
Die Unglaubwürdigkeit einer Drohung lässt sich aus der Normalform<br />
des Spiels nicht erkennen. Darum werden wir bei<br />
dynamischen <strong>Spiele</strong>n oft die extensive Form des Spiels<br />
betrachten, die die Zeit- und <strong>Information</strong>sstruktur explizit<br />
macht.<br />
Ziel: Verfeinerung des Nash-Gleichgewichts. D.h.,<br />
Ausschluss von Gleichgewichten, die unglaubwürdige Drohungen<br />
enthalten.<br />
Bevor wir das tun, werden wir aber ein paar weitere Anwendungsbeispiele<br />
für Rückwärtsinduktion betrachten
Spieltheorie (Winter 2009/10) 3-7 Prof. Dr. Ana B. Ania<br />
3.2 Anwendungsbeispiele für Rückwärtsinduktion<br />
3.2.1 Stackelberg-Duopol<br />
Heinrich von Stackelberg (1934)<br />
1) Unternehmen 1, der Stackelberg-Führer, wählt seine Menge<br />
x1.<br />
2) Unternehmen 2, der Stackelberg-Anpasser, beobachtet<br />
x1 und wählt seine Menge x2.<br />
3) Auf dem Markt ergibt sich der Preis als Funktion der<br />
gesamten Menge: p = p(x1 + x2).<br />
Dieses Modell wird oft verwendet, wenn es auf einem Markt<br />
einen dominanten Anbieter gibt, an den alle übrigen Anbieter<br />
ihr Verhalten anpassen.<br />
Beispiele:<br />
Saudi-Arabien als größter Ölproduzent legt seine Menge<br />
als erster fest. Andere Ölproduzenten passen sich an.<br />
Südafrika: Dominierender Diamantenproduzent De Beers.<br />
Andere Marktführer: Microsoft, IBM, Telekom, etc., aber<br />
hier geht es meist um Preis- und/oder Qualitätswettbewerb<br />
bei heterogenen Gütern.
Spieltheorie (Winter 2009/10) 3-8 Prof. Dr. Ana B. Ania<br />
Das Entscheidungsproblem des Anpassers<br />
Der Anpasser maximiert seinen Gewinn<br />
π2 = p(x1 + x2)x2 − c2(x2)<br />
durch geeignete Wahl von x2. Dabei liegt die Menge x1<br />
bereits fest und ist bekannt.<br />
Bedingung erster Ordnung (BEO) für Gewinnmaximum:<br />
p(x1 + x ∗ 2)+ dp(x1 + x∗ 2)<br />
x2 =<br />
dx2<br />
dc2(x∗ 2)<br />
dx2<br />
Diese Bedingung legt die optimale Menge x ∗ 2 als Funktion<br />
von x1 fest, d.h.:<br />
x ∗ 2 = R2(x1)<br />
Die Funktion R2(x1) wird Reaktionsfunktion von Unternehmen<br />
2 genannt.<br />
Beispiel:<br />
Lineare Nachfrage: p(x1 + x2) =a − b · (x1 + x2)<br />
Konstante Grenzkosten: c1(x) =c2(x) =c · x<br />
Gewinnfunktion des Anpassers:<br />
π2 = [a − b(x1 + x2)] · x2 − c · x2<br />
BEO für Gewinnmaximum:<br />
a − b(x1 + x2) − bx2 = c
Spieltheorie (Winter 2009/10) 3-9 Prof. Dr. Ana B. Ania<br />
Gewinnfunktion ist streng konkav:<br />
dπ2 2<br />
d2x2 = −2b < 0<br />
Reaktionsfunktion des Anpassers:<br />
x2 = a − bx1 − c<br />
2b<br />
= a − c<br />
Das Problem des Marktführers<br />
2b<br />
− 1<br />
2 x1<br />
Der Marktführer kennt das Entscheidungsproblem des Anpassers<br />
und weiß, dass er die Menge x ∗ 2 = R2(x1) wählen<br />
wird. Also ist sein Gewinnmaximierungsproblem:<br />
max<br />
x1 p(x1 + R2(x1)) · x1 − c1(x1)<br />
BEO für Gewinnmaximum:<br />
p(x ∗ 1 + R(x ∗ ⎜<br />
1)) + ⎝1+ dR2<br />
dx1<br />
⎛<br />
⎞<br />
⎟<br />
⎠<br />
dp<br />
dx x∗ 1 = dc1<br />
dx1<br />
Der Stackelberg-Führer berücksichtigt nicht nur, wie eine<br />
zusätzliche Einheit den Martkpreis direkt senkt, sondern<br />
auch, wie sie die Menge seines Konkurrenten und da<strong>mit</strong><br />
indirekt den Marktpreis beeinflusst.
Spieltheorie (Winter 2009/10) 3-10 Prof. Dr. Ana B. Ania<br />
Im Beispiel:<br />
Gewinnfunktion des Marktführers:<br />
π1 =[a−b(x1 + R2(x1))] · x1 − c · x1<br />
= a − c<br />
· x1 −<br />
2<br />
b<br />
2 · x21 BEO für Gewinnmaximum:<br />
a − c<br />
2 − bx∗1 = 0<br />
x ∗ a − c<br />
1 =<br />
2b<br />
Nachdem wir die optimale Menge des Stackelberg-Führers<br />
kennen, können wir sie in die Reaktionsfunktion des Anpassers<br />
einsetzen, um dessen Menge, die gesamte Menge, und<br />
denMarktpreiszubestimmen.<br />
Einsetzen von x ∗ 1 in R2(x1) ergibt:<br />
x ∗ 2 =<br />
Die gesamte Menge ist also:<br />
x1 + x2 =<br />
Der Marktpreis ergibt sich als:<br />
p ∗ =<br />
a − c<br />
4b<br />
3(a − c)<br />
4b<br />
a +3c<br />
4
Spieltheorie (Winter 2009/10) 3-11 Prof. Dr. Ana B. Ania<br />
Vergleich zum Cournot-Duopol<br />
Der Gewinn des Stackelberg-Führers ist immer höher als<br />
der Gewinn eines Cournot-Duopolisten. Warum?<br />
Im Stackelberg-Spiel ist der Anpasser besser informiert<br />
als ein Duopolist im Cournot-Spiel. Er kann beobachten,<br />
welche Menge der Stackelberg-Führer auf den Markt<br />
wirft. Trotzdem geht es dem Anpasser schlechter als<br />
dem Cournot-Duopolisten. Warum?<br />
In Ein-Personen-Entscheidungssituationen ist es unmöglich,<br />
dass sich der Entscheidungsträger schlechter stellt,<br />
wenn er zusätzliche <strong>Information</strong>en oder zusätzliche Handlungsmöglichkeiten<br />
bekommt.<br />
In interpersonellen Entscheidungssituationen ist es dagegen<br />
oft besser, weniger <strong>Information</strong>en oder weniger<br />
Handlungsmöglichkeiten zu haben. Beispiele:<br />
– Cournot- versus Stackelberg-Spiel.<br />
– Chicken-Spiel: Angenommen, einer der Fahrer kann<br />
sein Lenkrad aus dem Fenster werfen und sich da<strong>mit</strong><br />
die Möglichkeit zum Ausweichen nehmen.<br />
⇒ Gegenspieler wird ausweichen.<br />
– Viele andere Beispiele für Selbstbindung (Com<strong>mit</strong>ment).
Spieltheorie (Winter 2009/10) 3-12 Prof. Dr. Ana B. Ania<br />
3.2.2 Löhne und Beschäftigung<br />
Leontief (1946), später in zahlreichen Variationen.<br />
Zweistufiges Spiel:<br />
1. Gewerkschaft bestimmt den Lohnsatz, w.<br />
2. Unternehmen bestimmt die Beschäftigungsmenge, L.<br />
Auszahlungsfunktionen:<br />
Gewerkschaft:<br />
U(w, L),<br />
streng monoton steigend in w und L,<br />
quasikonkav (konvexe Indifferenzkurven)<br />
Unternehmen:<br />
π(w, L) =R(L) − wL,<br />
R(L) steigend und streng konkav,<br />
limL→0 R ′ (L) =∞,<br />
limL→∞ R ′ (L) =0.
Spieltheorie (Winter 2009/10) 3-13 Prof. Dr. Ana B. Ania<br />
Rückwärtsinduktion<br />
Unternehmen:<br />
R<br />
max R(L) − wL<br />
L≥0<br />
BEO (hier notwendig und hinreichend):<br />
R ′ (L) − w =0<br />
Die optimale Beschäftigungsmenge L∗ (w) ist eine fallende<br />
Funktion von w. (Warum?)<br />
Isogewinnlinien:<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
R(L) − wL = c ⇒ w =<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
L<br />
w<br />
<br />
<br />
<br />
R(L) − c<br />
L<br />
Abb. 3.4: Gewinnmaximum und Isogewinnlinien der<br />
Unternehmung<br />
<br />
<br />
<br />
L
Spieltheorie (Winter 2009/10) 3-14 Prof. Dr. Ana B. Ania<br />
Gewerkschaft antizipiert L ∗ (w):<br />
w<br />
BEO:<br />
<br />
<br />
<br />
∂U<br />
∂w<br />
max<br />
w≥0 U(w, L∗ (w))<br />
∂U dL<br />
+<br />
∂L<br />
∗ (w)<br />
dw<br />
<br />
<br />
<br />
L<br />
w<br />
<br />
<br />
<br />
= 0<br />
Abb. 3.5: Nutzenmaximum der Gewerkschaft, Ineffizienz<br />
Bemerkungen:<br />
1) Gewerkschaft sucht sich den besten Punkt auf der Reaktionsfunktion<br />
des Unternehmens.<br />
2) Aber das Ergebnis ist ineffizient: Gewerkschaften und<br />
Unternehmen könnten sich besser stellen, wenn sie den<br />
<br />
<br />
<br />
L
Spieltheorie (Winter 2009/10) 3-15 Prof. Dr. Ana B. Ania<br />
Lohn etwas verringerten und die Beschäftigung etwas<br />
erhöhten.<br />
3) Die Ineffizienz besteht, weil Gewerkschaft und Unternehmen<br />
nicht über Beschäftigung und Lohnhöhe gleichzeitig<br />
verhandeln. Warum wird das nicht gemacht?<br />
3.2.3 Zeitkonsistenz der Geldpolitik<br />
Barro und Gordon (1983)<br />
Zweistufiges Spiel zwischen Zentralbank und privatem Sektor:<br />
1. Die Privaten bilden Inflationserwartungen πe ,diesich<br />
insbesondere in Tarifabschlüssen niederschlagen.<br />
2. Die Zentralbank beobachtet πe und entscheidet über die<br />
Geldpolitik, die die tatsächliche Inflationsrate π determiniert.<br />
Stark stilisiertes Modell in reduzierter Form. Tarifabschlüsse,<br />
Transmissionsmechanismus von Geldpolitik auf realen und<br />
monetären Sektor etc. werden nicht explizit modelliert.<br />
Stattdessen: Zentralbank möchte die gesamtwirtschaftliche<br />
Wohlfahrt maximieren, indem sie die Verlustfunktion<br />
L(u, π) = u + γπ 2<br />
minimiert. Dabei ist u>0 die Arbeitslosenquote, γ>0.
Spieltheorie (Winter 2009/10) 3-16 Prof. Dr. Ana B. Ania<br />
Die Volkswirtschaft wird durch eine modifizierte Phillipskurve<br />
beschrieben:<br />
u = u n − α(π − π e )<br />
Die natürliche Arbeitslosenquote u n > 0 wird durch Tarifabschlüsse<br />
bestimmt. Die Zentralbank kann die tatsächliche<br />
Inflationsrate perfekt und ohne Zeitverzögerung steuern.<br />
Die privaten Wirtschaftssubjekte möchten die tatsächliche<br />
Inflation so gut wie möglich voraussagen:<br />
Rückwärtsinduktion<br />
U(π, π e )=−(π − π e ) 2<br />
Zentralbank: Inflationserwartungen liegen bereits fest.<br />
BEO:<br />
Daraus folgt:<br />
min<br />
π u n − α(π − π e )+γπ 2<br />
dL<br />
dπ<br />
= −α +2γπ = 0<br />
π ∗ = α<br />
2γ<br />
Beachten Sie: Die “optimale Inflationsrate” für die Zentralbank<br />
ist in diesem Modell unabhängig von den Inflationserwartungen<br />
der Privaten.
Spieltheorie (Winter 2009/10) 3-17 Prof. Dr. Ana B. Ania<br />
Private Wirtschaftssubjekte antizipieren π ∗ :<br />
max<br />
πe −(π∗ − π e ) 2<br />
Daraus folgt:<br />
π e = π ∗ = α<br />
2γ<br />
Für die Arbeitslosenquote ergibt sich:<br />
Bemerkungen:<br />
u = u n − α(π ∗ − π e ) = u n<br />
Ergebnis ist ineffizient: u = u n und π =0wäre besser.<br />
Problem der Zentralbank: Sie kann sich nicht binden,<br />
eine Inflationsrate von 0 zu wählen. Die Privaten antizipieren,<br />
dass die Bank ex post einen Anreiz hat, zu<br />
inflationieren.<br />
Der Anreiz zu inflationieren besteht, obwohl die Privaten<br />
die Inflation perfekt voraussehen und sie darum keine für<br />
die Zentralbank positiven Effekte hat.<br />
Regelgebundene Geldpolitik: Wenn die Zentralbank eine<br />
“Reputation” dafür aufbauen könnte, nie zu inflationieren,<br />
würde sie sich besserstellen. Siehe dazu das Kapitel<br />
über wiederholte <strong>Spiele</strong>.
Spieltheorie (Winter 2009/10) 3-18 Prof. Dr. Ana B. Ania<br />
3.3 Die extensive Form eines Spiels<br />
Definition <strong>3.1</strong> (Extensive Form) Die extensive<br />
Form eines Spiels spezifiziert:<br />
(1) die Menge der <strong>Spiele</strong>r {1,...,n};<br />
(2a) zu welchem Zeitpunkt welcher <strong>Spiele</strong>r am<br />
Zug ist;<br />
(2b) welche Aktionen einem <strong>Spiele</strong>r zur Verfügung<br />
stehen, wenn er am Zug ist;<br />
(2c) was ein <strong>Spiele</strong>r weiß, wenn er am Zug ist;<br />
(3) die Auszahlung eines jeden <strong>Spiele</strong>rs für jede<br />
mögliche Kombination von Zügen.<br />
Die Definition der extensiven Form ist ganz analog zu der<br />
der Normalform. Einziger Unterschied: Die Beschreibung<br />
der Strategienräume kann sehr viel komplexer sein.<br />
<strong>Spiele</strong> in extensiver Form können <strong>mit</strong> Hilfe eines Spielbaums<br />
beschrieben werden.
Spieltheorie (Winter 2009/10) 3-19 Prof. Dr. Ana B. Ania<br />
Ein Spielbaum besteht einer Menge von geordneten und<br />
<strong>mit</strong>einander verbundenen Knoten:<br />
Entscheidungsknoten: Hier kann genau ein <strong>Spiele</strong>r<br />
aus einer Menge von Aktionen auswählen. Jede Aktion<br />
führt zu einem neuen Entscheidungs- oder Endknoten.<br />
Endknoten: Hier endet das Spiel, und Auszahlungen<br />
werden zugeordnet.<br />
Der Spielbaum beginnt <strong>mit</strong> genau einem Anfangs-Entscheidungsknoten.<br />
Wir werden immer annehmen, dass ein Spielbaum sich echt<br />
verzweigt:<br />
Er wächst nicht in sich selbst zurück (keine Zyklen);<br />
Zweige wachsen nicht wieder zusammen (keine gemeinsamen<br />
Vorgänger).<br />
Gegenbeispiele?
Spieltheorie (Winter 2009/10) 3-20 Prof. Dr. Ana B. Ania<br />
Zufallszüge der Natur<br />
In vielen <strong>Spiele</strong>n gibt es exogene Unsicherheit. Wir können<br />
das modellieren, indem wir einen zusätzlichen <strong>Spiele</strong>r, die<br />
“Natur”, einführen, die aus der Menge der möglichen Zustände<br />
der Welt einen nach einer gegebenen Wahrscheinlichkeitsverteilung<br />
auswählt.<br />
Z<br />
①<br />
<br />
<br />
<br />
0<br />
2<br />
N E<br />
Natur<br />
①<br />
1<br />
1<br />
2<br />
2<br />
M M<br />
① <br />
<br />
①<br />
<br />
<br />
<br />
<br />
<br />
3<br />
<br />
−1<br />
<br />
1<br />
3 −1 1<br />
k n k n<br />
0<br />
0<br />
Abb. 3.6: Marktzutrittsspiel <strong>mit</strong> exogener Unsicherheit<br />
Nach der Zutrittsentscheidung realisiert sich der Zustand<br />
der Welt:<br />
ist die Nachfrage groß, beide<br />
können hohe Gewinne machen.<br />
Mit Wahrscheinlichkeit 1<br />
2<br />
ist die Nachfrage niedrig, beide<br />
machen bei Wettbewerb Verluste.<br />
Mit Wahrscheinlichkeit 1<br />
2
Spieltheorie (Winter 2009/10) 3-21 Prof. Dr. Ana B. Ania<br />
<strong>Information</strong>smengen<br />
Definition 3.2 (<strong>Information</strong>smenge) Eine <strong>Information</strong>smenge<br />
ist eine Menge von Entscheidungsknoten<br />
<strong>mit</strong> den Eigenschaften:<br />
Bei allen Entscheidungsknoten einer <strong>Information</strong>smenge<br />
ist derselbe <strong>Spiele</strong>r am Zug.<br />
Ein <strong>Spiele</strong>r kann die verschiedenen Knoten einer<br />
<strong>Information</strong>smenge nicht unterscheiden. Insbesondere<br />
hat er an jedem Knoten einer <strong>Information</strong>smenge<br />
dieselbe Menge von Aktionen.<br />
Jeder Entscheidungsknoten gehört zu genau einer<br />
<strong>Information</strong>smenge.<br />
Beispiele:<br />
<br />
1<br />
①<br />
2 <br />
①<br />
<br />
g ℓ<br />
<br />
<br />
−3<br />
−3<br />
<br />
G L<br />
2<br />
g ℓ<br />
<br />
0<br />
<br />
−5<br />
−5<br />
0<br />
①<br />
<br />
<br />
<br />
−1<br />
−1<br />
Abb. 3.7: Das Gefangenen-Dilemma
Spieltheorie (Winter 2009/10) 3-22 Prof. Dr. Ana B. Ania<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
<br />
<br />
<br />
<br />
<br />
1<br />
2 2<br />
1 1 1 1<br />
①<br />
<br />
<br />
<br />
Abb. 3.8: Mögliche und unmögliche <strong>Information</strong>smengen<br />
Wenn ein Spiel nur einelementige <strong>Information</strong>smengen enthält,<br />
sprechen wir von einem Spiel <strong>mit</strong> perfekter <strong>Information</strong><br />
(nicht zu verwechseln <strong>mit</strong> <strong>vollständiger</strong> <strong>Information</strong>).<br />
Gibt es mehrelementige <strong>Information</strong>smengen sprechen wir<br />
von einem Spiel <strong>mit</strong> imperfekter <strong>Information</strong> (nicht zu<br />
verwechseln <strong>mit</strong> un<strong>vollständiger</strong> <strong>Information</strong>).<br />
Strategien<br />
Definition 3.3 (Strategie) Eine Strategie ist ein<br />
vollständig konditionierter Aktionsplan: Für jede <strong>Information</strong>smenge,<br />
in der der <strong>Spiele</strong>r am Zug ist, spezifiziert<br />
sie eine mögliche Aktion, d.h., sie konditioniert<br />
die Aktion auf die von <strong>Spiele</strong>r i beobachtete<br />
bisherige Geschichte des Spiels.
Spieltheorie (Winter 2009/10) 3-23 Prof. Dr. Ana B. Ania<br />
Beispiele:<br />
1<br />
①<br />
2 <br />
①<br />
<br />
ℓ r<br />
<br />
<br />
3<br />
1<br />
1<br />
2<br />
L R<br />
2<br />
1<br />
①<br />
ℓ<br />
<br />
<br />
2<br />
r<br />
<br />
0<br />
0<br />
Abb. 3.9: Strategien in einem Spiel <strong>mit</strong> perfekter<br />
<strong>Information</strong><br />
<strong>Spiele</strong>r 1 hat 2 Strategien: L, R<br />
<strong>Spiele</strong>r 2 hat 4 Strategien: ℓℓ, ℓr, rℓ, rr<br />
❅❅<br />
❅<br />
❅<br />
❅<br />
1<br />
L<br />
R<br />
2<br />
ℓℓ ℓr rℓ rr<br />
3, 1 3, 1 1, 2 1, 2<br />
2, 1 0, 0 2, 1 0, 0<br />
Abb. <strong>3.1</strong>0: Normalform dieses Spiels
Spieltheorie (Winter 2009/10) 3-24 Prof. Dr. Ana B. Ania<br />
①<br />
L R<br />
<br />
①<br />
<br />
①<br />
ℓ r<br />
ℓ<br />
<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
<br />
<br />
<br />
<br />
<br />
1<br />
2 2<br />
r<br />
1 1 1 1<br />
L ′ R ′ L ′ R ′ L ′′ R ′′ L ′′ R ′′<br />
①<br />
<br />
<br />
<br />
Abb. <strong>3.1</strong>1: Strategien in einem Spiel <strong>mit</strong> imperfekter<br />
<strong>Information</strong><br />
Strategien von <strong>Spiele</strong>r 1:<br />
Strategien von <strong>Spiele</strong>r 2:<br />
Jedes Spiel in extensiver Form kann in ein Spiel in Normalform<br />
überführt werden.<br />
Aber: Zu einem Spiel in Normalform können mehrere verschiedene<br />
<strong>Spiele</strong> in extensiver Form existieren.
Spieltheorie (Winter 2009/10) 3-25 Prof. Dr. Ana B. Ania<br />
3.4 Teilspielperfekte Gleichgewichte<br />
Definition 3.4 (Teilspiel) Ein Teilspiel eines Spiels<br />
in extensiver Form<br />
a) beginnt in einem Entscheidungsknoten K einer<br />
einelementigen <strong>Information</strong>smenge,<br />
b) beinhaltet alle Entscheidungs- und Endknoten,<br />
die K nachfolgen, aber keine Knoten, die K nicht<br />
nachfolgen,<br />
c) durchtrennt keine nachfolgenden <strong>Information</strong>smengen.<br />
①<br />
L R<br />
<br />
①<br />
<br />
①<br />
ℓ r<br />
ℓ<br />
<br />
①<br />
<br />
①<br />
<br />
①<br />
<br />
<br />
<br />
<br />
<br />
<br />
1<br />
2 2<br />
r<br />
1 1 1 1<br />
L ′ R ′ L ′ R ′ L ′′ R ′′ L ′′ R ′′<br />
Abb. <strong>3.1</strong>2: Teilspiele<br />
①
Spieltheorie (Winter 2009/10) 3-26 Prof. Dr. Ana B. Ania<br />
Intuitiv ist ein Teilspiel einfach ein Teil des gesamten Spiels,<br />
der in einem Knoten beginnt und alle nachfolgenden Knoten<br />
enthält. An diesem Knoten muss die gesamte bisherige<br />
Geschichte des Spiels dem <strong>Spiele</strong>r, der hier am Zug ist, bekannt<br />
sein.<br />
Ein Teilspiel kann isoliert betrachtet und analysiert werden.<br />
Die folgende Definition stammt von Reinhard Selten (1965).<br />
Definition 3.5 (Teilspielperfekte GG) Ein Nash-<br />
Gleichgewicht ist teilspielperfekt, wenn die Strategien<br />
der <strong>Spiele</strong>r in jedem Teilspiel ein Nash-Gleichgewicht<br />
bilden.<br />
Beispiel:<br />
1<br />
①<br />
2 <br />
①<br />
<br />
ℓ r<br />
<br />
<br />
3<br />
1<br />
1<br />
2<br />
L R<br />
2<br />
1<br />
①<br />
ℓ<br />
<br />
<br />
2<br />
r<br />
<br />
0<br />
0<br />
Abb. <strong>3.1</strong>3: Teilspielperfektes Nash-Gleichgewicht
Spieltheorie (Winter 2009/10) 3-27 Prof. Dr. Ana B. Ania<br />
Analyse der Teilspiele:<br />
Gegeben, dass <strong>Spiele</strong>r 1 L gewählt hat, sollte 2 r spielen.<br />
Gegeben, dass <strong>Spiele</strong>r 1 R gewählt hat, sollte 2 ℓ spielen.<br />
Gegeben das Verhalten von 2 sollte 1 R spielen.<br />
Das teilspielperfekte Nash-Gleichgewicht ist (R, rl).<br />
Beachten Sie:<br />
Der Gleichgewichtspfad ist (R, l)<br />
Aber: Das Gleichgewicht muss auch angeben, was außerhalb<br />
des Gleichgewichtspfades passieren würde. Darum<br />
ist das Gleichgewicht (R, rl).<br />
Es existiert ein zweites Nash-Gleichgewicht: (L, rr).<br />
Aber, dieses Nash-GG ist nicht teilspielperfekt. Es enthält<br />
die unglaubwürdige Drohung, dass <strong>Spiele</strong>r 2 r spielt,<br />
sollte <strong>Spiele</strong>r 1 R spielen.<br />
Teilspielperfektheit ist nicht nur für <strong>Spiele</strong> <strong>mit</strong> perfekter<br />
<strong>Information</strong>, sondern auch für beliebige <strong>Spiele</strong> <strong>mit</strong><br />
imperfekter <strong>Information</strong> wohldefiniert.
Spieltheorie (Winter 2009/10) 3-28 Prof. Dr. Ana B. Ania<br />
Satz <strong>3.1</strong> Jedes endliche Spiel in extensiver Form<br />
hat wenigstens ein teilspielperfektes Nash-Gleichgewicht.<br />
Beweisskizze: Der Beweis ist konstruktiv und zeigt, wie man<br />
ein teilspielperfektes Gleichgewicht finden kann. Das Verfahren<br />
ist eine Verallgemeinerung der Rückwärtsinduktion.<br />
1) Beginne am Ende des Spielbaums und bestimme für<br />
alle letzten Teilspiele die Nash-Gleichgewichte. Da es<br />
sich bei diesen letzten <strong>Spiele</strong>n um endliche <strong>Spiele</strong> handelt,<br />
muss in jedem von ihnen wenigstens ein Nash-<br />
Gleichgewicht (eventuell in gemischten Strategien) existieren.<br />
2) Wähle für jedes dieser Teilspiele ein Nash-Gleichgewicht<br />
aus und ersetze das Teilspiel durch den Vektor der Gleichgewichtsauszahlungen.<br />
3) Wiederhole diese Schritte für das reduzierte Spiel solange,<br />
bis alle Züge im gesamten Spiel bestimmt sind.<br />
Da<strong>mit</strong> ist ein teilspielperfektes Nash-Gleichgewicht gefunden.
Spieltheorie (Winter 2009/10) 3-29 Prof. Dr. Ana B. Ania<br />
Satz 3.2 Jedes endliche Spiel in extensiver Form<br />
<strong>mit</strong> perfekter <strong>Information</strong> hat generisch ein eindeutiges<br />
teilspielperfektes Nash-Gleichgewicht.<br />
Beweis: Bei perfekter <strong>Information</strong> gibt es auf jeder Stufe<br />
der Rückwärtsinduktion nur einfache Ein-Personen-Entscheidungsprobleme.<br />
Da diese Probleme endlich sind, haben<br />
sie eine Lösung. Generisch führen unterschiedliche Aktionen<br />
nie zu denselben Auszahlungen. Also gibt es auf jeder Stufe<br />
eine eindeutige optimale Aktion, und folglich auch ein<br />
eindeutiges Nash-Gleichgewicht.<br />
Bemerkungen:<br />
1. Dieser Satz wurde schon von Zermelo (1913) bewiesen.<br />
2. Bei <strong>Spiele</strong>n <strong>mit</strong> imperfekter <strong>Information</strong> kann es natürlich<br />
mehrdeutige Gleichgewichte in einem Teilspiel geben.<br />
Die Menge aller TPGG im gesamten Spiel erhält man,<br />
indem man die Rückwärtsinduktion <strong>mit</strong> jeder möglichen<br />
Kombination aller möglichen Gleichgewichte durchführt.
Spieltheorie (Winter 2009/10) 3-30 Prof. Dr. Ana B. Ania<br />
Beispiel: Ein Spiel <strong>mit</strong> imperfekter <strong>Information</strong><br />
Betrachten Sie das folgende Spiel <strong>mit</strong> zwei Perioden, bei<br />
dem die <strong>Spiele</strong>r in der ersten Periode ein Gefangenen-Dilemma<br />
und in der zweiten Periode ein Koordinationsspiel spielen:<br />
❅❅<br />
A<br />
B<br />
cooperate defect<br />
❅<br />
❅<br />
❅<br />
cooperate<br />
defect<br />
❅❅<br />
A<br />
L<br />
R<br />
❅<br />
B<br />
❅<br />
❅<br />
2, 2 -1, 3<br />
3, -1 0, 0<br />
ℓ<br />
r<br />
x, x 0, 0<br />
0, 0<br />
y, y<br />
Fig. 4.12: SPE of a Game of Imperfect <strong>Information</strong><br />
Was sind die teilspielperfekten Gleichgewichte dieses Spiels?<br />
Unter welcher Annahme an x und y kann ein teilspielperfektes<br />
Gleichgewicht gestützt werden, bei dem die beiden<br />
<strong>Spiele</strong>r in der ersten Periode kooperieren?
Spieltheorie (Winter 2009/10) 3-31 Prof. Dr. Ana B. Ania<br />
3.5 Teilspielperfektheit und Rationalität<br />
Teilspielperfektheit erfordert, dass es “Common Knowledge”<br />
ist, dass alle <strong>Spiele</strong>r rational sind. Betrachten Sie das<br />
folgende Spiel:<br />
1<br />
①<br />
L R<br />
2<br />
<br />
①<br />
<br />
2 ℓ r<br />
0<br />
1<br />
<br />
①<br />
<br />
1<br />
1<br />
<br />
<br />
3<br />
0<br />
L ′ R ′<br />
<br />
0<br />
2<br />
Abb. <strong>3.1</strong>4: Rationalität und Rückwärtsinduktion<br />
Rückwärtsinduktion ergibt, dass <strong>Spiele</strong>r 1 L spielen und das<br />
Spiel da<strong>mit</strong> beenden sollte. Begründung: Wenn <strong>Spiele</strong>r 1 R<br />
spielt, sollte <strong>Spiele</strong>r 2 ℓ spielen, denn würde er r spielen,<br />
würde <strong>Spiele</strong>r 1 in der letzten Runde L ′ spielen.<br />
Angenommen, <strong>Spiele</strong>r 1 spielt dennoch R.<br />
Zeigt er da<strong>mit</strong> nicht, dass er irrational ist?<br />
Wenn <strong>Spiele</strong>r 1 aber irrational ist, sollte <strong>Spiele</strong>r 2 dann
Spieltheorie (Winter 2009/10) 3-32 Prof. Dr. Ana B. Ania<br />
nicht vielleicht doch lieber r spielen, in der Hoffnung,<br />
dass <strong>Spiele</strong>r 1 sich in der letzten Runde ebenfalls irrational<br />
verhält und R ′ spielt?<br />
Wenn <strong>Spiele</strong>r 2 durch diese Argumentation verleitet wird,<br />
r zu spielen, sollte dann nicht auch ein rationaler <strong>Spiele</strong>r<br />
1 R in Runde 1 spielen?<br />
Rückwärtsinduktion ist nur solange überzeugend, solange<br />
Abweichungen vom Rückwärtsinduktionspfad rational erklärt<br />
werden können. Das hat Selten (1975) motiviert, das<br />
Konzept des “perfekten Gleichgewichts” einzuführen:<br />
1) Es ist common knowledge, beide <strong>Spiele</strong>r sind rational.<br />
2) Aber: Beide <strong>Spiele</strong>r machen <strong>mit</strong> sehr kleinen Wahrscheinlichkeiten<br />
Fehler: ihre Hände zittern bei der Auswahl<br />
der Strategien. Mit Wahrscheinlichkeit 1 − ɛ spielt jeder<br />
<strong>Spiele</strong>r die intendierte Strategie, aber <strong>mit</strong> Wahrscheinlichkeit<br />
ɛ macht er einen Fehler und wählt eine andere<br />
(zufällig ausgewählte) Strategie. Die Wahl von R kann<br />
dann als nicht intendierter Fehler von 1 interpretiert werden<br />
und bedeutet nicht, dass 1 irrational ist.<br />
3) Ein perfektes Gleichgewicht ist der Limes einer Folge<br />
von Gleichgewichten, in denen jeder <strong>Spiele</strong>r <strong>mit</strong> Wahrscheinlichkeit<br />
ɛ einen Fehler macht, wenn ɛ gegen 0 konvergiert.
Spieltheorie (Winter 2009/10) 3-33 Prof. Dr. Ana B. Ania<br />
Das folgende Spiel soll noch einmal darauf hinweisen, dass<br />
Teilspielperfektheit nicht immer völlig plausibel sein muss.<br />
<strong>Spiele</strong>r 1 und 2 sind abwechselnd am Zug und können jedesmal<br />
entscheiden, ob das Spiel enden oder weitergehen<br />
soll.<br />
1 2 1 2 1 2<br />
①①① ①<br />
①<br />
①<br />
<br />
w w w<br />
w w<br />
s s s<br />
s s<br />
<br />
<br />
<br />
<br />
<br />
<br />
1<br />
1<br />
0<br />
3<br />
<br />
2<br />
<br />
97<br />
2<br />
100<br />
s<br />
<br />
99<br />
<br />
98<br />
99 101<br />
Abb. <strong>3.1</strong>5: Rosenthals Hundertfüßler<br />
w<br />
<br />
100<br />
100<br />
Das eindeutige TPGG ist, dass jeder <strong>Spiele</strong>r das Spiel beendet,<br />
wenn er zum Zug kommt.<br />
Was passiert, wenn <strong>Spiele</strong>r 1 das Spiel in Periode 1 nicht<br />
beendet? Sollte <strong>Spiele</strong>r 2 sich dennoch an das Gleichgewicht<br />
halten?<br />
Ob dieses TPGG überzeugend ist oder nicht, hängt entscheidend<br />
davon ab, wie die <strong>Spiele</strong>r Abweichungen vom Gleichgewichtspfad<br />
interpretieren.
Spieltheorie (Winter 2009/10) 3-34 Prof. Dr. Ana B. Ania<br />
3.6 Ein Zermürbungskrieg<br />
Das klassische Beispiel für einen Zermürbungskrieg stammt<br />
aus der Biologie (Maynard S<strong>mit</strong>h, 1974): Kampf zweier Tiere<br />
um ein Territorium.<br />
Wir betrachten dieses Spiel nur in diskreter Zeit <strong>mit</strong> unendlichem<br />
Horizont:<br />
Folge von Zeitpunkten: t =0, 1, 2,...<br />
In jeder Periode entscheiden beide <strong>Spiele</strong>r simultan, ob sie<br />
“kämpfen” oder “aufgeben” sollen.<br />
Wenn beide kämpfen, verlieren beide eine Nutzeneinheit<br />
pro Periode, und das Spiel geht weiter.<br />
Wenn einer aufgibt, der andere aber nicht, erhält der<br />
Gewinner einer Preis im Wert v, der Verlierer nichts,<br />
und das Spiel ist zu Ende.<br />
Wenn beide gleichzeitig aufgeben, sind beide Verlierer<br />
und erhalten beide nichts.<br />
Auszahlungen: Sei ˆt die Periode, in der der Verlierer aufgegeben<br />
hat.<br />
Verlierer:<br />
uv(ˆt) =−(1 + δ + ···+ δ ˆt−1 ) · 1=− 1 − δ ˆt<br />
1 − δ
Spieltheorie (Winter 2009/10) 3-35 Prof. Dr. Ana B. Ania<br />
Gewinner:<br />
ug(ˆt) =−(1+δ +···+δ ˆt−1 ˆt 1 − δ<br />
)·1+δ v = − ˆt<br />
1 − δ +δˆt v<br />
Existiert ein symmetrisches, stationäres TPGG?<br />
Ja, aber nur in gemischten Strategien.<br />
Angenommen beide <strong>Spiele</strong>r geben in jeder Periode <strong>mit</strong> Wahrscheinlichkeit<br />
p auf und kämpfen <strong>mit</strong> Wahrscheinlichkeit<br />
1 − p.<br />
Diese Strategien sind nur dann ein Gleichgewicht, wenn jeder<br />
<strong>Spiele</strong>r in jeder Periode indifferent ist, ob er aufgeben<br />
oder weiterkämpfen soll. Also muss in jeder Periode t gelten:<br />
Interpretation:<br />
0=pv+(1− p) · [−1+δ · 0]<br />
Die bisher verlorenen Nutzeneinheiten sind “sunk costs”.<br />
Wir brauchen also nur Auszahlungen zu betrachten, die<br />
von der jetzigen Periode an erhalten werden.<br />
0 ist die Auszahlung, wenn ich heute aufgebe.<br />
Wenn ich nicht aufgebe, gibt es zwei Möglichkeiten:<br />
– Mit Wahrscheinlichkeit p gibt mein Gegner auf, und<br />
ich bekomme v.
Spieltheorie (Winter 2009/10) 3-36 Prof. Dr. Ana B. Ania<br />
– Mit Wahrscheinlichkeit 1 − p gibt er nicht auf, was<br />
mich diese Runde eine Nutzeneinheit kostet. In der<br />
nächsten Runde bin ich dann wieder indifferent zwischen<br />
Aufgeben und Kämpfen. Also ist der Folge-<br />
Payoff ab der nächsten Runde genau 0.<br />
Auflösen ergibt:<br />
Bemerkungen:<br />
p ∗ = 1<br />
1+v<br />
1) Je höher der Preis v, um so kleiner ist die Wahrscheinlichkeit<br />
des Aufgebens.<br />
2) Das Ergebnis ist ineffizient, weil <strong>mit</strong> positiver Wahrscheinlichkeit<br />
gekämpft wird. Mit positiver Wahrscheinlichkeit<br />
sind die Kosten des Kämpfens sogar höher als<br />
der zu gewinnende Preis.<br />
3) Es gibt noch andere TPGG. Beispiel: <strong>Spiele</strong>r 1 wird immer<br />
kämpfen, <strong>Spiele</strong>r 2 wird immer aufgeben. Insbesondere<br />
sind alle stationären Nash-Gleichgewichte auch<br />
teilspielperfekt.<br />
4) Aber: Das Gleichgewicht, dass wir oben charakterisiert<br />
haben, ist das einzige symmetrische Gleichgewicht.
Spieltheorie (Winter 2009/10) 3-37 Prof. Dr. Ana B. Ania<br />
3.7 Das “Einmal-Abweichungsprinzip”<br />
In den bisherigen Beispielen war es relativ einfach, zu prüfen,<br />
ob ein Strategientupel (s ∗ 1,...,s ∗ n) ein TPGG ist. In komplizierteren<br />
<strong>Spiele</strong>n kann das jedoch sehr aufwendig sein. Der<br />
folgende Satz macht uns das Leben erheblich leichter:<br />
Satz 3.3 (Einmal-Abweichungsprinzip) Ein Strategientupel<br />
s ∗ ist teilspielperfekt genau dann, wenn<br />
es für keinen <strong>Spiele</strong>r i eine Strategie ˜si gibt, die sich<br />
von s ∗ i nur in einer Periode t und nach einer Geschichte<br />
h t unterscheidet, und die echt besser ist als<br />
s ∗ i , wenn das Teilspiel nach h t erreicht wird.<br />
Bemerkungen:<br />
1) Es ist offensichtlich, dass die Bedingung notwendig für<br />
Teilspielperfektheit ist. Gäbeeseinesolcheprofitable<br />
Abweichungsstrategie ˜si, dann kann sicher kein TPGG<br />
vorliegen. (Achtung: Es könnte immer noch ein Nash-<br />
Gleichgewicht vorliegen, falls die Geschichte h t auf dem<br />
Gleichgewichtspfad nicht erreicht wird.)<br />
2) Es ist nicht offensichtlich, dass die Bedingung auch hinreichend<br />
für Teilspielperfektheit ist. Angenommen, es<br />
gäbe keine profitable Strategie ˜si, die nur in einer <strong>Information</strong>smenge<br />
von s ∗ i abweicht. Dann könnte es immer
Spieltheorie (Winter 2009/10) 3-38 Prof. Dr. Ana B. Ania<br />
noch eine Strategie ˆsi geben, die an mehreren <strong>Information</strong>smengen<br />
gleichzeitig von s ∗ i abweicht und echt besser<br />
als s ∗ i ist.<br />
3) Wenn wir den Satz bewiesen haben, können wir uns das<br />
Leben in Zukunft sehr viel leichter machen: Wir müssen<br />
nur noch prüfen, ob es Abweichungsstrategien gibt, die<br />
profitabel an nur einer <strong>Information</strong>smenge abweichen.<br />
Das ist besondern nützlich bei wiederholten <strong>Spiele</strong>n.<br />
4) Wir führen den Beweis für <strong>Spiele</strong> <strong>mit</strong> endlichem Horizont.<br />
Der Beweis für <strong>Spiele</strong> <strong>mit</strong> unendlichem Horizont<br />
wird nur skizziert. Siehe Fudenberg-Tirole, S. 107-110.<br />
Beweis (durch Widerspruch): Angenommen, wir haben ein<br />
Strategientupel s ∗ , das der Bedingung des Einmal-Abweichungsprinzips<br />
genügt, das aber nicht teilspielperfekt ist.<br />
Dann existiert ein Zeitpunkt t und eine Geschichte h t ,so<br />
dass es für einen <strong>Spiele</strong>r i eine Strategie ˆsi gibt, die nach<br />
h t echt besser gegen s ∗ −i ist als s ∗ i und an wenigstens zwei<br />
<strong>Information</strong>smengen von s ∗ i abweicht.<br />
Wir suchen jetzt die “letzte” <strong>Information</strong>smenge, an der eine<br />
Abweichung von s ∗ i echt profitabel ist: Betrachte den<br />
letzten Zeitpunkt, an dem es eine <strong>Information</strong>smenge gibt,<br />
in der ˆsi von s ∗ i abweicht. Wenn ˆsi zu keiner strikten Verbesserung<br />
führt, falls diese <strong>Information</strong>smenge erreicht wird,
Spieltheorie (Winter 2009/10) 3-39 Prof. Dr. Ana B. Ania<br />
dann ersetze diesen Teil von ˆsi durch den entsprechenden<br />
Teil von s ∗ i und gehe zur nun “letzten” <strong>Information</strong>smenge<br />
<strong>mit</strong> einer Abweichung. Tue das solange, bis die “letzte” <strong>Information</strong>smenge<br />
gefunden ist, in der ˆsi echt besser ist als<br />
s ∗ i . Die Geschichte, die zu dieser <strong>Information</strong>smenge führt,<br />
nennen wir ˜ h ˜t .<br />
Betrachte jetzt eine Strategie ˜si,die<strong>mit</strong>s ∗ i in allen <strong>Information</strong>smengen<br />
übereinstimmt, bis auf diejenige im Anschluss<br />
an ˜ h ˜t , die wir im letzten Abschnitt gefunden haben. An dieser<br />
<strong>Information</strong>smenge stimmt die Strategie <strong>mit</strong> ˆsi überein.<br />
In allen folgenden <strong>Information</strong>smengen ist sie aber wieder<br />
identisch <strong>mit</strong> s ∗ i . Aufgrund unserer Konstruktion muss gelten:<br />
˜si ist gegen s ∗ −i echt besser als s ∗ i ,wenn ˜ h ˜t erreicht wird.<br />
˜si weicht von s ∗ i in nur einer einzigen <strong>Information</strong>smenge<br />
ab.<br />
Also ist eine profitable Abweichung <strong>mit</strong> einfacher Abweichung<br />
gefunden. Das ist ein Widerspruch zu der Annahme,<br />
dass s ∗ i die Bedingung des Einmal-Abweichungsprinzips<br />
erfüllt.<br />
Q.E.D.
Spieltheorie (Winter 2009/10) 3-40 Prof. Dr. Ana B. Ania<br />
Beweisskizze für <strong>Spiele</strong> <strong>mit</strong> unendlichem Horizont:<br />
Bei unendlichem Horizont muss es keine “letzte” <strong>Information</strong>smenge<br />
<strong>mit</strong> einer profitablen Abweichung geben. Was<br />
dann?<br />
Wenn die Strategie ˆsi gegen s ∗ −i echt besser ist als s ∗ i ,dann<br />
existiert ein ɛ>0, sodass<br />
ui(ˆsi,s ∗ −i | h t ) >ui(s ∗ i ,s ∗ −i | h t )+ɛ.<br />
Wenn die <strong>Spiele</strong>r zukünftige Auszahlungen diskontieren, dann<br />
existiert ein t