24.08.2013 Aufrufe

3 Dynamische Spiele mit vollständiger Information 3.1 ...

3 Dynamische Spiele mit vollständiger Information 3.1 ...

3 Dynamische Spiele mit vollständiger Information 3.1 ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Spieltheorie (Winter 2009/10) 3-1 Prof. Dr. Ana B. Ania<br />

3 <strong>Dynamische</strong> <strong>Spiele</strong> <strong>mit</strong> <strong>vollständiger</strong><br />

<strong>Information</strong><br />

Literaturhinweise zu Kapitel 3:<br />

Osborne (2004), Kapitel 5-7<br />

Gibbons (1992), Kapitel 2<br />

MasColell, Whinston, Green (1995), Kapitel 7 und 9A+B<br />

Fudenberg und Tirole (1991), Kapitel 3 und 4<br />

<strong>3.1</strong> Rückwärtsinduktion<br />

Bisher hatten wir Situationen betrachtet, in denen beide<br />

Parteien simultan über ihre Strategie entscheiden müssen.<br />

Jetzt betrachten wir etwas kompliziertere zeitliche Strukturen.<br />

Dabei beschränken wir uns zunächst auf <strong>Spiele</strong> <strong>mit</strong><br />

<strong>vollständiger</strong> und perfekter <strong>Information</strong>, d.h., alle <strong>Spiele</strong>r<br />

spielen sequentiell, und jeder <strong>Spiele</strong>r beobachtet alle vorangegangenen<br />

Züge.<br />

Klaus M. Schmidt 2007


Spieltheorie (Winter 2009/10) 3-2 Prof. Dr. Ana B. Ania<br />

Die Zeitstruktur eines Spiels<br />

①<br />

<br />

①<br />

<br />

<br />

<strong>Spiele</strong>r 2<br />

<strong>Spiele</strong>r 1<br />

Aktion 1 Aktion 2<br />

<br />

①<br />

<br />

<br />

<br />

<strong>Spiele</strong>r 2<br />

Aktion 3 Aktion 4 Aktion 3 Aktion 4<br />

<br />

a<br />

c<br />

b<br />

d<br />

Beispiel 1: IBM vs. Intel<br />

<br />

e<br />

g<br />

f<br />

h<br />

Abb. <strong>3.1</strong>: Ein Spielbaum<br />

In den frühen 70er Jahren ist Intel der einzige Lieferant<br />

von IBM für bestimmte Computerchips. IBM steht vor der<br />

Wahl, entweder Intel als einzigen Lieferanten zu behalten<br />

oder einen zweiten Lieferanten (AMD) aufzubauen.<br />

Ohne einen zweiten Lieferanten kann Intel seine Monopolmacht<br />

ausnutzen. Dann würde IBM einen Gewinn von 10<br />

und Intel einen Gewinn von 90 erhalten. Intel kündigt jedoch<br />

an, auf das Ausnutzen der Monopolstellung zu verzichten<br />

und die Gewinne gleichmäßig aufzuteilen (jeder bekommt<br />

einen Gewinn von 50). Wenn sich IBM entscheidet, AMD<br />

als zweiten Lieferanten aufzubauen, erhält IBM einen Gewinn<br />

von 40 und Intel einen Gewinn von 30.


Spieltheorie (Winter 2009/10) 3-3 Prof. Dr. Ana B. Ania<br />

Sollte IBM eine zweite Lieferantenbeziehung aufbauen oder<br />

darauf verzichten?<br />

Zeichnen Sie den Spielbaum für dieses Spiel.<br />

Bestimmen Sie die Normalform für dieses Spiel.


Spieltheorie (Winter 2009/10) 3-4 Prof. Dr. Ana B. Ania<br />

Beispiel 2: Marktzutrittsspiel<br />

Zutreter<br />

①<br />

<br />

<br />

<br />

0<br />

2<br />

N E<br />

<br />

①<br />

k<br />

<br />

<br />

−1<br />

−1<br />

Monopolist<br />

n<br />

<br />

2<br />

1<br />

Abb. 3.2: Marktzutrittsspiel<br />

Der Marktzutreter entscheidet, ob er eintritt (E) oder<br />

nicht (N).<br />

Der Monopolist entscheidet, ob er kämpft (k) oder nicht<br />

kämpft und sich den Markt teilt (n).<br />

Ein sequentielles Spiel <strong>mit</strong> endlich vielen Stufen und perfekter<br />

<strong>Information</strong> wird von hinten (durch Rückwärtsinduktion)<br />

gelöst.<br />

Monopolist: Gegeben, dass der Zutreter eingetreten ist,<br />

ist es für mich optimal, den Markt zu teilen.<br />

Zutreter: Wenn ich zutrete, wird der Monopolist den<br />

Markt teilen. Also sollte ich zutreten.<br />

Das Ergebnis der Rückwärtsinduktion ist also (E,n).


Spieltheorie (Winter 2009/10) 3-5 Prof. Dr. Ana B. Ania<br />

Rückwärtsinduktion und Nash-Gleichgewicht<br />

Das Ergebnis der Rückwärtsinduktion ist ein Nash-GG:<br />

Gegeben, dass der Zutreter E spielt, ist für den Monopolisten<br />

n optimal.<br />

Gegeben, dass der Monopolist n spielt, ist für den Zutreter<br />

E optimal.<br />

❅❅<br />

Z<br />

N<br />

E<br />

❅<br />

M<br />

❅<br />

❅<br />

k<br />

n<br />

0, 2 0, 2<br />

-1, -1 2, 1<br />

Abb. 3.3: Normalform des Marktzutrittsspiels<br />

Analyse der Normalform zeigt, dass es noch ein zweites<br />

Nash-GG gibt: (N,k).<br />

Diese Strategie des Monopolisten ist nicht optimal, wenn<br />

der Zutreter E spielen sollte. Aber: Im Nash-GG (N,k) tritt<br />

der Zutreter eben nicht ein, also ist dieser Fall irrelevant.<br />

Trotzdem ist das Nash-GG (N,k) nicht überzeugend. Der<br />

Monopolist “droht”, zu kämpfen, falls der Zutreter zutritt.


Spieltheorie (Winter 2009/10) 3-6 Prof. Dr. Ana B. Ania<br />

Das ist eine unglaubwürdige Drohung, weilesnicht<br />

im Interesse des Monopolisten liegt, sie im Fall des Falles<br />

tasächlich wahr zu machen.<br />

Die Unglaubwürdigkeit einer Drohung lässt sich aus der Normalform<br />

des Spiels nicht erkennen. Darum werden wir bei<br />

dynamischen <strong>Spiele</strong>n oft die extensive Form des Spiels<br />

betrachten, die die Zeit- und <strong>Information</strong>sstruktur explizit<br />

macht.<br />

Ziel: Verfeinerung des Nash-Gleichgewichts. D.h.,<br />

Ausschluss von Gleichgewichten, die unglaubwürdige Drohungen<br />

enthalten.<br />

Bevor wir das tun, werden wir aber ein paar weitere Anwendungsbeispiele<br />

für Rückwärtsinduktion betrachten


Spieltheorie (Winter 2009/10) 3-7 Prof. Dr. Ana B. Ania<br />

3.2 Anwendungsbeispiele für Rückwärtsinduktion<br />

3.2.1 Stackelberg-Duopol<br />

Heinrich von Stackelberg (1934)<br />

1) Unternehmen 1, der Stackelberg-Führer, wählt seine Menge<br />

x1.<br />

2) Unternehmen 2, der Stackelberg-Anpasser, beobachtet<br />

x1 und wählt seine Menge x2.<br />

3) Auf dem Markt ergibt sich der Preis als Funktion der<br />

gesamten Menge: p = p(x1 + x2).<br />

Dieses Modell wird oft verwendet, wenn es auf einem Markt<br />

einen dominanten Anbieter gibt, an den alle übrigen Anbieter<br />

ihr Verhalten anpassen.<br />

Beispiele:<br />

Saudi-Arabien als größter Ölproduzent legt seine Menge<br />

als erster fest. Andere Ölproduzenten passen sich an.<br />

Südafrika: Dominierender Diamantenproduzent De Beers.<br />

Andere Marktführer: Microsoft, IBM, Telekom, etc., aber<br />

hier geht es meist um Preis- und/oder Qualitätswettbewerb<br />

bei heterogenen Gütern.


Spieltheorie (Winter 2009/10) 3-8 Prof. Dr. Ana B. Ania<br />

Das Entscheidungsproblem des Anpassers<br />

Der Anpasser maximiert seinen Gewinn<br />

π2 = p(x1 + x2)x2 − c2(x2)<br />

durch geeignete Wahl von x2. Dabei liegt die Menge x1<br />

bereits fest und ist bekannt.<br />

Bedingung erster Ordnung (BEO) für Gewinnmaximum:<br />

p(x1 + x ∗ 2)+ dp(x1 + x∗ 2)<br />

x2 =<br />

dx2<br />

dc2(x∗ 2)<br />

dx2<br />

Diese Bedingung legt die optimale Menge x ∗ 2 als Funktion<br />

von x1 fest, d.h.:<br />

x ∗ 2 = R2(x1)<br />

Die Funktion R2(x1) wird Reaktionsfunktion von Unternehmen<br />

2 genannt.<br />

Beispiel:<br />

Lineare Nachfrage: p(x1 + x2) =a − b · (x1 + x2)<br />

Konstante Grenzkosten: c1(x) =c2(x) =c · x<br />

Gewinnfunktion des Anpassers:<br />

π2 = [a − b(x1 + x2)] · x2 − c · x2<br />

BEO für Gewinnmaximum:<br />

a − b(x1 + x2) − bx2 = c


Spieltheorie (Winter 2009/10) 3-9 Prof. Dr. Ana B. Ania<br />

Gewinnfunktion ist streng konkav:<br />

dπ2 2<br />

d2x2 = −2b < 0<br />

Reaktionsfunktion des Anpassers:<br />

x2 = a − bx1 − c<br />

2b<br />

= a − c<br />

Das Problem des Marktführers<br />

2b<br />

− 1<br />

2 x1<br />

Der Marktführer kennt das Entscheidungsproblem des Anpassers<br />

und weiß, dass er die Menge x ∗ 2 = R2(x1) wählen<br />

wird. Also ist sein Gewinnmaximierungsproblem:<br />

max<br />

x1 p(x1 + R2(x1)) · x1 − c1(x1)<br />

BEO für Gewinnmaximum:<br />

p(x ∗ 1 + R(x ∗ ⎜<br />

1)) + ⎝1+ dR2<br />

dx1<br />

⎛<br />

⎞<br />

⎟<br />

⎠<br />

dp<br />

dx x∗ 1 = dc1<br />

dx1<br />

Der Stackelberg-Führer berücksichtigt nicht nur, wie eine<br />

zusätzliche Einheit den Martkpreis direkt senkt, sondern<br />

auch, wie sie die Menge seines Konkurrenten und da<strong>mit</strong><br />

indirekt den Marktpreis beeinflusst.


Spieltheorie (Winter 2009/10) 3-10 Prof. Dr. Ana B. Ania<br />

Im Beispiel:<br />

Gewinnfunktion des Marktführers:<br />

π1 =[a−b(x1 + R2(x1))] · x1 − c · x1<br />

= a − c<br />

· x1 −<br />

2<br />

b<br />

2 · x21 BEO für Gewinnmaximum:<br />

a − c<br />

2 − bx∗1 = 0<br />

x ∗ a − c<br />

1 =<br />

2b<br />

Nachdem wir die optimale Menge des Stackelberg-Führers<br />

kennen, können wir sie in die Reaktionsfunktion des Anpassers<br />

einsetzen, um dessen Menge, die gesamte Menge, und<br />

denMarktpreiszubestimmen.<br />

Einsetzen von x ∗ 1 in R2(x1) ergibt:<br />

x ∗ 2 =<br />

Die gesamte Menge ist also:<br />

x1 + x2 =<br />

Der Marktpreis ergibt sich als:<br />

p ∗ =<br />

a − c<br />

4b<br />

3(a − c)<br />

4b<br />

a +3c<br />

4


Spieltheorie (Winter 2009/10) 3-11 Prof. Dr. Ana B. Ania<br />

Vergleich zum Cournot-Duopol<br />

Der Gewinn des Stackelberg-Führers ist immer höher als<br />

der Gewinn eines Cournot-Duopolisten. Warum?<br />

Im Stackelberg-Spiel ist der Anpasser besser informiert<br />

als ein Duopolist im Cournot-Spiel. Er kann beobachten,<br />

welche Menge der Stackelberg-Führer auf den Markt<br />

wirft. Trotzdem geht es dem Anpasser schlechter als<br />

dem Cournot-Duopolisten. Warum?<br />

In Ein-Personen-Entscheidungssituationen ist es unmöglich,<br />

dass sich der Entscheidungsträger schlechter stellt,<br />

wenn er zusätzliche <strong>Information</strong>en oder zusätzliche Handlungsmöglichkeiten<br />

bekommt.<br />

In interpersonellen Entscheidungssituationen ist es dagegen<br />

oft besser, weniger <strong>Information</strong>en oder weniger<br />

Handlungsmöglichkeiten zu haben. Beispiele:<br />

– Cournot- versus Stackelberg-Spiel.<br />

– Chicken-Spiel: Angenommen, einer der Fahrer kann<br />

sein Lenkrad aus dem Fenster werfen und sich da<strong>mit</strong><br />

die Möglichkeit zum Ausweichen nehmen.<br />

⇒ Gegenspieler wird ausweichen.<br />

– Viele andere Beispiele für Selbstbindung (Com<strong>mit</strong>ment).


Spieltheorie (Winter 2009/10) 3-12 Prof. Dr. Ana B. Ania<br />

3.2.2 Löhne und Beschäftigung<br />

Leontief (1946), später in zahlreichen Variationen.<br />

Zweistufiges Spiel:<br />

1. Gewerkschaft bestimmt den Lohnsatz, w.<br />

2. Unternehmen bestimmt die Beschäftigungsmenge, L.<br />

Auszahlungsfunktionen:<br />

Gewerkschaft:<br />

U(w, L),<br />

streng monoton steigend in w und L,<br />

quasikonkav (konvexe Indifferenzkurven)<br />

Unternehmen:<br />

π(w, L) =R(L) − wL,<br />

R(L) steigend und streng konkav,<br />

limL→0 R ′ (L) =∞,<br />

limL→∞ R ′ (L) =0.


Spieltheorie (Winter 2009/10) 3-13 Prof. Dr. Ana B. Ania<br />

Rückwärtsinduktion<br />

Unternehmen:<br />

R<br />

max R(L) − wL<br />

L≥0<br />

BEO (hier notwendig und hinreichend):<br />

R ′ (L) − w =0<br />

Die optimale Beschäftigungsmenge L∗ (w) ist eine fallende<br />

Funktion von w. (Warum?)<br />

Isogewinnlinien:<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

R(L) − wL = c ⇒ w =<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

L<br />

w<br />

<br />

<br />

<br />

R(L) − c<br />

L<br />

Abb. 3.4: Gewinnmaximum und Isogewinnlinien der<br />

Unternehmung<br />

<br />

<br />

<br />

L


Spieltheorie (Winter 2009/10) 3-14 Prof. Dr. Ana B. Ania<br />

Gewerkschaft antizipiert L ∗ (w):<br />

w<br />

BEO:<br />

<br />

<br />

<br />

∂U<br />

∂w<br />

max<br />

w≥0 U(w, L∗ (w))<br />

∂U dL<br />

+<br />

∂L<br />

∗ (w)<br />

dw<br />

<br />

<br />

<br />

L<br />

w<br />

<br />

<br />

<br />

= 0<br />

Abb. 3.5: Nutzenmaximum der Gewerkschaft, Ineffizienz<br />

Bemerkungen:<br />

1) Gewerkschaft sucht sich den besten Punkt auf der Reaktionsfunktion<br />

des Unternehmens.<br />

2) Aber das Ergebnis ist ineffizient: Gewerkschaften und<br />

Unternehmen könnten sich besser stellen, wenn sie den<br />

<br />

<br />

<br />

L


Spieltheorie (Winter 2009/10) 3-15 Prof. Dr. Ana B. Ania<br />

Lohn etwas verringerten und die Beschäftigung etwas<br />

erhöhten.<br />

3) Die Ineffizienz besteht, weil Gewerkschaft und Unternehmen<br />

nicht über Beschäftigung und Lohnhöhe gleichzeitig<br />

verhandeln. Warum wird das nicht gemacht?<br />

3.2.3 Zeitkonsistenz der Geldpolitik<br />

Barro und Gordon (1983)<br />

Zweistufiges Spiel zwischen Zentralbank und privatem Sektor:<br />

1. Die Privaten bilden Inflationserwartungen πe ,diesich<br />

insbesondere in Tarifabschlüssen niederschlagen.<br />

2. Die Zentralbank beobachtet πe und entscheidet über die<br />

Geldpolitik, die die tatsächliche Inflationsrate π determiniert.<br />

Stark stilisiertes Modell in reduzierter Form. Tarifabschlüsse,<br />

Transmissionsmechanismus von Geldpolitik auf realen und<br />

monetären Sektor etc. werden nicht explizit modelliert.<br />

Stattdessen: Zentralbank möchte die gesamtwirtschaftliche<br />

Wohlfahrt maximieren, indem sie die Verlustfunktion<br />

L(u, π) = u + γπ 2<br />

minimiert. Dabei ist u>0 die Arbeitslosenquote, γ>0.


Spieltheorie (Winter 2009/10) 3-16 Prof. Dr. Ana B. Ania<br />

Die Volkswirtschaft wird durch eine modifizierte Phillipskurve<br />

beschrieben:<br />

u = u n − α(π − π e )<br />

Die natürliche Arbeitslosenquote u n > 0 wird durch Tarifabschlüsse<br />

bestimmt. Die Zentralbank kann die tatsächliche<br />

Inflationsrate perfekt und ohne Zeitverzögerung steuern.<br />

Die privaten Wirtschaftssubjekte möchten die tatsächliche<br />

Inflation so gut wie möglich voraussagen:<br />

Rückwärtsinduktion<br />

U(π, π e )=−(π − π e ) 2<br />

Zentralbank: Inflationserwartungen liegen bereits fest.<br />

BEO:<br />

Daraus folgt:<br />

min<br />

π u n − α(π − π e )+γπ 2<br />

dL<br />

dπ<br />

= −α +2γπ = 0<br />

π ∗ = α<br />

2γ<br />

Beachten Sie: Die “optimale Inflationsrate” für die Zentralbank<br />

ist in diesem Modell unabhängig von den Inflationserwartungen<br />

der Privaten.


Spieltheorie (Winter 2009/10) 3-17 Prof. Dr. Ana B. Ania<br />

Private Wirtschaftssubjekte antizipieren π ∗ :<br />

max<br />

πe −(π∗ − π e ) 2<br />

Daraus folgt:<br />

π e = π ∗ = α<br />

2γ<br />

Für die Arbeitslosenquote ergibt sich:<br />

Bemerkungen:<br />

u = u n − α(π ∗ − π e ) = u n<br />

Ergebnis ist ineffizient: u = u n und π =0wäre besser.<br />

Problem der Zentralbank: Sie kann sich nicht binden,<br />

eine Inflationsrate von 0 zu wählen. Die Privaten antizipieren,<br />

dass die Bank ex post einen Anreiz hat, zu<br />

inflationieren.<br />

Der Anreiz zu inflationieren besteht, obwohl die Privaten<br />

die Inflation perfekt voraussehen und sie darum keine für<br />

die Zentralbank positiven Effekte hat.<br />

Regelgebundene Geldpolitik: Wenn die Zentralbank eine<br />

“Reputation” dafür aufbauen könnte, nie zu inflationieren,<br />

würde sie sich besserstellen. Siehe dazu das Kapitel<br />

über wiederholte <strong>Spiele</strong>.


Spieltheorie (Winter 2009/10) 3-18 Prof. Dr. Ana B. Ania<br />

3.3 Die extensive Form eines Spiels<br />

Definition <strong>3.1</strong> (Extensive Form) Die extensive<br />

Form eines Spiels spezifiziert:<br />

(1) die Menge der <strong>Spiele</strong>r {1,...,n};<br />

(2a) zu welchem Zeitpunkt welcher <strong>Spiele</strong>r am<br />

Zug ist;<br />

(2b) welche Aktionen einem <strong>Spiele</strong>r zur Verfügung<br />

stehen, wenn er am Zug ist;<br />

(2c) was ein <strong>Spiele</strong>r weiß, wenn er am Zug ist;<br />

(3) die Auszahlung eines jeden <strong>Spiele</strong>rs für jede<br />

mögliche Kombination von Zügen.<br />

Die Definition der extensiven Form ist ganz analog zu der<br />

der Normalform. Einziger Unterschied: Die Beschreibung<br />

der Strategienräume kann sehr viel komplexer sein.<br />

<strong>Spiele</strong> in extensiver Form können <strong>mit</strong> Hilfe eines Spielbaums<br />

beschrieben werden.


Spieltheorie (Winter 2009/10) 3-19 Prof. Dr. Ana B. Ania<br />

Ein Spielbaum besteht einer Menge von geordneten und<br />

<strong>mit</strong>einander verbundenen Knoten:<br />

Entscheidungsknoten: Hier kann genau ein <strong>Spiele</strong>r<br />

aus einer Menge von Aktionen auswählen. Jede Aktion<br />

führt zu einem neuen Entscheidungs- oder Endknoten.<br />

Endknoten: Hier endet das Spiel, und Auszahlungen<br />

werden zugeordnet.<br />

Der Spielbaum beginnt <strong>mit</strong> genau einem Anfangs-Entscheidungsknoten.<br />

Wir werden immer annehmen, dass ein Spielbaum sich echt<br />

verzweigt:<br />

Er wächst nicht in sich selbst zurück (keine Zyklen);<br />

Zweige wachsen nicht wieder zusammen (keine gemeinsamen<br />

Vorgänger).<br />

Gegenbeispiele?


Spieltheorie (Winter 2009/10) 3-20 Prof. Dr. Ana B. Ania<br />

Zufallszüge der Natur<br />

In vielen <strong>Spiele</strong>n gibt es exogene Unsicherheit. Wir können<br />

das modellieren, indem wir einen zusätzlichen <strong>Spiele</strong>r, die<br />

“Natur”, einführen, die aus der Menge der möglichen Zustände<br />

der Welt einen nach einer gegebenen Wahrscheinlichkeitsverteilung<br />

auswählt.<br />

Z<br />

①<br />

<br />

<br />

<br />

0<br />

2<br />

N E<br />

Natur<br />

①<br />

1<br />

1<br />

2<br />

2<br />

M M<br />

① <br />

<br />

①<br />

<br />

<br />

<br />

<br />

<br />

3<br />

<br />

−1<br />

<br />

1<br />

3 −1 1<br />

k n k n<br />

0<br />

0<br />

Abb. 3.6: Marktzutrittsspiel <strong>mit</strong> exogener Unsicherheit<br />

Nach der Zutrittsentscheidung realisiert sich der Zustand<br />

der Welt:<br />

ist die Nachfrage groß, beide<br />

können hohe Gewinne machen.<br />

Mit Wahrscheinlichkeit 1<br />

2<br />

ist die Nachfrage niedrig, beide<br />

machen bei Wettbewerb Verluste.<br />

Mit Wahrscheinlichkeit 1<br />

2


Spieltheorie (Winter 2009/10) 3-21 Prof. Dr. Ana B. Ania<br />

<strong>Information</strong>smengen<br />

Definition 3.2 (<strong>Information</strong>smenge) Eine <strong>Information</strong>smenge<br />

ist eine Menge von Entscheidungsknoten<br />

<strong>mit</strong> den Eigenschaften:<br />

Bei allen Entscheidungsknoten einer <strong>Information</strong>smenge<br />

ist derselbe <strong>Spiele</strong>r am Zug.<br />

Ein <strong>Spiele</strong>r kann die verschiedenen Knoten einer<br />

<strong>Information</strong>smenge nicht unterscheiden. Insbesondere<br />

hat er an jedem Knoten einer <strong>Information</strong>smenge<br />

dieselbe Menge von Aktionen.<br />

Jeder Entscheidungsknoten gehört zu genau einer<br />

<strong>Information</strong>smenge.<br />

Beispiele:<br />

<br />

1<br />

①<br />

2 <br />

①<br />

<br />

g ℓ<br />

<br />

<br />

−3<br />

−3<br />

<br />

G L<br />

2<br />

g ℓ<br />

<br />

0<br />

<br />

−5<br />

−5<br />

0<br />

①<br />

<br />

<br />

<br />

−1<br />

−1<br />

Abb. 3.7: Das Gefangenen-Dilemma


Spieltheorie (Winter 2009/10) 3-22 Prof. Dr. Ana B. Ania<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

<br />

<br />

<br />

<br />

<br />

1<br />

2 2<br />

1 1 1 1<br />

①<br />

<br />

<br />

<br />

Abb. 3.8: Mögliche und unmögliche <strong>Information</strong>smengen<br />

Wenn ein Spiel nur einelementige <strong>Information</strong>smengen enthält,<br />

sprechen wir von einem Spiel <strong>mit</strong> perfekter <strong>Information</strong><br />

(nicht zu verwechseln <strong>mit</strong> <strong>vollständiger</strong> <strong>Information</strong>).<br />

Gibt es mehrelementige <strong>Information</strong>smengen sprechen wir<br />

von einem Spiel <strong>mit</strong> imperfekter <strong>Information</strong> (nicht zu<br />

verwechseln <strong>mit</strong> un<strong>vollständiger</strong> <strong>Information</strong>).<br />

Strategien<br />

Definition 3.3 (Strategie) Eine Strategie ist ein<br />

vollständig konditionierter Aktionsplan: Für jede <strong>Information</strong>smenge,<br />

in der der <strong>Spiele</strong>r am Zug ist, spezifiziert<br />

sie eine mögliche Aktion, d.h., sie konditioniert<br />

die Aktion auf die von <strong>Spiele</strong>r i beobachtete<br />

bisherige Geschichte des Spiels.


Spieltheorie (Winter 2009/10) 3-23 Prof. Dr. Ana B. Ania<br />

Beispiele:<br />

1<br />

①<br />

2 <br />

①<br />

<br />

ℓ r<br />

<br />

<br />

3<br />

1<br />

1<br />

2<br />

L R<br />

2<br />

1<br />

①<br />

ℓ<br />

<br />

<br />

2<br />

r<br />

<br />

0<br />

0<br />

Abb. 3.9: Strategien in einem Spiel <strong>mit</strong> perfekter<br />

<strong>Information</strong><br />

<strong>Spiele</strong>r 1 hat 2 Strategien: L, R<br />

<strong>Spiele</strong>r 2 hat 4 Strategien: ℓℓ, ℓr, rℓ, rr<br />

❅❅<br />

❅<br />

❅<br />

❅<br />

1<br />

L<br />

R<br />

2<br />

ℓℓ ℓr rℓ rr<br />

3, 1 3, 1 1, 2 1, 2<br />

2, 1 0, 0 2, 1 0, 0<br />

Abb. <strong>3.1</strong>0: Normalform dieses Spiels


Spieltheorie (Winter 2009/10) 3-24 Prof. Dr. Ana B. Ania<br />

①<br />

L R<br />

<br />

①<br />

<br />

①<br />

ℓ r<br />

ℓ<br />

<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

<br />

<br />

<br />

<br />

<br />

1<br />

2 2<br />

r<br />

1 1 1 1<br />

L ′ R ′ L ′ R ′ L ′′ R ′′ L ′′ R ′′<br />

①<br />

<br />

<br />

<br />

Abb. <strong>3.1</strong>1: Strategien in einem Spiel <strong>mit</strong> imperfekter<br />

<strong>Information</strong><br />

Strategien von <strong>Spiele</strong>r 1:<br />

Strategien von <strong>Spiele</strong>r 2:<br />

Jedes Spiel in extensiver Form kann in ein Spiel in Normalform<br />

überführt werden.<br />

Aber: Zu einem Spiel in Normalform können mehrere verschiedene<br />

<strong>Spiele</strong> in extensiver Form existieren.


Spieltheorie (Winter 2009/10) 3-25 Prof. Dr. Ana B. Ania<br />

3.4 Teilspielperfekte Gleichgewichte<br />

Definition 3.4 (Teilspiel) Ein Teilspiel eines Spiels<br />

in extensiver Form<br />

a) beginnt in einem Entscheidungsknoten K einer<br />

einelementigen <strong>Information</strong>smenge,<br />

b) beinhaltet alle Entscheidungs- und Endknoten,<br />

die K nachfolgen, aber keine Knoten, die K nicht<br />

nachfolgen,<br />

c) durchtrennt keine nachfolgenden <strong>Information</strong>smengen.<br />

①<br />

L R<br />

<br />

①<br />

<br />

①<br />

ℓ r<br />

ℓ<br />

<br />

①<br />

<br />

①<br />

<br />

①<br />

<br />

<br />

<br />

<br />

<br />

<br />

1<br />

2 2<br />

r<br />

1 1 1 1<br />

L ′ R ′ L ′ R ′ L ′′ R ′′ L ′′ R ′′<br />

Abb. <strong>3.1</strong>2: Teilspiele<br />


Spieltheorie (Winter 2009/10) 3-26 Prof. Dr. Ana B. Ania<br />

Intuitiv ist ein Teilspiel einfach ein Teil des gesamten Spiels,<br />

der in einem Knoten beginnt und alle nachfolgenden Knoten<br />

enthält. An diesem Knoten muss die gesamte bisherige<br />

Geschichte des Spiels dem <strong>Spiele</strong>r, der hier am Zug ist, bekannt<br />

sein.<br />

Ein Teilspiel kann isoliert betrachtet und analysiert werden.<br />

Die folgende Definition stammt von Reinhard Selten (1965).<br />

Definition 3.5 (Teilspielperfekte GG) Ein Nash-<br />

Gleichgewicht ist teilspielperfekt, wenn die Strategien<br />

der <strong>Spiele</strong>r in jedem Teilspiel ein Nash-Gleichgewicht<br />

bilden.<br />

Beispiel:<br />

1<br />

①<br />

2 <br />

①<br />

<br />

ℓ r<br />

<br />

<br />

3<br />

1<br />

1<br />

2<br />

L R<br />

2<br />

1<br />

①<br />

ℓ<br />

<br />

<br />

2<br />

r<br />

<br />

0<br />

0<br />

Abb. <strong>3.1</strong>3: Teilspielperfektes Nash-Gleichgewicht


Spieltheorie (Winter 2009/10) 3-27 Prof. Dr. Ana B. Ania<br />

Analyse der Teilspiele:<br />

Gegeben, dass <strong>Spiele</strong>r 1 L gewählt hat, sollte 2 r spielen.<br />

Gegeben, dass <strong>Spiele</strong>r 1 R gewählt hat, sollte 2 ℓ spielen.<br />

Gegeben das Verhalten von 2 sollte 1 R spielen.<br />

Das teilspielperfekte Nash-Gleichgewicht ist (R, rl).<br />

Beachten Sie:<br />

Der Gleichgewichtspfad ist (R, l)<br />

Aber: Das Gleichgewicht muss auch angeben, was außerhalb<br />

des Gleichgewichtspfades passieren würde. Darum<br />

ist das Gleichgewicht (R, rl).<br />

Es existiert ein zweites Nash-Gleichgewicht: (L, rr).<br />

Aber, dieses Nash-GG ist nicht teilspielperfekt. Es enthält<br />

die unglaubwürdige Drohung, dass <strong>Spiele</strong>r 2 r spielt,<br />

sollte <strong>Spiele</strong>r 1 R spielen.<br />

Teilspielperfektheit ist nicht nur für <strong>Spiele</strong> <strong>mit</strong> perfekter<br />

<strong>Information</strong>, sondern auch für beliebige <strong>Spiele</strong> <strong>mit</strong><br />

imperfekter <strong>Information</strong> wohldefiniert.


Spieltheorie (Winter 2009/10) 3-28 Prof. Dr. Ana B. Ania<br />

Satz <strong>3.1</strong> Jedes endliche Spiel in extensiver Form<br />

hat wenigstens ein teilspielperfektes Nash-Gleichgewicht.<br />

Beweisskizze: Der Beweis ist konstruktiv und zeigt, wie man<br />

ein teilspielperfektes Gleichgewicht finden kann. Das Verfahren<br />

ist eine Verallgemeinerung der Rückwärtsinduktion.<br />

1) Beginne am Ende des Spielbaums und bestimme für<br />

alle letzten Teilspiele die Nash-Gleichgewichte. Da es<br />

sich bei diesen letzten <strong>Spiele</strong>n um endliche <strong>Spiele</strong> handelt,<br />

muss in jedem von ihnen wenigstens ein Nash-<br />

Gleichgewicht (eventuell in gemischten Strategien) existieren.<br />

2) Wähle für jedes dieser Teilspiele ein Nash-Gleichgewicht<br />

aus und ersetze das Teilspiel durch den Vektor der Gleichgewichtsauszahlungen.<br />

3) Wiederhole diese Schritte für das reduzierte Spiel solange,<br />

bis alle Züge im gesamten Spiel bestimmt sind.<br />

Da<strong>mit</strong> ist ein teilspielperfektes Nash-Gleichgewicht gefunden.


Spieltheorie (Winter 2009/10) 3-29 Prof. Dr. Ana B. Ania<br />

Satz 3.2 Jedes endliche Spiel in extensiver Form<br />

<strong>mit</strong> perfekter <strong>Information</strong> hat generisch ein eindeutiges<br />

teilspielperfektes Nash-Gleichgewicht.<br />

Beweis: Bei perfekter <strong>Information</strong> gibt es auf jeder Stufe<br />

der Rückwärtsinduktion nur einfache Ein-Personen-Entscheidungsprobleme.<br />

Da diese Probleme endlich sind, haben<br />

sie eine Lösung. Generisch führen unterschiedliche Aktionen<br />

nie zu denselben Auszahlungen. Also gibt es auf jeder Stufe<br />

eine eindeutige optimale Aktion, und folglich auch ein<br />

eindeutiges Nash-Gleichgewicht.<br />

Bemerkungen:<br />

1. Dieser Satz wurde schon von Zermelo (1913) bewiesen.<br />

2. Bei <strong>Spiele</strong>n <strong>mit</strong> imperfekter <strong>Information</strong> kann es natürlich<br />

mehrdeutige Gleichgewichte in einem Teilspiel geben.<br />

Die Menge aller TPGG im gesamten Spiel erhält man,<br />

indem man die Rückwärtsinduktion <strong>mit</strong> jeder möglichen<br />

Kombination aller möglichen Gleichgewichte durchführt.


Spieltheorie (Winter 2009/10) 3-30 Prof. Dr. Ana B. Ania<br />

Beispiel: Ein Spiel <strong>mit</strong> imperfekter <strong>Information</strong><br />

Betrachten Sie das folgende Spiel <strong>mit</strong> zwei Perioden, bei<br />

dem die <strong>Spiele</strong>r in der ersten Periode ein Gefangenen-Dilemma<br />

und in der zweiten Periode ein Koordinationsspiel spielen:<br />

❅❅<br />

A<br />

B<br />

cooperate defect<br />

❅<br />

❅<br />

❅<br />

cooperate<br />

defect<br />

❅❅<br />

A<br />

L<br />

R<br />

❅<br />

B<br />

❅<br />

❅<br />

2, 2 -1, 3<br />

3, -1 0, 0<br />

ℓ<br />

r<br />

x, x 0, 0<br />

0, 0<br />

y, y<br />

Fig. 4.12: SPE of a Game of Imperfect <strong>Information</strong><br />

Was sind die teilspielperfekten Gleichgewichte dieses Spiels?<br />

Unter welcher Annahme an x und y kann ein teilspielperfektes<br />

Gleichgewicht gestützt werden, bei dem die beiden<br />

<strong>Spiele</strong>r in der ersten Periode kooperieren?


Spieltheorie (Winter 2009/10) 3-31 Prof. Dr. Ana B. Ania<br />

3.5 Teilspielperfektheit und Rationalität<br />

Teilspielperfektheit erfordert, dass es “Common Knowledge”<br />

ist, dass alle <strong>Spiele</strong>r rational sind. Betrachten Sie das<br />

folgende Spiel:<br />

1<br />

①<br />

L R<br />

2<br />

<br />

①<br />

<br />

2 ℓ r<br />

0<br />

1<br />

<br />

①<br />

<br />

1<br />

1<br />

<br />

<br />

3<br />

0<br />

L ′ R ′<br />

<br />

0<br />

2<br />

Abb. <strong>3.1</strong>4: Rationalität und Rückwärtsinduktion<br />

Rückwärtsinduktion ergibt, dass <strong>Spiele</strong>r 1 L spielen und das<br />

Spiel da<strong>mit</strong> beenden sollte. Begründung: Wenn <strong>Spiele</strong>r 1 R<br />

spielt, sollte <strong>Spiele</strong>r 2 ℓ spielen, denn würde er r spielen,<br />

würde <strong>Spiele</strong>r 1 in der letzten Runde L ′ spielen.<br />

Angenommen, <strong>Spiele</strong>r 1 spielt dennoch R.<br />

Zeigt er da<strong>mit</strong> nicht, dass er irrational ist?<br />

Wenn <strong>Spiele</strong>r 1 aber irrational ist, sollte <strong>Spiele</strong>r 2 dann


Spieltheorie (Winter 2009/10) 3-32 Prof. Dr. Ana B. Ania<br />

nicht vielleicht doch lieber r spielen, in der Hoffnung,<br />

dass <strong>Spiele</strong>r 1 sich in der letzten Runde ebenfalls irrational<br />

verhält und R ′ spielt?<br />

Wenn <strong>Spiele</strong>r 2 durch diese Argumentation verleitet wird,<br />

r zu spielen, sollte dann nicht auch ein rationaler <strong>Spiele</strong>r<br />

1 R in Runde 1 spielen?<br />

Rückwärtsinduktion ist nur solange überzeugend, solange<br />

Abweichungen vom Rückwärtsinduktionspfad rational erklärt<br />

werden können. Das hat Selten (1975) motiviert, das<br />

Konzept des “perfekten Gleichgewichts” einzuführen:<br />

1) Es ist common knowledge, beide <strong>Spiele</strong>r sind rational.<br />

2) Aber: Beide <strong>Spiele</strong>r machen <strong>mit</strong> sehr kleinen Wahrscheinlichkeiten<br />

Fehler: ihre Hände zittern bei der Auswahl<br />

der Strategien. Mit Wahrscheinlichkeit 1 − ɛ spielt jeder<br />

<strong>Spiele</strong>r die intendierte Strategie, aber <strong>mit</strong> Wahrscheinlichkeit<br />

ɛ macht er einen Fehler und wählt eine andere<br />

(zufällig ausgewählte) Strategie. Die Wahl von R kann<br />

dann als nicht intendierter Fehler von 1 interpretiert werden<br />

und bedeutet nicht, dass 1 irrational ist.<br />

3) Ein perfektes Gleichgewicht ist der Limes einer Folge<br />

von Gleichgewichten, in denen jeder <strong>Spiele</strong>r <strong>mit</strong> Wahrscheinlichkeit<br />

ɛ einen Fehler macht, wenn ɛ gegen 0 konvergiert.


Spieltheorie (Winter 2009/10) 3-33 Prof. Dr. Ana B. Ania<br />

Das folgende Spiel soll noch einmal darauf hinweisen, dass<br />

Teilspielperfektheit nicht immer völlig plausibel sein muss.<br />

<strong>Spiele</strong>r 1 und 2 sind abwechselnd am Zug und können jedesmal<br />

entscheiden, ob das Spiel enden oder weitergehen<br />

soll.<br />

1 2 1 2 1 2<br />

①①① ①<br />

①<br />

①<br />

<br />

w w w<br />

w w<br />

s s s<br />

s s<br />

<br />

<br />

<br />

<br />

<br />

<br />

1<br />

1<br />

0<br />

3<br />

<br />

2<br />

<br />

97<br />

2<br />

100<br />

s<br />

<br />

99<br />

<br />

98<br />

99 101<br />

Abb. <strong>3.1</strong>5: Rosenthals Hundertfüßler<br />

w<br />

<br />

100<br />

100<br />

Das eindeutige TPGG ist, dass jeder <strong>Spiele</strong>r das Spiel beendet,<br />

wenn er zum Zug kommt.<br />

Was passiert, wenn <strong>Spiele</strong>r 1 das Spiel in Periode 1 nicht<br />

beendet? Sollte <strong>Spiele</strong>r 2 sich dennoch an das Gleichgewicht<br />

halten?<br />

Ob dieses TPGG überzeugend ist oder nicht, hängt entscheidend<br />

davon ab, wie die <strong>Spiele</strong>r Abweichungen vom Gleichgewichtspfad<br />

interpretieren.


Spieltheorie (Winter 2009/10) 3-34 Prof. Dr. Ana B. Ania<br />

3.6 Ein Zermürbungskrieg<br />

Das klassische Beispiel für einen Zermürbungskrieg stammt<br />

aus der Biologie (Maynard S<strong>mit</strong>h, 1974): Kampf zweier Tiere<br />

um ein Territorium.<br />

Wir betrachten dieses Spiel nur in diskreter Zeit <strong>mit</strong> unendlichem<br />

Horizont:<br />

Folge von Zeitpunkten: t =0, 1, 2,...<br />

In jeder Periode entscheiden beide <strong>Spiele</strong>r simultan, ob sie<br />

“kämpfen” oder “aufgeben” sollen.<br />

Wenn beide kämpfen, verlieren beide eine Nutzeneinheit<br />

pro Periode, und das Spiel geht weiter.<br />

Wenn einer aufgibt, der andere aber nicht, erhält der<br />

Gewinner einer Preis im Wert v, der Verlierer nichts,<br />

und das Spiel ist zu Ende.<br />

Wenn beide gleichzeitig aufgeben, sind beide Verlierer<br />

und erhalten beide nichts.<br />

Auszahlungen: Sei ˆt die Periode, in der der Verlierer aufgegeben<br />

hat.<br />

Verlierer:<br />

uv(ˆt) =−(1 + δ + ···+ δ ˆt−1 ) · 1=− 1 − δ ˆt<br />

1 − δ


Spieltheorie (Winter 2009/10) 3-35 Prof. Dr. Ana B. Ania<br />

Gewinner:<br />

ug(ˆt) =−(1+δ +···+δ ˆt−1 ˆt 1 − δ<br />

)·1+δ v = − ˆt<br />

1 − δ +δˆt v<br />

Existiert ein symmetrisches, stationäres TPGG?<br />

Ja, aber nur in gemischten Strategien.<br />

Angenommen beide <strong>Spiele</strong>r geben in jeder Periode <strong>mit</strong> Wahrscheinlichkeit<br />

p auf und kämpfen <strong>mit</strong> Wahrscheinlichkeit<br />

1 − p.<br />

Diese Strategien sind nur dann ein Gleichgewicht, wenn jeder<br />

<strong>Spiele</strong>r in jeder Periode indifferent ist, ob er aufgeben<br />

oder weiterkämpfen soll. Also muss in jeder Periode t gelten:<br />

Interpretation:<br />

0=pv+(1− p) · [−1+δ · 0]<br />

Die bisher verlorenen Nutzeneinheiten sind “sunk costs”.<br />

Wir brauchen also nur Auszahlungen zu betrachten, die<br />

von der jetzigen Periode an erhalten werden.<br />

0 ist die Auszahlung, wenn ich heute aufgebe.<br />

Wenn ich nicht aufgebe, gibt es zwei Möglichkeiten:<br />

– Mit Wahrscheinlichkeit p gibt mein Gegner auf, und<br />

ich bekomme v.


Spieltheorie (Winter 2009/10) 3-36 Prof. Dr. Ana B. Ania<br />

– Mit Wahrscheinlichkeit 1 − p gibt er nicht auf, was<br />

mich diese Runde eine Nutzeneinheit kostet. In der<br />

nächsten Runde bin ich dann wieder indifferent zwischen<br />

Aufgeben und Kämpfen. Also ist der Folge-<br />

Payoff ab der nächsten Runde genau 0.<br />

Auflösen ergibt:<br />

Bemerkungen:<br />

p ∗ = 1<br />

1+v<br />

1) Je höher der Preis v, um so kleiner ist die Wahrscheinlichkeit<br />

des Aufgebens.<br />

2) Das Ergebnis ist ineffizient, weil <strong>mit</strong> positiver Wahrscheinlichkeit<br />

gekämpft wird. Mit positiver Wahrscheinlichkeit<br />

sind die Kosten des Kämpfens sogar höher als<br />

der zu gewinnende Preis.<br />

3) Es gibt noch andere TPGG. Beispiel: <strong>Spiele</strong>r 1 wird immer<br />

kämpfen, <strong>Spiele</strong>r 2 wird immer aufgeben. Insbesondere<br />

sind alle stationären Nash-Gleichgewichte auch<br />

teilspielperfekt.<br />

4) Aber: Das Gleichgewicht, dass wir oben charakterisiert<br />

haben, ist das einzige symmetrische Gleichgewicht.


Spieltheorie (Winter 2009/10) 3-37 Prof. Dr. Ana B. Ania<br />

3.7 Das “Einmal-Abweichungsprinzip”<br />

In den bisherigen Beispielen war es relativ einfach, zu prüfen,<br />

ob ein Strategientupel (s ∗ 1,...,s ∗ n) ein TPGG ist. In komplizierteren<br />

<strong>Spiele</strong>n kann das jedoch sehr aufwendig sein. Der<br />

folgende Satz macht uns das Leben erheblich leichter:<br />

Satz 3.3 (Einmal-Abweichungsprinzip) Ein Strategientupel<br />

s ∗ ist teilspielperfekt genau dann, wenn<br />

es für keinen <strong>Spiele</strong>r i eine Strategie ˜si gibt, die sich<br />

von s ∗ i nur in einer Periode t und nach einer Geschichte<br />

h t unterscheidet, und die echt besser ist als<br />

s ∗ i , wenn das Teilspiel nach h t erreicht wird.<br />

Bemerkungen:<br />

1) Es ist offensichtlich, dass die Bedingung notwendig für<br />

Teilspielperfektheit ist. Gäbeeseinesolcheprofitable<br />

Abweichungsstrategie ˜si, dann kann sicher kein TPGG<br />

vorliegen. (Achtung: Es könnte immer noch ein Nash-<br />

Gleichgewicht vorliegen, falls die Geschichte h t auf dem<br />

Gleichgewichtspfad nicht erreicht wird.)<br />

2) Es ist nicht offensichtlich, dass die Bedingung auch hinreichend<br />

für Teilspielperfektheit ist. Angenommen, es<br />

gäbe keine profitable Strategie ˜si, die nur in einer <strong>Information</strong>smenge<br />

von s ∗ i abweicht. Dann könnte es immer


Spieltheorie (Winter 2009/10) 3-38 Prof. Dr. Ana B. Ania<br />

noch eine Strategie ˆsi geben, die an mehreren <strong>Information</strong>smengen<br />

gleichzeitig von s ∗ i abweicht und echt besser<br />

als s ∗ i ist.<br />

3) Wenn wir den Satz bewiesen haben, können wir uns das<br />

Leben in Zukunft sehr viel leichter machen: Wir müssen<br />

nur noch prüfen, ob es Abweichungsstrategien gibt, die<br />

profitabel an nur einer <strong>Information</strong>smenge abweichen.<br />

Das ist besondern nützlich bei wiederholten <strong>Spiele</strong>n.<br />

4) Wir führen den Beweis für <strong>Spiele</strong> <strong>mit</strong> endlichem Horizont.<br />

Der Beweis für <strong>Spiele</strong> <strong>mit</strong> unendlichem Horizont<br />

wird nur skizziert. Siehe Fudenberg-Tirole, S. 107-110.<br />

Beweis (durch Widerspruch): Angenommen, wir haben ein<br />

Strategientupel s ∗ , das der Bedingung des Einmal-Abweichungsprinzips<br />

genügt, das aber nicht teilspielperfekt ist.<br />

Dann existiert ein Zeitpunkt t und eine Geschichte h t ,so<br />

dass es für einen <strong>Spiele</strong>r i eine Strategie ˆsi gibt, die nach<br />

h t echt besser gegen s ∗ −i ist als s ∗ i und an wenigstens zwei<br />

<strong>Information</strong>smengen von s ∗ i abweicht.<br />

Wir suchen jetzt die “letzte” <strong>Information</strong>smenge, an der eine<br />

Abweichung von s ∗ i echt profitabel ist: Betrachte den<br />

letzten Zeitpunkt, an dem es eine <strong>Information</strong>smenge gibt,<br />

in der ˆsi von s ∗ i abweicht. Wenn ˆsi zu keiner strikten Verbesserung<br />

führt, falls diese <strong>Information</strong>smenge erreicht wird,


Spieltheorie (Winter 2009/10) 3-39 Prof. Dr. Ana B. Ania<br />

dann ersetze diesen Teil von ˆsi durch den entsprechenden<br />

Teil von s ∗ i und gehe zur nun “letzten” <strong>Information</strong>smenge<br />

<strong>mit</strong> einer Abweichung. Tue das solange, bis die “letzte” <strong>Information</strong>smenge<br />

gefunden ist, in der ˆsi echt besser ist als<br />

s ∗ i . Die Geschichte, die zu dieser <strong>Information</strong>smenge führt,<br />

nennen wir ˜ h ˜t .<br />

Betrachte jetzt eine Strategie ˜si,die<strong>mit</strong>s ∗ i in allen <strong>Information</strong>smengen<br />

übereinstimmt, bis auf diejenige im Anschluss<br />

an ˜ h ˜t , die wir im letzten Abschnitt gefunden haben. An dieser<br />

<strong>Information</strong>smenge stimmt die Strategie <strong>mit</strong> ˆsi überein.<br />

In allen folgenden <strong>Information</strong>smengen ist sie aber wieder<br />

identisch <strong>mit</strong> s ∗ i . Aufgrund unserer Konstruktion muss gelten:<br />

˜si ist gegen s ∗ −i echt besser als s ∗ i ,wenn ˜ h ˜t erreicht wird.<br />

˜si weicht von s ∗ i in nur einer einzigen <strong>Information</strong>smenge<br />

ab.<br />

Also ist eine profitable Abweichung <strong>mit</strong> einfacher Abweichung<br />

gefunden. Das ist ein Widerspruch zu der Annahme,<br />

dass s ∗ i die Bedingung des Einmal-Abweichungsprinzips<br />

erfüllt.<br />

Q.E.D.


Spieltheorie (Winter 2009/10) 3-40 Prof. Dr. Ana B. Ania<br />

Beweisskizze für <strong>Spiele</strong> <strong>mit</strong> unendlichem Horizont:<br />

Bei unendlichem Horizont muss es keine “letzte” <strong>Information</strong>smenge<br />

<strong>mit</strong> einer profitablen Abweichung geben. Was<br />

dann?<br />

Wenn die Strategie ˆsi gegen s ∗ −i echt besser ist als s ∗ i ,dann<br />

existiert ein ɛ>0, sodass<br />

ui(ˆsi,s ∗ −i | h t ) >ui(s ∗ i ,s ∗ −i | h t )+ɛ.<br />

Wenn die <strong>Spiele</strong>r zukünftige Auszahlungen diskontieren, dann<br />

existiert ein t

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!