27.01.2014 Aufrufe

Vorlesung Einführung in die Spieltheorie

Vorlesung Einführung in die Spieltheorie

Vorlesung Einführung in die Spieltheorie

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Vorlesung</strong> E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong><br />

Tim Hellmann<br />

17.11.2009<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Existenz von Nash-Gleichgewichten <strong>in</strong> der gemischten<br />

Erweiterung<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Existenz von Nash-Gleichgewichten <strong>in</strong> der gemischten<br />

Erweiterung<br />

Σ i ist <strong>die</strong> Mengen aller Lotterien über <strong>die</strong> Strategien von Sp.i<br />

damit s<strong>in</strong>d auch <strong>die</strong> zusammengesetzten Lotterien def<strong>in</strong>itiert<br />

σ i + σ ′ i und t · σ i sowie σ + σ ′ und t · σ, t ∈ R def<strong>in</strong>iert<br />

Die Σ i s<strong>in</strong>d also konvex, da:<br />

t · σ i + (1 − t) · σ ′ i ∈ Σ i , t ∈ [0, 1]<br />

t · σ + (1 − t) · σ ′ ∈ Σ i , t ∈ [0, 1]<br />

und kompakt, d.h. beschränkt und abgeschlossen<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Erweiterung der Nutzenfunktionen<br />

multil<strong>in</strong>eare Erweiterung der U i auf Σ, U i : Σ → R:<br />

⎛<br />

⎞<br />

u i (σ) := ∑ ⎝u i (s) ∏ σ j (s j ) ⎠<br />

s∈S j∈N<br />

U i ist stetig<br />

U i ist quasikonkav <strong>in</strong> σ i für alle σ −i : für alle σ i , σ ′ i<br />

∈ Σ i ,<br />

σ −i ∈ Σ −i , t ∈ [0, 1] gilt<br />

U i<br />

(<br />

t · σi + (1 − t) · σ ′ i, σ −i<br />

)<br />

≥ m<strong>in</strong><br />

{<br />

Ui (σ i , σ −i ) , U i<br />

(<br />

σ<br />

′<br />

i , σ −i<br />

)}<br />

für alle σ i ∈ Σ i und σ −i ∈ Σ −i gibt es s i , s<br />

i ′ ∈ S i ,<br />

σ i (s i ) , σ i (s<br />

i ′ ) > 0, daß<br />

( )<br />

U i (s i , σ −i ) ≥ U i (σ i , σ −i ) ≥ U i s<br />

′<br />

i , σ −i<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Existenz von Nash-Gleichgewichten<br />

Theorem (Existenzsatz Nash, gemischte Erweiterung)<br />

Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />

besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />

Hatten bereits:<br />

Theorem (Existenzsatz Nash)<br />

Gegeben sei e<strong>in</strong> Spiel G <strong>in</strong> Normalform. Wenn für jeden Spieler<br />

i ∈ N gilt:<br />

S i ist e<strong>in</strong>e kompakte und konvexe Teilmenge des endlich<br />

dimensionalen euklidischen Raums,<br />

u i : S → R ist stetig, und<br />

u i (·, s −i ) : S i → R ist quasikonkav <strong>in</strong> s i .<br />

Dann existiert e<strong>in</strong> Nash-Gleichgewicht <strong>in</strong> G.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Existenz von Nash-Gleichgewichten<br />

Wir wissen:<br />

Σ ist e<strong>in</strong>e kompakte und konvexe Teilmenge des endlich<br />

dimensionalen euklidischen Raums,<br />

U i : Σ → R ist stetig,<br />

U i (·, σ −i ) : Σ i → R ist quasikonkav <strong>in</strong> σ i .<br />

Daher erfüllt <strong>die</strong> gemischte Erweiterung <strong>die</strong> Vorraussetzungen beim<br />

allgeme<strong>in</strong>eren Existenzsatz und ist daher e<strong>in</strong>e Implikation des<br />

allgeme<strong>in</strong>eren Theorems.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Existenz von Nash-Gleichgewichten<br />

Theorem (Nash 1950)<br />

Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />

besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />

Beweis 1950: wendet Kakutanis Fixpunktsatz (1941) auf <strong>die</strong><br />

Beste-Antwort-Korrespondenz an<br />

Beweis 1951: verwendet Brouwers (1910/12) Fixpunktsatz für<br />

Funktionen<br />

Literatur: Border, Kim C. (1988): Fixed Po<strong>in</strong>t Theorems with<br />

Applications to Economics and Game Theory, Cambridge<br />

University Press.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Brouwers Fixpunktsatz<br />

Theorem (Brouwer 1910/12)<br />

Ist X e<strong>in</strong>e<br />

nicht-leere,<br />

kompakte, (d.h. beschränkt und abgeschlossen) und<br />

konvexe Teilmenge e<strong>in</strong>es R n und<br />

ist <strong>die</strong> Abbildung f : X → X stetig,<br />

dann gibt es e<strong>in</strong>en Fixpunkt von f , d.h., e<strong>in</strong> x ∗ ∈ X , so daß<br />

f (x ∗ ) = x ∗ .<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beweisidee für Existenzsatz<br />

Theorem (Nash 1950)<br />

Die gemischte Erweiterung e<strong>in</strong>es endlichen Spiels <strong>in</strong> Normalform<br />

besitzt e<strong>in</strong> Nash-Gleichgewicht.<br />

Beweisidee.<br />

Fakt: Σ ist nichtleer, konvex und kompakt.<br />

Konstruiere e<strong>in</strong>e stetige Abbildung T : Σ → Σ.<br />

Zeige, daß deren Fixpunkte Nash-Gleichgewichte s<strong>in</strong>d.<br />

Brouwers Fixpunktsatz garantiert dann <strong>die</strong> Existenz.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beweis #1<br />

Def<strong>in</strong>iere für alle i ∈ N und s i ∈ S i e<strong>in</strong>e Fkt φ si : Σ → R :<br />

φ si (σ) := max(0, u i (s i , σ −i ) − u i (σ i , σ −i )).<br />

Def<strong>in</strong>iere T = (T i ) i∈N : Σ → Σ für i ∈ N, s i ∈ S i und σ ∈ Σ<br />

T i (σ)(s i ) :=<br />

σ i(s i ) + φ si (σ)<br />

1 + ∑ s i ′ ∈S φ<br />

i s ′<br />

i<br />

(σ)<br />

Fakt: T ist stetig, und Σ ist nicht-leer, kompakt und konvex.<br />

Interpretation: Die Funktion T bildet e<strong>in</strong> gemischtes<br />

Strategienprofil σ <strong>in</strong> e<strong>in</strong> gemischtes Strategienprofil σ ′ ab, so<br />

dass <strong>die</strong> Wahrsche<strong>in</strong>lichkeit der re<strong>in</strong>en besten Antworten auf<br />

σ −i erhöht wird und Nicht-Beste-Antworten mit ger<strong>in</strong>gerer<br />

Wahrsche<strong>in</strong>lichkeit versehen werden.<br />

Brouwers Fixpunktsatz garantiert dann <strong>die</strong> Existenz e<strong>in</strong>es<br />

Fixpunktes σ ∗ ∈ Σ.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beweis #2<br />

Fakt: Für jedes i es gibt e<strong>in</strong> s ′′<br />

i<br />

∈ S i so daß σ ∗ i (s′′ i ) > 0 und<br />

φ s ′′(σ ∗ ) = max(0, u<br />

i<br />

i (s i ′′ , σ−i) ∗ − u i (σ ∗ )) = 0.<br />

Da σ ∗ Fixpunkt von T ist, gilt<br />

σi ∗ (s i ′′ ) = σ∗ i (s′′ i ) + φ s i<br />

′′ (σ ∗ )<br />

1 + ∑ s i ′ ∈S φ<br />

i s ′<br />

i<br />

(σ ∗ ) .<br />

Wegen σi ∗(s′′<br />

i ) > 0, gilt dann∑ s i ′ ∈S φ<br />

i s ′<br />

i<br />

(σ ∗ ) = 0 und daher<br />

max(0, u i (s i , σ−i ∗ ) − u i(σ ∗ )) = 0, für alle s i ∈ S i .<br />

Doch das heißt, daß ke<strong>in</strong> Spieler e<strong>in</strong>e e<strong>in</strong>seitige<br />

Verbesserungsmöglichkeit <strong>in</strong> re<strong>in</strong>en Strategien hat und damit<br />

auch nicht <strong>in</strong> gemischten. Also ist σ ∗ e<strong>in</strong><br />

Nash-Gleichgewicht.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Extensive Spiele<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Extensive Spiele — Motivation<br />

Bislang hatten wir angenommen, dass <strong>die</strong> Spieler simultan<br />

entscheiden.<br />

Was ist nun, wenn e<strong>in</strong>e feste Reihenfolge der Entscheidungen<br />

festgelegt ist?<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Extensive Spiele — Beispiel Markte<strong>in</strong>tritt<br />

zwei Unternehmen:<br />

e<strong>in</strong> Monopolist, M<br />

e<strong>in</strong> potentieller Konkurrent, K<br />

K überlegt Markte<strong>in</strong>tritt<br />

M muß entscheiden, ob er bei Markte<strong>in</strong>tritt,<br />

<strong>die</strong>sen zuläßt ⇒ sie teilen sich den Markt, z.B. Cournot Duopol<br />

oder abwehrt, d.h. auf e<strong>in</strong>mal e<strong>in</strong>e solche Menge produziert,<br />

dass sich der Markte<strong>in</strong>tritt für K nicht lohnt ⇒ Verluste für<br />

beide<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Markte<strong>in</strong>trittspiel — simultane Entscheidungen<br />

Darstellung des Spiels <strong>in</strong> strategischer Form (Vere<strong>in</strong>fachtes<br />

Modell):<br />

accept<br />

fight<br />

1<br />

−1<br />

<strong>in</strong><br />

1<br />

−1<br />

out<br />

2<br />

0<br />

2<br />

0<br />

zwei Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />

NE(G) = {(fight, out), (accept, <strong>in</strong>)}<br />

e<strong>in</strong>es unplausibel, wenn <strong>die</strong> Reihenfolge e<strong>in</strong>e Rolle spielt<br />

(beruht auf unglaubwürdiger Drohung)<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Markte<strong>in</strong>trittspiel als extensive Form<br />

Darstellung als extensives Spiel (wobei <strong>die</strong> Reihenfolge e<strong>in</strong>e<br />

Rolle spielt):<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Extensive Spiele — Beispiel Markte<strong>in</strong>tritt<br />

Wenn <strong>die</strong> Reihenfolge e<strong>in</strong>e Rolle spielt, benutzen wir <strong>die</strong><br />

Rückwärts<strong>in</strong>duktion:<br />

Falls M entscheiden muß, wird sie niemals K bekämpfen.<br />

<strong>die</strong>s weiß K und daher wählt K den Markte<strong>in</strong>tritt.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Extensive Spiele — Beispiel Stackelberg Duopol<br />

zwei Unternehmen (wie im Cournot Model), aber <strong>die</strong> Firmen<br />

entscheiden h<strong>in</strong>tere<strong>in</strong>ander:<br />

F 1 (Stackelberg leader) entscheidet zuerst, welche Menge sie<br />

anbietet<br />

danach entscheided F 2 .<br />

Macht <strong>die</strong>s e<strong>in</strong>en Unterschied?<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Formale Darstellung von Spielen <strong>in</strong> extensiver Form<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Formale Darstellung von Spielen <strong>in</strong> extensiver Form<br />

Def<strong>in</strong>ition<br />

E<strong>in</strong> Spiel <strong>in</strong> extensiver Form mit vollständiger Information ist e<strong>in</strong><br />

Tupel<br />

wobei<br />

((X , ⊳), N, P, A, p, u)<br />

Spielbaum (X , ⊳): Abfolge der Zugmöglichkeiten,<br />

Spielausgänge<br />

Menge der Spieler N: Akteure plus ”<br />

Zufall“<br />

Spielerpartition P: Wer zieht wann?<br />

Aktionspartition A: Welche Züge s<strong>in</strong>d möglich?<br />

System der Zufallswahrsche<strong>in</strong>lichkeiten p: Wie zieht ”<br />

Zufall“?<br />

Auszahlungsfunktionen u: repräsentiert <strong>die</strong> Präferenzen der<br />

Spieler<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Spielbaum, (X , ⊳)<br />

endliche Knotenmenge X ; |X | > 1<br />

Vorgängerrelation ⊳ auf X<br />

nicht notwendigerweise vollständig.<br />

asymmetrisch,d.h. gibt e<strong>in</strong> o ∈ X , so daß o ⊳ x für alle x ∈ X .<br />

und transitiv, x, x ′ , x ′′ ∈ X , x ′ ⊳ x, x ′′ ⊳ x und x ′ ≠ x ′′<br />

implizieren x ′ ⊳ x ′′ oder x ′′ ⊳ x ′ .<br />

unmittelbarer Vorgänger von x ∈ X \ {o}:<br />

V (x) := {y ∈ X : y ⊳ x}<br />

Menge der unmittelbaren Nachfolger von x ∈ X :<br />

N (x) := {y ∈ X : x ⊳ y}<br />

Menge der Endknoten Z := {x ∈ X : N(x) = ∅} ke<strong>in</strong>e<br />

Nachfolger.<br />

Menge der Entscheidungsknoten K := X \Z<br />

Pfad von x ∈ X : ϕ (o) = ∅, ϕ (x) = ϕ (V (x)) ∪ {x}<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — Spielbaum, (X , ⊳)<br />

Hier ist zum Beispiel:<br />

Menge der Knoten, X = {x 1 , ..., x 5 },<br />

Menge der Entscheidungsknoten, K = {x 1 , x 2 },<br />

Menge der Endknoten Z = {x 3 , x 4 , x 5 }<br />

Vorgänger von x 2 : V (x 2 ) = x 1 ,<br />

Nachfolger von x 2 : N(x 2 ) = {x 4 , x 5 }.<br />

Pfad von x 4 : ϕ(x 4 ) = {x 1 , x 2 }.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Menge der Spieler, Spielerpartition N, P<br />

N, wie zuvor nur der Spieler ”<br />

Natur“, bzw. ”<br />

Zufall“,<br />

bezeichnet als 0, ist enthalten.<br />

P ist e<strong>in</strong>e Partition (P i ) i∈N<br />

von K, den Entscheidungsknoten<br />

P i , Menge der Knoten, an denen i entscheidet.<br />

P 0 Menge der Knoten, an denen der Zufall entscheidet (kann<br />

leer se<strong>in</strong>).<br />

für x ∈ K bezeichnet i (x) den an K ziehenden Spieler<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — Menge der Spieler, Spielerpartition N, P<br />

Hier:<br />

N = {M, K, 0}.<br />

ke<strong>in</strong> Zufall P 0 = ∅.<br />

P K = {x 1 }, der Konkurrent zieht zuerst.<br />

P M = {x 2 }, danach der Monopolist.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Aktionspartition A<br />

A ist e<strong>in</strong>e Partition von X \ {o}<br />

Elemente a von A heißen Aktionen<br />

für alle a ∈ A gilt<br />

V (a) ∈ P i für e<strong>in</strong> i ∈ N<br />

d.h. a ∈ A s<strong>in</strong>d <strong>die</strong> Menge der Aktionen für Spieler i ∈ N an<br />

der Stelle P i , wenn Spieler i ∈ N entscheiden muss.<br />

Menge der Aktionen an x ∈ K: A x<br />

Menge der Aktionen von i ∈ I : A i<br />

für alle x ∈ X \ {o} bezeichnet a (x) <strong>die</strong> Aktion, <strong>in</strong> der x liegt<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Aktionspartition<br />

Hier:<br />

mögliche Aktionen von Spieler K an x 1 ∈ P K : {<strong>in</strong>, out}.<br />

Aktion <strong>in</strong> führt zu Knoten x 2 , Aktion out führt zu Knoten x 3<br />

mögliche Aktionen von Sp. K an x 1 ∈ P K : {accept, fight}.<br />

Aktion accept führt zu Knoten x 4 , Aktion fight führt zu<br />

Knoten x 5<br />

Tim Hellmann E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Auszahlungsfunktionen<br />

u = (u i ) i∈N\{0}<br />

u i : Z → R<br />

u i Erwartungsnutzenfunktion<br />

stellt Spieler is Präferenzen über<br />

Wahrsche<strong>in</strong>lichkeitsverteilungen über Z dar<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Zufallsmechnismus<br />

Zufallsspieler 0 ”<br />

entscheidet“ an den Knoten <strong>in</strong> P 0 .<br />

System von Zufallswahrsche<strong>in</strong>lichkeiten p<br />

p h ordnet den Aktionen a ∈ A h Wahrsche<strong>in</strong>lichkeiten p h (a) zu<br />

p h (a) > 0<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiele und Strategien <strong>in</strong> extensiven Spielen<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />

Die Menge der Knoten X = {x 1 , x 2 , ..., x 30 }.<br />

Endknoten:<br />

Z = {x 4 , x 6 , x 8 , x 11 , x 13 , x 15 , x 16 , x 17 , x 18 , x 19 , x 21 , x 23 , x 24 , ..., x 30 }.<br />

Entscheidungsknoten:<br />

K = {x 1 , x − 2, x 3 , x 5 , x 7 , x 9 , x 10 , x 12 , x 14 , x 20 , x 22 }.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />

Die Spieler N = {0, 1, 2, 3}, wobei Zufall schwarz, Sp.1 gelb,<br />

Sp.2 blau, Sp.3, rot.<br />

Spielerpatition, z.B. P 1 = {x 1 , x 9 , x 10 }.<br />

Aktionspartition für Spieler 1,<br />

A 1 = {(a, b, c, d), (e, f ), (g, h)}.<br />

Aktionspartition für Spieler 1 an Knoten x 1 , A x1 = {a, b, c, d}.<br />

Zufallszüge an P 0 = {x 2 , x 5 } mit den entsprechenden<br />

Wahrsche<strong>in</strong>lichkeiten.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Re<strong>in</strong>e Strategien<br />

Def<strong>in</strong>ition<br />

Die Menge der re<strong>in</strong>en Strategien für Spieler i ∈ N\ {0} <strong>in</strong> e<strong>in</strong>em<br />

extensiven Spiel Γ is gegeben durch A i := ∏ x∈P i<br />

A x .<br />

re<strong>in</strong>e Strategie a i legt für jeden Entscheidungsknoten x ∈ P i<br />

e<strong>in</strong>e Aktion a x ∈ A x fest (umfassender Handlungsplan)<br />

Menge der re<strong>in</strong>en Strategiekomb<strong>in</strong>ationen: A : = ∏ i∈N\{0} A i<br />

unter a erreichbare Endknoten<br />

Z (a) := {z ∈ Z|A (ϕ (z)) \A 0 ⊆ {a x |x ∈ K\P 0 }}<br />

Auszahlungen für re<strong>in</strong>e Strategien<br />

⎛<br />

⎞<br />

u i (a) =<br />

∑<br />

∏<br />

⎝u i (z)<br />

p V (a) (a) ⎠<br />

a∈A(ϕ(z))∩A 0<br />

z∈Z(a)<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel — E<strong>in</strong> etwas komplexerer Baum<br />

E<strong>in</strong>e re<strong>in</strong>e Strategie für Sp.1 (gelb) wäre z.B.: a 1 = (a, f , g)<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Gemischte Strategien<br />

Def<strong>in</strong>ition<br />

Die Menge der gemischten Strategien für Spieler i ∈ N <strong>in</strong> e<strong>in</strong>em<br />

extensiven Spiel Γ is gegeben durch Σ i = ∆ (A i ).<br />

∆ (A i ) bezeichnet <strong>die</strong> Menge der W-keitsverteilungen auf den<br />

re<strong>in</strong>en Srategien A i , formal:<br />

∆ (A i ) := {σ i : A i → R| ∑<br />

a i ∈A i<br />

σ i (a i ) = 1 und σ i (a i ) ≥ 0 ∀a i ∈ A i }<br />

für σ i ∈ Σ i bezeichnet σ i (a i ) <strong>die</strong> Wahrsche<strong>in</strong>lichkeit von<br />

a i ∈ A i<br />

gemischte Strategiekomb<strong>in</strong>ationen σ ∈ Σ := ∏ i∈N\{0} Σ i<br />

Auszahlungen für gemischte Strategiekomb<strong>in</strong>ationen<br />

⎛<br />

⎞<br />

u i (σ) := ∑ ∏<br />

⎝u i (a) σ i (a i ) ⎠<br />

a∈A<br />

i∈N\{0}<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Normalform<br />

Def<strong>in</strong>ition<br />

Die Normalform des extensiven Spiels Γ = ((X , ⊳), N, P, A, p, u)<br />

ist das strategische Spiel<br />

)<br />

NF (Γ) =<br />

(N\ {0} , (A i ) i∈N\{0}<br />

, (u i ) i∈N\{0}<br />

.<br />

re<strong>in</strong>e/gemischte Strategie(n)/komb<strong>in</strong>ationen von NF (Γ) s<strong>in</strong>d<br />

auch <strong>die</strong>se von Γ<br />

bei Übergang von Γ zu NF (Γ) gehen Informationen verloren<br />

<strong>die</strong> Reihenfolge f<strong>in</strong>det ke<strong>in</strong>e Beachtung.<br />

Zufall spielt ke<strong>in</strong>e Rolle.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Dom<strong>in</strong>anz und Nash-Gleichgewichte<br />

über <strong>die</strong> Normalform analog zu strategischen Spielen,<br />

beispielsweise<br />

Def<strong>in</strong>ition<br />

E<strong>in</strong>e gemischte Strategiekomb<strong>in</strong>ation σ ∗ ∈ Σ des extensiven Spiels<br />

Γ ist e<strong>in</strong> Nash-Gleichgewicht, wenn σ ∗ e<strong>in</strong> Nash-Gleichgewicht von<br />

NF (Γ) ist, d.h. wenn u i (σ ∗ ) ≥ u i<br />

(<br />

σi , σ ∗ −i)<br />

für alle i ∈ I \ {0} und<br />

σ i ∈ Σ i .<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel<br />

Baum: X = {x 1 , ..., x 9 }, wobei x 1 ⊳ x 2 , x 3 ; x 2 ⊳ x 4 , x 5 ;<br />

x 3 ⊳ x 6 , x 7 ; und x 5 ⊳ x 8 , x 9 .<br />

Spieler N = {0, 1, 2}, Spielerpartition P 1 = {x 1 , x 5 },<br />

P 2 = {x 2 , x 3 }, P 0 = ∅.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel<br />

Aktionspartitionen A 1 = {{a, b}, {c, d}},<br />

A 2 = {{A, B}, {C, D}}<br />

re<strong>in</strong>e Strategien A 1 = {(a, c), (a, d)(b, c), (b, d)},<br />

A 2 = {(A, C), (A, D), (B, C), (B, D)}.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel<br />

e<strong>in</strong>e re<strong>in</strong>e Strategie für Spieler 1, z.B. a 1 = (a, c) (Schwarz)<br />

und für Spieler a 2 = (A, D). (blau)<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel<br />

e<strong>in</strong>e re<strong>in</strong>e Strategie für Spieler 1, z.B. a 1 = (a, c) (Schwarz)<br />

und für Spieler a 2 = (A, D). (blau)<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel — Normalform<br />

Darstellung des Spiels <strong>in</strong> strategischer Form:<br />

(a, c)<br />

(a, d)<br />

(b, c)<br />

(b, d)<br />

(A, C) (A, D) (B, C) (B, D)<br />

1 1 0 0<br />

1 1 4 4<br />

1 1 2 2<br />

1 1 2 2<br />

6 3 6 3<br />

6 1 6 1<br />

6 3 6 3<br />

6 1 6 1<br />

Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />

NE(G) = { {(a, c), (A, D)}, {(b, ·), (·, C)} } .<br />

Bei Beachtung der Reihenfolge s<strong>in</strong>d nicht alle s<strong>in</strong>nvoll.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel — Normalform<br />

Darstellung des Spiels <strong>in</strong> strategischer Form:<br />

(a, c)<br />

(a, d)<br />

(b, c)<br />

(b, d)<br />

(A, C) (A, D) (B, C) (B, D)<br />

1<br />

1 0<br />

0<br />

1<br />

1<br />

4 4<br />

1<br />

1<br />

2 2<br />

1<br />

1<br />

2 2<br />

6 3<br />

6 3<br />

6<br />

1<br />

6<br />

1<br />

6 3<br />

6 3<br />

6<br />

1<br />

6<br />

1<br />

Gleichgewichte <strong>in</strong> re<strong>in</strong>en Strategien:<br />

NE(G) = { {(a, c), (A, D)}, {(b, ·), (·, C)} } .<br />

Bei Beachtung der Reihenfolge s<strong>in</strong>d nicht alle s<strong>in</strong>nvoll.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


E<strong>in</strong> weiteres Beispiel — Normalform<br />

→<br />

Das Gleichgewicht {(a, c), (A, D)} (Schwarz) sieht nicht<br />

rational aus.<br />

Spieler 1, weiß, dass falls er b spielt, Spieler 2 dann C spielt,<br />

also würden dann beide 6 erhalten.<br />

Wir brauchen e<strong>in</strong> anderes Gleichgewichtskonzept!<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Verhaltensstrategien und teilspielperfekte<br />

Gleichgewichte<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Verhaltensstrategien<br />

Def<strong>in</strong>ition<br />

E<strong>in</strong>e Verhaltensstrategie für Spieler i ∈ N <strong>in</strong> e<strong>in</strong>em extensiven Spiel<br />

mit perfekter Er<strong>in</strong>nerung ist e<strong>in</strong>e Menge von<br />

Wahrsche<strong>in</strong>lichkeitsverteilungen b i , so dass b i (x, ·) e<strong>in</strong>e<br />

Wahrsche<strong>in</strong>lichkeitsverteilung auf A x ist.<br />

lokale Strategien für jedes x ∈ K\P 0 : b i (x, ·) ∈ ∆ (A x ) wobei<br />

b i (x, a) <strong>die</strong> Wahrsche<strong>in</strong>lichkeit e<strong>in</strong>er Aktion a ∈ A x ist.<br />

Menge der Verhaltensstrategien von i ∈ N\ {0} :<br />

B i := ∏<br />

x∈P i<br />

{b i (x, ·) ∈ ∆ (A x )}<br />

Menge der Verhaltensstrategiekomb<strong>in</strong>ationen: B = ∏ i∈N B i<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Verhaltensstrategien<br />

Auszahlungen für Verhaltensstrategiekomb<strong>in</strong>ationen<br />

⎛<br />

⎞<br />

u i (b) := ∑ ∏ ∏<br />

⎝u i (a)<br />

b i (x, a x ) ⎠<br />

a∈A i∈N\{0} x∈P i \P 0<br />

Unterschied zu re<strong>in</strong>en/gemischten Strategien?<br />

e<strong>in</strong>e re<strong>in</strong>e Strategie ist e<strong>in</strong> umfassender Handlungsplan.<br />

e<strong>in</strong>e gemischte Strategie ist e<strong>in</strong>e Wahrsche<strong>in</strong>lichkeitsverteilung<br />

über alle re<strong>in</strong>en Strategien.<br />

e<strong>in</strong>e Verhaltensstrategie ist e<strong>in</strong>e Menge von<br />

Wahrsche<strong>in</strong>lichkeitsverteilungen, <strong>die</strong> für jeden<br />

Entscheidungsknoten von Sp. i ∈ N e<strong>in</strong>e<br />

Wahrsche<strong>in</strong>lichkeitsverteilung über <strong>die</strong> Menge der möglichen<br />

Aktionen ist.<br />

e<strong>in</strong>e re<strong>in</strong>e Strategie ist sowohl e<strong>in</strong>e gemischte als auch e<strong>in</strong>e<br />

Verhaltensstrategie.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Verhaltensstrategien, Agentennormalform<br />

Def<strong>in</strong>ition<br />

Die Agentennormalform des extensiven Spiels Γ ist das strategische<br />

Spiel<br />

)<br />

ANF (Γ) =<br />

(K\P 0 , (A x ) x∈K\P0<br />

, (u x ) x∈K\P0<br />

,<br />

wobei u x = u i(x) für alle x ∈ K\P 0 .<br />

Jeder Entscheidungsknoten wird e<strong>in</strong> eigener Spieler.<br />

Die Nutzenfunktion wird von dem Spieler übernommen der an<br />

dem Knoten x ∈ K \ P 0 enstcheidet.<br />

Die re<strong>in</strong>en Strategien s<strong>in</strong>d für jeden Knoten/Spieler<br />

x ∈ K \ P 0 <strong>die</strong> möglichen Aktionen A x and x.<br />

re<strong>in</strong>e Strategiekomb<strong>in</strong>ationen von ANF (Γ) s<strong>in</strong>d <strong>die</strong>se von Γ<br />

gemischte Strategiekomb<strong>in</strong>ationen von ANF (Γ) s<strong>in</strong>d<br />

Verhaltensstrategiekomb<strong>in</strong>ationen von Γ!!!<br />

auch beim Übergang von Γ zu ANF (Γ) gehen Informationen<br />

verloren.<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Verhaltensstrategien, Nash-Gleichgewicht<br />

Die Def<strong>in</strong>ition e<strong>in</strong>es Nash-Gleichgewichts <strong>in</strong> Verhaltensstrategien<br />

analog:<br />

Def<strong>in</strong>ition<br />

E<strong>in</strong>e Verhaltensstrategiekomb<strong>in</strong>ation b ∗ ∈ Σ des extensiven Spiels<br />

Γ ist e<strong>in</strong> Nash-Gleichgewicht, wenn u i (b ∗ ) ≥ u i<br />

(<br />

bi , b ∗ −i)<br />

für alle<br />

i ∈ N\ {0} und b i ∈ B i .<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Teilspiele<br />

Teilbaum von (X , ⊳) bei x ∈ K : (T x , ⊳ x )<br />

T x := {x ′ ∈ X |x ′ = x oder x ⊳ x ′ }<br />

⊳ x :=⊳ | Tx , E<strong>in</strong>schränkung von ⊳ auf T x<br />

Wurzel: x; K x := K ∩ T x , Z x := Z ∩ T x<br />

bei jedem x ∈ K beg<strong>in</strong>nt e<strong>in</strong> Teilspiel<br />

Γ x = ((T x , ⊳ x ), N x , P x , A x , p x , u x )<br />

von Γ, so dass<br />

N x := {0} ∪ {i ∈ N|Pi x ≠ ∅} , wobei Pi x := P i ∩ T x<br />

P x := {Pi x |i ∈ N x }<br />

A x := ⋃ y∈T A x y ; A x i := A i ∩ A x for all i ∈ N x<br />

p x := {p y |y ∈ P0 x}<br />

ui x := u i | Z x for all i ∈ N x \ {0}<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel, Teilspiele<br />

Gesucht Teilspiel Γ x 2<br />

!<br />

Schneide e<strong>in</strong>fach den Rest weg...<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel, Teilspiele<br />

Gesucht Teilspiel Γ x 2<br />

!<br />

Schneide e<strong>in</strong>fach den Rest weg...<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Beispiel, Teilspiele<br />

Γ x 2<br />

ist also das Tupel<br />

Γ x 2<br />

= ((T x 2<br />

, ⊳ x 2<br />

), N x 2<br />

, P x 2<br />

, A x 2<br />

, p x 2<br />

, u x 2<br />

)<br />

mit<br />

T x2<br />

N x2<br />

P x2<br />

0<br />

= {x 2 , x 4 , x 5 , x 8 , x 9 } (<strong>die</strong> übrig gebliebenen Knoten).<br />

= {0, 1, 2}, beide Spieler können noch entscheiden.<br />

= ∅, Px2 1 = {x 5}, P x2<br />

2 = {x 2} (<strong>die</strong> Spielerpartitionen im<br />

Teilspiel).<br />

A x2<br />

1<br />

= {(c, d)} Ax2 2<br />

Teilspiel).<br />

= {(A, B)} (<strong>die</strong> Aktionspartitionen im<br />

p x2 = ∅, da P x2<br />

0 = ∅ (<strong>die</strong> Zufallszüge im Teilspiel).<br />

u x2 = u i | x4,x 8,x 9<br />

(<strong>die</strong> e<strong>in</strong>geschränkte Nutzenfunktion im<br />

Teilspiel).<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>


Teilspielperfekte Gleichgewichte<br />

Def<strong>in</strong>ition<br />

E<strong>in</strong>e Verhaltensstrategiekomb<strong>in</strong>ation b ∗ ∈ B des extensiven Spiels<br />

Γ ist e<strong>in</strong> teilspielperfektes Gleichgewicht, wenn <strong>in</strong> allen Teispielen<br />

Γ x von Γ <strong>die</strong> Restriktion von b ∗ auf K x \P0 x e<strong>in</strong> Nash-Gleichgewicht<br />

ist.<br />

da Γ o = Γ, ist jedes teilspielperfekte Gleichgewicht auch e<strong>in</strong><br />

Nash-Gleichgewicht<br />

enthält Γ ke<strong>in</strong>e echten Teilspiele, dann fallen beide Konzepte<br />

zusammen<br />

Tim Hellmann<br />

E<strong>in</strong>führung <strong>in</strong> <strong>die</strong> <strong>Spieltheorie</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!