14.06.2013 Views

Lezione 6 - Brunochiarini.it

Lezione 6 - Brunochiarini.it

Lezione 6 - Brunochiarini.it

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

7<br />

Analisi Strategica<br />

per la<br />

Pol<strong>it</strong>ica Economica<br />

Parte Sesta<br />

Prof. Bruno Chiarini


Discounting<br />

Tassi di sconto molto piccoli indicano una<br />

valutazione inferiore delle payoff future<br />

rispetto alla payoff corrente (il futuro conta<br />

poco), tassi di sconto vicini ad 1 indicano<br />

valutazioni delle payoffs future pressoché<br />

analoghe a quella corrente (il futuro conta).<br />

Con δ=1 si ha una s<strong>it</strong>uazione di “nodiscounting”.<br />

Payoffs future e quella<br />

corrente sono valutate esattamente allo<br />

stesso modo. Un euro ottenuto nel futuro<br />

vale esattamente un euro di oggi.<br />

Il tasso di sconto δ è legato al fattore di<br />

sconto r (o tasso di interesse) nel seguente<br />

modo: δ=1/1+r. In altri termini, quando<br />

δ=1, ciò significa che r=0. Più il tasso di<br />

interesse è basso (il fattore di sconto è alto)<br />

più l’individuo sconta meno il futuro ed è più<br />

paziente. Per un tasso di sconto δ=1/2, il<br />

tasso di interesse è r=1.


GIOCHI RIPETUTI<br />

Supergioco ≠ Gioco Dinamico<br />

● La ripetizione del<br />

iniziale modifica lo<br />

stock di<br />

informazione degli<br />

agenti ad ogni<br />

round successivo<br />

● Modificano le<br />

strutture dei<br />

payoffs<br />

● Modifica lo spazio<br />

delle strategie<br />

disponibili<br />

→ Non è del tutto inappropriato chiamarli<br />

giochi dinamici


● Mosse → Sequenza di mosse<br />

● Il gioco si estende da:<br />

● Sequenza di payoffs<br />

● L’es<strong>it</strong>o del supergioco è dato dalla somma dei<br />

guadagni scontata (guadagni percep<strong>it</strong>i in ogni<br />

round del supergioco)<br />

● Sconto: esigenza in quanto i guadagni hanno<br />

luogo in tempi diversi. I giocatori sono<br />

“impazienti”: danno un peso diverso (minore)<br />

ai guadagni percep<strong>it</strong>i in futuro<br />

● Per confrontare tali es<strong>it</strong>i occorre perciò<br />

attualizzarli<br />

0 T FINITO<br />

0<br />

∞ INFINITO


● La soluzione del supergioco non è<br />

necessariamente la ripetizione di T volte della<br />

soluzione del gioco iniziale:<br />

→ Es. Giochi riconducibili al Dilemma-<br />

Prigioniero<br />

→ Soluzione One-Shot<br />

Nash (C-C)<br />

→ Soluzione ripetuta potrebbe essere:<br />

[NC-NC] t=1,2, …<br />

● La strategia cooperativa ad ogni round del<br />

gioco può risultare conveniente perchè<br />

altrimenti le perd<strong>it</strong>e causate nel futuro dalla<br />

punizione comminata dall’avversario (che<br />

giocherà Nash) potrebbe essere più onerosa<br />

del guadagno con la defezione!


● L’idea è che la ripetizione di s<strong>it</strong>uazioni<br />

confl<strong>it</strong>tuali (quando esistono minacce credibili<br />

di punizioni) possa generare comportamenti<br />

cooperativi è alla base del:<br />

● Es. Un’autor<strong>it</strong>à<br />

esterna (o un<br />

fattore esterno)<br />

costringe a<br />

cooperare<br />

Folk Theorem<br />

→ La cooperazione può avvenire per via:<br />

Esogena Endogena<br />

● Con la ripetizione<br />

la cooperazione si<br />

impone<br />

endogenamente<br />

(anche se non si è<br />

del tutto sicuri)


→ Si coopera per convenienza economica<br />

→ L’es<strong>it</strong>o dipende dal gioco se è ripetuto un<br />

numero:<br />

Fin<strong>it</strong>o<br />

Infin<strong>it</strong>o<br />

One-Shot Nash<br />

Cooperaz.<br />

Se Fin<strong>it</strong>o: Backward-Induction:<br />

● L’ultimo round cessa la convenienza nel<br />

giocare cooperativo: non vi è deterrente della<br />

punizione futura<br />

● Nel penultimo round non c’è convenienza a<br />

cooperare dato che nel round successivo si<br />

avrà una soluzione confl<strong>it</strong>tuale, etc.<br />

→ Con T Fin<strong>it</strong>o → Cooperazione solo se i<br />

giocatori non sanno con esattezza quando<br />

avrà termine il gioco


FOLK THEOREM<br />

→ Giocatori A e B<br />

→ Punto di vista di A:<br />

A<br />

Collabora<br />

Tradisce<br />

(Defeziona)<br />

A e B non<br />

collaborano<br />

V COOP<br />

V DEF<br />

V NASH<br />

V DEF > V COOP > V NASH<br />

● Se al tempo t, A tradisce ottiene il guadagno<br />

V DEF – V COOP<br />

● Ma in ogni periodo successivo subirà una<br />

perd<strong>it</strong>a: l’avversario lo costringerà<br />

all’equilibrio di Nash<br />

V COOP – V NASH<br />

Perd<strong>it</strong>a in ogni<br />

periodo successivo


A coopera solo se:<br />

→ L’incremento dell’util<strong>it</strong>à ottenuto con la<br />

defezione è inferiore al valore attuale delle<br />

perd<strong>it</strong>e future: (VAP) per t= 1,2, ….<br />

VAP = Ʃ t δ t (V COOP -V NASH )<br />

Per cooperare:<br />

Ʃ tδ t (V COOP -V NASH )>(V DEF -V COOP )


NOTA: Proprietà serie geometriche:<br />

Ʃ ∞ 0δ = 1+δ+δ 2 + … δ i i →∞<br />

=<br />

1<br />

1- δ<br />

1<br />

=<br />

1- 1<br />

1+ r<br />

1 +r<br />

r<br />

Inoltre la nostra Ʃ parte da t=1:<br />

Ʃ ∞<br />

t=1<br />

1 +r<br />

=<br />

r<br />

t<br />

= 1 +r<br />

1 +r<br />

r<br />

1<br />

-<br />

r 1+r<br />

- 1 = 1/r<br />

0


VAP = 1 (V COOP -V NASH )<br />

r Valore attuale<br />

Per cooperare:<br />

delle perd<strong>it</strong>e future<br />

1 (V COOP -V NASH )>(V DEF -V COOP )<br />

r<br />

r <<br />

(V COOP -V NASH )<br />

(V DEF -V COOP )<br />

● Conviene tener fede all’accordo quando si da<br />

adeguata importanza al futuro (il tasso di<br />

sconto è abbastanza piccolo e il fattore di<br />

sconto δ conseguentemente elevato e<br />

prossimo a 1)


● In tal caso si valutano come onerose<br />

le perd<strong>it</strong>e. Se il giocatore è molto<br />

impaziente (ralto δ basso) sarà<br />

per lui conveniente tradire:<br />

attribuisce scarso peso alle perd<strong>it</strong>e<br />

future


ESEMPIO DILEMMA DEL PRIGIONIERO<br />

b 1<br />

b 2<br />

a 1 8, 8 1, 14<br />

a 2 14, 1 5, 5<br />

Equilibrio One-Shot:<br />

(a 2 , b 2)<br />

→ Se viene ripetuto un numero infin<strong>it</strong>o di volte?<br />

● Se I defeziona ottiene un guadagno<br />

immediato di 6 (da 8 a 14). Tuttavia in tutti i<br />

rounds successivi la sua payoff peggiora di 3<br />

(da 8 a 5)<br />

● Al giocatore I conviene confermare l’accordo<br />

su (a 1 , b 1) se<br />

6<br />

<<br />

Ʃ ∞<br />

t=1<br />

3<br />

1<br />

1+r<br />

(V DEF -V COOP ) (V COOP -V NASH )<br />

Guagagno<br />

immediato<br />

<<br />

Perd<strong>it</strong>e<br />

attualizzate<br />

t


6 < 3 (1/r) r < ½<br />

r < ½<br />

È la condizione necessaria affinché nel<br />

gioco ripetuto (con orizzonte infin<strong>it</strong>o)<br />

al giocatore I convenga adottare un<br />

comportamento cooperativo, posto<br />

che II cooperi


FOLK THEOREM<br />

INTRODUZIONE<br />

DELLE<br />

TRIGGER<br />

STRATEGIES


→ Dato il fattore di sconto δ il valore attuale di<br />

una successione infin<strong>it</strong>a di payoff π 1, π 2, π 3 …<br />

π 1 + δπ 2 + δ 2 π 3 + … Ʃ ∞ δ t-1 π 2<br />

● Con il fattore di sconto si può intendere un<br />

gioco ripetuto infin<strong>it</strong>amente come un gioco<br />

che termina dopo un numero casuale di<br />

ripetizioni<br />

● Alla fine di ogni ripetizione esiste una<br />

probabil<strong>it</strong>à (p) che il gioco finisca e (1-p) che<br />

continui per un altro turno<br />

● Nel prossimo turno la payoff vale:<br />

(1-p)πδ<br />

● Tra due turni (qualora entrambi i turni<br />

vengano giocati), la payoff sarà:<br />

(1-p) 2 πδ 2


→ Se ridefiniamo:<br />

δ = (1-p)<br />

(1+r)<br />

→ Allora il valore attuale:<br />

π 1 + δπ 2 + δ 2 π 3 + …<br />

● Riflette sia lo sconto che l’“eventual<strong>it</strong>à” che il<br />

gioco abbia termine


Dilemma del Prigioniero<br />

L 2<br />

R 2<br />

L 1 1,1 5,0<br />

R 1 0,5 4,4<br />

● Il giocatore (i) inizia il gioco ripetuto<br />

infin<strong>it</strong>amente cooperando, e poi<br />

coopera in ogni turno successivo a<br />

condizione che entrambi i giocatori<br />

abbiano cooperato nello stadio<br />

precedente<br />

→ (i) gioca R i nel primo stadio<br />

→ (i) gioca R i nel t-esimo stadio se:<br />

l’es<strong>it</strong>o dei t-1 stadi precedenti è stato<br />

(R 1, R 2), altrimenti gioca L i


● Una Trigger Strategy: prescrive che un<br />

giocatore cooperi fino a quando un<br />

altro non devia dalla soluzione<br />

cooperativa<br />

● Se entrambi usano la Trigger Strategy<br />

l’es<strong>it</strong>o del gioco è (R 1, R 2)<br />

● Se (i) adotta la TS anche per il<br />

giocatore (j) giocare la TS è una<br />

risposta ottima se δ è<br />

sufficientemente prossimo all’un<strong>it</strong>à<br />

● (j) giocando L j otterrà una payoff di 5<br />

nel primo stadio ma innescherà una<br />

fase di non cooperazione da parte di<br />

(i) (e quindi anche di j) così che le<br />

payoff in ogni stadio futuro saranno<br />

pari a 1.


Se sceglie L j il valore attuale è:<br />

5 + δ·1 + δ 2 ·1 + … =<br />

5 +<br />

δ<br />

1- δ<br />

= V<br />

● Se invece sceglie R j ottiene una payoff<br />

di 4 in questo stadio<br />

● Se V= valore attuale della successione<br />

infin<strong>it</strong>a delle payoff che (j) riceve con<br />

tale scelta:<br />

V= 4 + δ·V<br />

V =<br />

4<br />

(1- δ)


Riassumendo: Nell’esempio del Dilemma del<br />

Prigioniero<br />

Devia<br />

5 + δ·1 + δ 2 ·1 + δ 3 ·1 =<br />

5 + δ [1 + δ + δ 2 + …] =<br />

Coopera<br />

4 + δ·4 + δ 2 ·4 + δ 3 ·4 =<br />

4 [1 + δ + δ 2 + …] = 1- δ<br />

→ È ottimo cooperare se:<br />

4 .<br />

1<br />

1- δ<br />

≥<br />

4<br />

δ<br />

5 + . 1<br />

1- δ<br />

δ<br />

5 + . 1<br />

1- δ


→ Giocare R j è ottimo solo se:<br />

4<br />

≥<br />

1- δ<br />

→Cioè se δ ≥ ¼.<br />

5 +<br />

δ<br />

1- δ<br />

→ In ogni stadio per (j) è ottimo<br />

giocare R j solo se δ ≥ ¼. Qualora<br />

l’es<strong>it</strong>o in uno stadio sia diverso da<br />

(R 1, R 2) (j) giocherà L j per sempre:<br />

Giocare la Trigger Strategy , da parte<br />

di entrambi i giocatori, in questo<br />

gioco è un Equilibrio di Nash se e solo<br />

se δ ≥ ¼


Ricordare: Un Equilibrio di Nash è perfetto<br />

nei sottogiochi se le strategie dei<br />

sottogiochi cost<strong>it</strong>uiscono un E.N. in<br />

ogni sottogioco<br />

● Per mostrare che un E.N. in Trigger<br />

Strategies del Dilemma del Prigioniero<br />

ripetuto infin<strong>it</strong>am. è perfetto nei<br />

sottogiochi, mostrare che le TS sono<br />

un E.N. per ogni sottogioco del gioco<br />

ripetuto<br />

● Ogni sottogioco di un gioco ripetuto<br />

infin<strong>it</strong>amente è identico al gioco nel<br />

suo complesso<br />

→ 2 Classi di sottogiochi:<br />

1. In cui tutti gli stadi precedenti sono (R 1, R 2)<br />

2. In cui in almeno uno stadio precedente l’es<strong>it</strong>o<br />

è diverso da (R 1, R 2)


● Le TS nei sottogiochi della prima<br />

classe sono le TS che si è mostrato<br />

producono un Equilibrio di Nash per<br />

l’intero gioco.<br />

● Le strategie della seconda classe<br />

producono la ripetizione infin<strong>it</strong>a di (L 1,<br />

L 2) che è anch’esso un Equilibri di<br />

Nash per il gioco nel suo complesso.<br />

● L’Equilibrio di Nash in Trigger<br />

Strategy del DP ripetuto è perfetto<br />

nei sottogiochi


Relazione tra tasso di sconto e<br />

fattore di sconto.<br />

Nella prima formulazione del Folk Theorem<br />

abbiamo forn<strong>it</strong>o una soluzione in termini di<br />

fattore di sconto. Nella formulazione delle<br />

trigger strategy in termini di tasso di sconto.<br />

δ =<br />

1<br />

1+r


→ Riprendiamo il gioco DP<br />

≥<br />

8 .<br />

→ NOTA:<br />

δ =<br />

8 ≥<br />

1<br />

1- δ<br />

14 - δ·9<br />

1<br />

≥<br />

14 +<br />

(1- δ)14+ δ·5<br />

1+r<br />

b 1<br />

δ =<br />

2<br />

3<br />

b 2<br />

a 1 8,8 1,14<br />

a 2 14,1 5,5<br />

δ<br />

1- δ<br />

6<br />

9<br />

=<br />

.<br />

=<br />

1<br />

5<br />

2<br />

3<br />

1+r<br />

(1+r) 3<br />

= r 1<br />

=<br />

2<br />

2


COURNOT<br />

P(Q) = a – Q ; Q = q 1 + q 2 ;<br />

→ Unico Equilibrio di Nash ogni impresa<br />

produce<br />

q i =<br />

(a-c)<br />

= q C = q COURNOT<br />

→NOTA: La quant<strong>it</strong>à aggregata di Equilibrio<br />

(a-c)<br />

è maggiore di quella di monopolio<br />

Le imprese hanno l’incentivo a produrre la metà<br />

della quant<strong>it</strong>à di monopolio<br />

3<br />

2<br />

q i =<br />

3<br />

q m<br />

2<br />

q m =<br />

Questa potrebbe essere la quant<strong>it</strong>à<br />

su cui accordarsi<br />

Q < a ; C<br />

(a-c)<br />

2


→ Nel Gioco statico non si rispetta questo<br />

accordo, in un Gioco ripetuto infin<strong>it</strong>amente?<br />

● Calcolare i valori di δ per cui le Trigger-<br />

Strategy adottate dalle imprese cost<strong>it</strong>uiscono<br />

un E.N. perfetto nei sottogiochi:<br />

● Accordo prevede che si produca q m/2 nel 1<br />

periodo: nel t-esimo si produce q m/2 se<br />

entrambe hanno prodotto q m/2 nei t-1 periodi<br />

altrimenti si produce q c<br />

● Se entrambe producono q m/2,<br />

PROFITTO<br />

Se entrambe producono q C:<br />

PROFITTO<br />

π m<br />

2<br />

π c<br />

=<br />

=<br />

(a-c) 2<br />

8<br />

(a-c) 2<br />

9


COURNOT – RIPETUTO<br />

→ NOTA:<br />

C.P.O.<br />

πD = a qj – q 2 q<br />

j – qj<br />

m<br />

– c qj 2<br />

∂(π D)<br />

∂q j<br />

qm = a - 2qj - - c<br />

2<br />

qm qj = a - - c<br />

2<br />

q m =<br />

(a-c)<br />

2<br />

1<br />

= a -<br />

(a-c)<br />

- c<br />

2<br />

4<br />

q j =<br />

3 (a-c)<br />

8<br />

1<br />

2


π m<br />

2<br />

π c<br />

π D<br />

=<br />

=<br />

=<br />

(a-c) 2<br />

8<br />

(a-c) 2<br />

9<br />

9(a-c) 2<br />

64<br />

10<br />

8<br />

10<br />

9<br />

10·9<br />

64<br />

π D >π m/2>π c<br />

= 1.25<br />

= 1.11<br />

= 1.40


→ DEVIAZIONE: Se (i) produce q m/2 , (j) può<br />

massimizzare la sua quant<strong>it</strong>à<br />

∂(π D)<br />

∂q j<br />

q m<br />

π MAX<br />

D = (a – qj – – c) qj qj 2<br />

q j<br />

=<br />

3(a-c)<br />

8<br />

π D<br />

=<br />

9(a-c) 2<br />

64<br />

→ La soluzione dove entrambe adottano le TS è<br />

un Equilibrio di Nash se:<br />

1<br />

1- δ<br />

·<br />

π m<br />

2<br />

≥<br />

π d +<br />

δ<br />

1- δ<br />

· π c<br />

→ Se sost<strong>it</strong>u<strong>it</strong>e i valori πm , πd e πc nella<br />

si ha:<br />

9<br />

δ ≥<br />

17<br />

1<br />

1- δ<br />

·<br />

π m<br />

2<br />

≥<br />

π d +<br />

δ<br />

1- δ<br />

· π c<br />

(1)<br />

(1)<br />

Deviazione Cournot<br />

Cooperano sempre<br />

Nash<br />

per la metà del<br />

monopolio<br />

(Punizione)


SERIE GEOMETRICHE CONVERGENTI<br />

→ Per ogni valore pos<strong>it</strong>ivo di p<br />

1+p+p 2 +p 3 + … p i i →∞<br />

→ Converge a:<br />

1<br />

1- p<br />

i →∞


Un gioco ripetuto rappresenta una<br />

s<strong>it</strong>uazione in cui due o più individui<br />

affrontano esattamente la stessa<br />

s<strong>it</strong>uazione compet<strong>it</strong>iva un numero infin<strong>it</strong>o<br />

di volte e sempre con informazione<br />

completa riguardo il comportamento<br />

passato dei giocatori.<br />

Una strategia per un giocatore in un gioco<br />

ripetuto è una regola per determinare la<br />

sua mossa in ogni round in funzione della<br />

storia delle mosse che sono state utilizzate<br />

in ogni precedente round.<br />

Le due strategie più utilizzate sono grim<br />

strategy e T<strong>it</strong>-for-Tat, entrambi sono<br />

dette trigger strategy.


E<br />

C F<br />

C 5,5 -3,8<br />

F 8,-3 0,0<br />

(-3, 8)<br />

8<br />

A<br />

B<br />

(5, 5)<br />

-3 O 5<br />

8<br />

-3<br />

gli assi verticali ed orizzontali<br />

indicano le payoffs,<br />

rispettivamente, di II e di I.<br />

C<br />

F<br />

(8, -3)<br />

L’area OEABCF, rappresenta tutte le possibili<br />

soluzioni se i due giocatori utilizzano le<br />

possibili combinazioni delle quattro soluzioni<br />

(5,5), (-3,8), (8,-3) e (0,0)


Se restringiamo il set di strategie a quelle<br />

nell’area convessa OABC il Folk Theorem<br />

garantisce che ogni punto in questa area<br />

convessa è un equilibrio di Nash<br />

raggiungibile come media delle payoffs del<br />

gioco ripetuto un numero di volte infin<strong>it</strong>o,<br />

purché i giocatori non scontino troppo il<br />

futuro (siano pazienti).<br />

Questa area mostra l’area di payoffs<br />

cooperativa (superiore all’equilibrio one-shot<br />

che produce una payoff di zero per entrambi<br />

i giocatori).<br />

L’area piuttosto ampia indica che un DP<br />

ripetuto infin<strong>it</strong>amente ha molti Nash. Notare<br />

che uno di questi è giocare sempre (F,F) in<br />

ogni ripetizione e uno è invece giocare sempre<br />

(C,C), entrambi i punti fanno parte del set di<br />

equilibri della figura.


Il giocatore I annuncia una grim strategy<br />

(feroce, spietato, truce): gioca C e nel caso<br />

l’atro giocatore devi da questa soluzione,<br />

giocherà sempre F.<br />

Se per II questo annuncio è credibile, allora<br />

qual è la sua strategia ottimale?<br />

Se gioca anch’esso sempre C, otterrà una<br />

sequenza di 5, cui corrisponde un valore<br />

atteso scontato pari a 5/1-δ<br />

Se invece, per qualsiasi ragione, non r<strong>it</strong>iene<br />

di giocare C, ma optare sub<strong>it</strong>o con F, ottiene<br />

sub<strong>it</strong>o un guadagno pari a 8 e poi,<br />

successivamente, una payoff pari a 0.<br />

Confrontando i due es<strong>it</strong>i si nota che la<br />

risposta ottima dipende dal tasso di sconto,<br />

in questo caso sappiamo che per valori del<br />

tasso di sconto almeno uguali a 3/8,<br />

l’opponente non ha incentivo a giocare né<br />

ora né mai F.<br />

In maniera analoga se il giocatore II<br />

annuncia una grim strategy, giocare sempre<br />

C.


:Grim vs T<strong>it</strong> for Tat strategy<br />

c d<br />

C R, R N, T<br />

D T, N P, P<br />

DP: R=ricavo; P=punizione; T=tentazione; N=naive.<br />

C = strategia cooperativa; D =defezione. T>R>P>N.<br />

TfT: gioca cooperare nella primo round<br />

e in tutti gli altri rounds gioca la<br />

strategia usata dell’altro giocatore nel<br />

round precedente<br />

Un giocatore coopera nel primo round di<br />

un DP e, successivamente, si comporta<br />

in base a quello che ha fatto il suo<br />

opponente nel precedente round.<br />

Quindi, una volta constatata la<br />

defezione, si pratica un immediata e<br />

reciproca punizione: se tu defezioni in<br />

questo round io defeziono il round<br />

successivo.


Grim (spietata) trigger strategy: una<br />

volta che un giocatore devia dalla<br />

soluzione cooperativa, l’opponente<br />

mette in pratica per sempre la<br />

minaccia pun<strong>it</strong>iva di giocare la<br />

strategia il cui risultato produce<br />

l’equilibrio inefficiente.


Con grim trigger strategy, il comportamento<br />

opportunistico o “deviante” è dissuaso<br />

quando:<br />

Dev<br />

Dev<br />

c d<br />

C R, R N, T<br />

D T, N P, P<br />

1<br />

R<br />

1<br />

R T ( 1<br />

T<br />

T<br />

T<br />

P<br />

R<br />

P<br />

T<br />

T<br />

)<br />

1<br />

coop<br />

Nash<br />

R<br />

P<br />

P<br />

R<br />

T<br />

T<br />

T<br />

R<br />

P<br />

T<br />

P


Con TfT trigger strategy<br />

Dev<br />

coop<br />

coop<br />

Naive<br />

T<br />

R<br />

R<br />

N


se un giocatore defeziona in un<br />

round del gioco e poi gioca<br />

cooperativo nel round successivo,<br />

ottiene una payoff di T+δN. Se<br />

invece il giocatore che defeziona usa<br />

il TfT (gioca cooperare nella primo<br />

round e in tutti gli altri rounds gioca<br />

la strategia usata dell’altro giocatore<br />

nel round precedente), la sua payoff<br />

è R+δR. Dopo questi due primi<br />

round i giocatori r<strong>it</strong>ornano a giocare<br />

cooperativo negli altri round. La<br />

defezione è quindi dissuasa se:<br />

Cioe’:<br />

R<br />

Dev<br />

coop<br />

R<br />

T<br />

coop<br />

Naive<br />

N<br />

T<br />

R<br />

R<br />

N


T<br />

T<br />

R<br />

P<br />

9<br />

9<br />

8<br />

2<br />

1<br />

7<br />

s g<br />

a 8, 8 0, 9<br />

b 9, 0 2, 2<br />

;<br />

Nota in questo caso la Grim strategy produce la<br />

soglia del tasso di sconto più elevata di quella<br />

della TfT .<br />

Il deterrente necessario per cooperare in ogni<br />

round del gioco è supportato dalla strategia grim.<br />

In questi casi la strategia TfT potrebbe supportare<br />

la (o forzare alla) cooperazione tra i due giocatori<br />

per valori del tasso di sconto per cui la strategia<br />

grim non potrebbe: la TfT produce valori inferiori<br />

per il tasso di sconto di quelli prodotti dalla grim.<br />

T<br />

R<br />

R<br />

N<br />

9<br />

8<br />

8<br />

0<br />

1<br />

8


Un DP ripetuto infin<strong>it</strong>amente ha un infin<strong>it</strong>o<br />

numero di strategie, ad esempio,<br />

1) Il giocatore I può giocare TfT e il giocatore II può<br />

giocare TfT.<br />

2) Il giocatore I può giocare TfT e il giocatore II può<br />

giocare grim.<br />

3) Il giocatore I può giocare TfT e il giocatore II può<br />

giocare sempre C.<br />

4) Il giocatore I può giocare TfT e il giocatore II può<br />

giocare sempre F.<br />

5) Il giocatore I può giocare grim e il giocatore II<br />

giocare TfT.<br />

6) Il giocatore I può giocare grim e il giocatore II<br />

giocare grim<br />

7) Il giocatore I può giocare grim e il giocatore II<br />

giocare sempre C<br />

………..

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!