02.11.2014 Views

Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab

Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab

Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Perder</strong> + <strong>Perder</strong> = <strong>Ganar</strong>.<br />

<strong>Juegos</strong> y <strong>estrategias</strong> paradójicas<br />

Juan M.R. Parrondo<br />

Universidad Complutense de Madrid<br />

•Los juegos paradójicos originales.<br />

• Una primera explicación: reorganización de tendencias.<br />

•Una segunda explicación: el efecto ratchet.<br />

• Estrategias bien informadas y <strong>estrategias</strong> ciegas.<br />

•Conclusiones<br />

Derek Abbott. U. de Adelaide<br />

Borja Jiménez. UCM<br />

Luis Dinís. UCM


Las reglas<br />

Juego A<br />

Juego B<br />

Moneda 1<br />

¿Es X(t) múltiplo de 3?<br />

No<br />

Sí<br />

Moneda 2 Moneda 3<br />

ganar: X(t) = X(t -1) +1<br />

perder: X(t) = X(t -1) - 1<br />

ganar<br />

perder<br />

p 1 =1/2-ε<br />

p 1<br />

1-p 1<br />

p 2 =3/4-ε p 3 =1/10-ε<br />

p 2 1-p 2 p 3 1-p 3<br />

ganar perder ganar perder<br />

ε = 0 ⇒ < X(t) > = constante (juegos justos)<br />

UCM-28-4-00 2


La paradoja<br />

p = 1/2 – ε<br />

p 1 = 1/10 – ε<br />

p 2 = 3/4 – ε<br />

ε = 0.005<br />

Capital medio<br />

2<br />

1.5<br />

1<br />

0.5<br />

0<br />

-0.5<br />

-1<br />

[3,2]<br />

[2,2]<br />

random<br />

[4,4]<br />

Juego A<br />

-1.5<br />

0 20 40 60 80 100<br />

Número de turnos<br />

Juego B<br />

UCM-28-4-00 3


La condición de juego justo<br />

p q p p q<br />

1- q<br />

1- p 1- p 1- q 1- p<br />

q × p × p = (1- q)×(1- p)×(1- p)<br />

Juego B:<br />

Combinación aleatoria:<br />

1/ 2 + 1/10<br />

=<br />

2<br />

6<br />

;<br />

20<br />

1/ 2 + 3/ 4<br />

=<br />

2<br />

5<br />

8<br />

1 3 3 9 1 1<br />

× × = × ×<br />

10 4 4 10 4 4<br />

6 5 5 14 3 3<br />

× × > × ×<br />

20 8 8 20 8 8<br />

Un argumento erróneo<br />

Probabilidad de ganar:<br />

2 1 × p+ × q<br />

3 3<br />

2 3 1 1 16 1<br />

× + × = ><br />

3 4 3 10 30 2<br />

¿El juego B es ganador?<br />

UCM-28-4-00 4


Una primera explicación: reorganización de tendencias<br />

p q p p q<br />

1-q<br />

1-p 1-p 1-q 1-p<br />

La probabilidad de ganar es:<br />

(1 − π ) × p + π × q<br />

0 0<br />

π<br />

0<br />

= probabilidad de que X(t) sea múltiplo de 3<br />

π = =<br />

13<br />

Juego B: p = 3/4, q = 1/10 ⇒ 0<br />

5<br />

0.3846<br />

245<br />

Combinación aleatoria: p = 5/8, q = 6/20 ⇒ π 0<br />

= = 0.3456<br />

709<br />

El juego A disminuye la probabilidad de utilizar la moneda “mala”<br />

UCM-28-4-00 5


Reorganización de tendencias<br />

p q p p q<br />

1-q<br />

1-p 1-p 1-q 1-p<br />

Juego A<br />

Juego B<br />

Moneda 1<br />

p 1<br />

1-p 1<br />

¿Es X(t) múltiplo de 3?<br />

No<br />

Sí<br />

Moneda 2 Moneda 3<br />

5<br />

π<br />

0<br />

= = 0.3846 (sólo B)<br />

13<br />

ganar<br />

p 1 =1/2-ε<br />

perder<br />

p 2 1-p 2 p 3 1-p 3<br />

ganar perder ganar perder<br />

p 2 =3/4-ε<br />

p 3 =1/10-ε<br />

245<br />

π<br />

0<br />

= = 0.3456 (combinación)<br />

709<br />

UCM-28-4-00 6


<strong>Juegos</strong> independientes del capital<br />

(JMRP, Harmer, Abbott, PRL 11 de dic 2000)<br />

Juego B:<br />

Penúltimo<br />

( t -2)<br />

Último<br />

( t -1)<br />

Prob. de<br />

ganar<br />

Prob. de<br />

perder<br />

perder perder p 0 1-p 0<br />

perder ganar p 1 1-p 1<br />

ganar perder p 2 1-p 2<br />

ganar ganar p 3 1-p 3<br />

p 0 = 9/10 p 1 = p 2 = 1/4 p 3 = 7/10<br />

La moneda “mala”<br />

UCM-28-4-00 7


ε = 0.002<br />

Simulaciones<br />

5<br />

1000<br />

4<br />

3<br />

2<br />

500<br />

1<br />

0<br />

0<br />

-1<br />

-2<br />

0 100 200 300 400 500<br />

-500<br />

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5<br />

5000 jugadores 1 jugador<br />

x 10 4<br />

UCM-28-4-00 8


La segunda explicación: el efecto ratchet<br />

U on<br />

Una partícula<br />

browniana en un<br />

potencial intermitente<br />

− L 0 L<br />

U off<br />

U on<br />

Desplazamiento<br />

(Simulación: http://monet.physik.unibas.ch/~elmer/bm/ )<br />

UCM-28-4-00 9


Ratchets discretas y máquinas térmicas<br />

v<br />

v/2<br />

0<br />

q<br />

p<br />

q’<br />

p<br />

q’<br />

p<br />

Dinámica de Metropolis:<br />

p<br />

=<br />

1 −V<br />

/ kT<br />

− V<br />

;<br />

2<br />

q<br />

=<br />

1<br />

2<br />

e<br />

;<br />

q'<br />

=<br />

1<br />

2<br />

e<br />

/ 2<br />

kT<br />

Juego A<br />

Juego B<br />

ε<br />

Temperatura infinita<br />

Temperatura finita<br />

Fuerza externa<br />

UCM-28-4-00 10


POSICIÓN<br />

1000<br />

500<br />

0<br />

-500<br />

-1000<br />

-1500<br />

Alternancia de temperaturas<br />

T= 0.3<br />

T =1<br />

0 20 40 60 80 100<br />

TIEMPO x10 3<br />

V = k = 1 Fuerza externa= - 0.1<br />

UCM-28-4-00 11


Las políticas óptimas a corto plazo pueden<br />

ser peores que las políticas “ciegas”<br />

x<br />

1<br />

x<br />

x<br />

<br />

2<br />

N<br />

Una fracción γ de jugadores<br />

Juego B<br />

Juego A<br />

Estrategias:<br />

•Óptima a corto plazo: se elige el juego que<br />

maximiza la probabilidad de ganar en cada turno.<br />

•Periódica: ABBABBABBABB...<br />

•Aleatoria: se elige el juego al azar.<br />

ciegas<br />

UCM-28-4-00 12<br />

Políticas 1


ε = 0.005 γ = 0.5<br />

N= ∞<br />

1.4<br />

1.2<br />

ABBABBABB...<br />

capital<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

-0.2<br />

-0.4<br />

0 20 40 60 80 100<br />

Número de turnos<br />

Aleatoria<br />

Óptima a corto plazo<br />

UCM-28-4-00 13<br />

Sim1


Sim epsilon=0<br />

ε = 0 γ = 0.5<br />

capital<br />

1.8<br />

1.6<br />

1.4<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

-0.2<br />

0 20 40 60 80 100<br />

ABBABBABB...<br />

Aleatoria<br />

Óptima a corto plazo<br />

Número de turnos<br />

UCM-28-4-00 14


π 0<br />

= fracción de jugadores en la moneda “mala”.<br />

Estrategia óptima: B A<br />

1/3<br />

5/13<br />

π 0<br />

Juego A<br />

Juego B<br />

•Siπ 0 < 5/13, la estrategia óptima elige B y desplaza π 0 hacia 5/13, haciendo<br />

que el sistema sea “menso productivo”.<br />

• Por el contrario, al jugar A con π 0 < 5/13, se reduce la ganancia en un turno<br />

pero se mantiene al sistema en una “región productiva”.<br />

La estrategia óptima “mata a la gallina de los huevos de oro”.<br />

UCM-28-4-00 15<br />

Políticas explicación


ε = 0 γ = 0.5<br />

0.5<br />

0.48<br />

0.46<br />

0.44<br />

capital<br />

0 20 40 60 80 100<br />

Número de turnos<br />

ABBABBABB...<br />

Aleatoria<br />

Óptima a corto plazo<br />

π 0<br />

0.42<br />

0.4<br />

0.38<br />

0.36<br />

0.34<br />

0.32<br />

0 20 40 60 80 100<br />

Número de turnos<br />

Óptima a corto plazo<br />

ABBABBABB...<br />

UCM-28-4-00 16<br />

Políticas


Optimización en teoría de control<br />

yt ()<br />

α<br />

=− x−<br />

ε<br />

xt () =− x+ 1−<br />

α<br />

α(t) = 0 or 1<br />

•OBJETIVO:<br />

encontrar α(t) que<br />

maximiza y(t)<br />

Estrategia óptima: α = 1 α = 0<br />

x<br />

α = 0<br />

α = 1<br />

-1<br />

0<br />

UCM-28-4-00 17


Conclusiones<br />

El resultado de alternar dos dinámicas no es trivial<br />

•Alternancia de ambientes o ligaduras:<br />

• patrones y fases ordenadas (Noise-induced phase transitions)<br />

• aplicaciones a la evolución biológica (?)<br />

• Alternancia de <strong>estrategias</strong>:<br />

• economía<br />

• alternancia programada: teoría de control estocástica<br />

UCM-28-4-00 18


0.5<br />

0.48<br />

0.46<br />

poblaciones ε = 0.005<br />

"optima"<br />

ABBABB...<br />

aleatoria<br />

0.44<br />

0.42<br />

π 0<br />

0.4<br />

0.38<br />

0.36<br />

0.34<br />

0.32<br />

0 20 40 60 80 100<br />

turno<br />

UCM-28-4-00 19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!