Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab
Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab
Perder + Perder = Ganar. Juegos y estrategias paradójicas - RiskLab
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Perder</strong> + <strong>Perder</strong> = <strong>Ganar</strong>.<br />
<strong>Juegos</strong> y <strong>estrategias</strong> paradójicas<br />
Juan M.R. Parrondo<br />
Universidad Complutense de Madrid<br />
•Los juegos paradójicos originales.<br />
• Una primera explicación: reorganización de tendencias.<br />
•Una segunda explicación: el efecto ratchet.<br />
• Estrategias bien informadas y <strong>estrategias</strong> ciegas.<br />
•Conclusiones<br />
Derek Abbott. U. de Adelaide<br />
Borja Jiménez. UCM<br />
Luis Dinís. UCM
Las reglas<br />
Juego A<br />
Juego B<br />
Moneda 1<br />
¿Es X(t) múltiplo de 3?<br />
No<br />
Sí<br />
Moneda 2 Moneda 3<br />
ganar: X(t) = X(t -1) +1<br />
perder: X(t) = X(t -1) - 1<br />
ganar<br />
perder<br />
p 1 =1/2-ε<br />
p 1<br />
1-p 1<br />
p 2 =3/4-ε p 3 =1/10-ε<br />
p 2 1-p 2 p 3 1-p 3<br />
ganar perder ganar perder<br />
ε = 0 ⇒ < X(t) > = constante (juegos justos)<br />
UCM-28-4-00 2
La paradoja<br />
p = 1/2 – ε<br />
p 1 = 1/10 – ε<br />
p 2 = 3/4 – ε<br />
ε = 0.005<br />
Capital medio<br />
2<br />
1.5<br />
1<br />
0.5<br />
0<br />
-0.5<br />
-1<br />
[3,2]<br />
[2,2]<br />
random<br />
[4,4]<br />
Juego A<br />
-1.5<br />
0 20 40 60 80 100<br />
Número de turnos<br />
Juego B<br />
UCM-28-4-00 3
La condición de juego justo<br />
p q p p q<br />
1- q<br />
1- p 1- p 1- q 1- p<br />
q × p × p = (1- q)×(1- p)×(1- p)<br />
Juego B:<br />
Combinación aleatoria:<br />
1/ 2 + 1/10<br />
=<br />
2<br />
6<br />
;<br />
20<br />
1/ 2 + 3/ 4<br />
=<br />
2<br />
5<br />
8<br />
1 3 3 9 1 1<br />
× × = × ×<br />
10 4 4 10 4 4<br />
6 5 5 14 3 3<br />
× × > × ×<br />
20 8 8 20 8 8<br />
Un argumento erróneo<br />
Probabilidad de ganar:<br />
2 1 × p+ × q<br />
3 3<br />
2 3 1 1 16 1<br />
× + × = ><br />
3 4 3 10 30 2<br />
¿El juego B es ganador?<br />
UCM-28-4-00 4
Una primera explicación: reorganización de tendencias<br />
p q p p q<br />
1-q<br />
1-p 1-p 1-q 1-p<br />
La probabilidad de ganar es:<br />
(1 − π ) × p + π × q<br />
0 0<br />
π<br />
0<br />
= probabilidad de que X(t) sea múltiplo de 3<br />
π = =<br />
13<br />
Juego B: p = 3/4, q = 1/10 ⇒ 0<br />
5<br />
0.3846<br />
245<br />
Combinación aleatoria: p = 5/8, q = 6/20 ⇒ π 0<br />
= = 0.3456<br />
709<br />
El juego A disminuye la probabilidad de utilizar la moneda “mala”<br />
UCM-28-4-00 5
Reorganización de tendencias<br />
p q p p q<br />
1-q<br />
1-p 1-p 1-q 1-p<br />
Juego A<br />
Juego B<br />
Moneda 1<br />
p 1<br />
1-p 1<br />
¿Es X(t) múltiplo de 3?<br />
No<br />
Sí<br />
Moneda 2 Moneda 3<br />
5<br />
π<br />
0<br />
= = 0.3846 (sólo B)<br />
13<br />
ganar<br />
p 1 =1/2-ε<br />
perder<br />
p 2 1-p 2 p 3 1-p 3<br />
ganar perder ganar perder<br />
p 2 =3/4-ε<br />
p 3 =1/10-ε<br />
245<br />
π<br />
0<br />
= = 0.3456 (combinación)<br />
709<br />
UCM-28-4-00 6
<strong>Juegos</strong> independientes del capital<br />
(JMRP, Harmer, Abbott, PRL 11 de dic 2000)<br />
Juego B:<br />
Penúltimo<br />
( t -2)<br />
Último<br />
( t -1)<br />
Prob. de<br />
ganar<br />
Prob. de<br />
perder<br />
perder perder p 0 1-p 0<br />
perder ganar p 1 1-p 1<br />
ganar perder p 2 1-p 2<br />
ganar ganar p 3 1-p 3<br />
p 0 = 9/10 p 1 = p 2 = 1/4 p 3 = 7/10<br />
La moneda “mala”<br />
UCM-28-4-00 7
ε = 0.002<br />
Simulaciones<br />
5<br />
1000<br />
4<br />
3<br />
2<br />
500<br />
1<br />
0<br />
0<br />
-1<br />
-2<br />
0 100 200 300 400 500<br />
-500<br />
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5<br />
5000 jugadores 1 jugador<br />
x 10 4<br />
UCM-28-4-00 8
La segunda explicación: el efecto ratchet<br />
U on<br />
Una partícula<br />
browniana en un<br />
potencial intermitente<br />
− L 0 L<br />
U off<br />
U on<br />
Desplazamiento<br />
(Simulación: http://monet.physik.unibas.ch/~elmer/bm/ )<br />
UCM-28-4-00 9
Ratchets discretas y máquinas térmicas<br />
v<br />
v/2<br />
0<br />
q<br />
p<br />
q’<br />
p<br />
q’<br />
p<br />
Dinámica de Metropolis:<br />
p<br />
=<br />
1 −V<br />
/ kT<br />
− V<br />
;<br />
2<br />
q<br />
=<br />
1<br />
2<br />
e<br />
;<br />
q'<br />
=<br />
1<br />
2<br />
e<br />
/ 2<br />
kT<br />
Juego A<br />
Juego B<br />
ε<br />
Temperatura infinita<br />
Temperatura finita<br />
Fuerza externa<br />
UCM-28-4-00 10
POSICIÓN<br />
1000<br />
500<br />
0<br />
-500<br />
-1000<br />
-1500<br />
Alternancia de temperaturas<br />
T= 0.3<br />
T =1<br />
0 20 40 60 80 100<br />
TIEMPO x10 3<br />
V = k = 1 Fuerza externa= - 0.1<br />
UCM-28-4-00 11
Las políticas óptimas a corto plazo pueden<br />
ser peores que las políticas “ciegas”<br />
x<br />
1<br />
x<br />
x<br />
<br />
2<br />
N<br />
Una fracción γ de jugadores<br />
Juego B<br />
Juego A<br />
Estrategias:<br />
•Óptima a corto plazo: se elige el juego que<br />
maximiza la probabilidad de ganar en cada turno.<br />
•Periódica: ABBABBABBABB...<br />
•Aleatoria: se elige el juego al azar.<br />
ciegas<br />
UCM-28-4-00 12<br />
Políticas 1
ε = 0.005 γ = 0.5<br />
N= ∞<br />
1.4<br />
1.2<br />
ABBABBABB...<br />
capital<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
-0.2<br />
-0.4<br />
0 20 40 60 80 100<br />
Número de turnos<br />
Aleatoria<br />
Óptima a corto plazo<br />
UCM-28-4-00 13<br />
Sim1
Sim epsilon=0<br />
ε = 0 γ = 0.5<br />
capital<br />
1.8<br />
1.6<br />
1.4<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
-0.2<br />
0 20 40 60 80 100<br />
ABBABBABB...<br />
Aleatoria<br />
Óptima a corto plazo<br />
Número de turnos<br />
UCM-28-4-00 14
π 0<br />
= fracción de jugadores en la moneda “mala”.<br />
Estrategia óptima: B A<br />
1/3<br />
5/13<br />
π 0<br />
Juego A<br />
Juego B<br />
•Siπ 0 < 5/13, la estrategia óptima elige B y desplaza π 0 hacia 5/13, haciendo<br />
que el sistema sea “menso productivo”.<br />
• Por el contrario, al jugar A con π 0 < 5/13, se reduce la ganancia en un turno<br />
pero se mantiene al sistema en una “región productiva”.<br />
La estrategia óptima “mata a la gallina de los huevos de oro”.<br />
UCM-28-4-00 15<br />
Políticas explicación
ε = 0 γ = 0.5<br />
0.5<br />
0.48<br />
0.46<br />
0.44<br />
capital<br />
0 20 40 60 80 100<br />
Número de turnos<br />
ABBABBABB...<br />
Aleatoria<br />
Óptima a corto plazo<br />
π 0<br />
0.42<br />
0.4<br />
0.38<br />
0.36<br />
0.34<br />
0.32<br />
0 20 40 60 80 100<br />
Número de turnos<br />
Óptima a corto plazo<br />
ABBABBABB...<br />
UCM-28-4-00 16<br />
Políticas
Optimización en teoría de control<br />
yt ()<br />
α<br />
=− x−<br />
ε<br />
xt () =− x+ 1−<br />
α<br />
α(t) = 0 or 1<br />
•OBJETIVO:<br />
encontrar α(t) que<br />
maximiza y(t)<br />
Estrategia óptima: α = 1 α = 0<br />
x<br />
α = 0<br />
α = 1<br />
-1<br />
0<br />
UCM-28-4-00 17
Conclusiones<br />
El resultado de alternar dos dinámicas no es trivial<br />
•Alternancia de ambientes o ligaduras:<br />
• patrones y fases ordenadas (Noise-induced phase transitions)<br />
• aplicaciones a la evolución biológica (?)<br />
• Alternancia de <strong>estrategias</strong>:<br />
• economía<br />
• alternancia programada: teoría de control estocástica<br />
UCM-28-4-00 18
0.5<br />
0.48<br />
0.46<br />
poblaciones ε = 0.005<br />
"optima"<br />
ABBABB...<br />
aleatoria<br />
0.44<br />
0.42<br />
π 0<br />
0.4<br />
0.38<br />
0.36<br />
0.34<br />
0.32<br />
0 20 40 60 80 100<br />
turno<br />
UCM-28-4-00 19