14.11.2014 Views

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

Teoria dos Jogos - IAG - A Escola de Negócios da PUC-Rio

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Opções Reais: <strong>Teoria</strong> e Prática <strong>de</strong> Análise <strong>de</strong><br />

Investimentos sob Incertezas<br />

Análise Estratégica <strong>de</strong><br />

Investimentos com <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

Marco Antonio Guimarães Dias,<br />

Professor Adjunto, tempo parcial<br />

<strong>Rio</strong> <strong>de</strong> Janeiro, Outubro <strong>de</strong> 2009 .<br />

Bibliografia<br />

Livros-texto (cobrem apenas parte <strong>da</strong> matéria):<br />

Parte <strong>de</strong> teoria <strong>dos</strong> jogos: MWG = Mas-Colell, A. & M.D. Whinston<br />

& J.R. Green (1995): “Microeconomic Theory” (espec. caps. 7 a 9);<br />

OR e <strong>Jogos</strong> <strong>de</strong> OR: DP = Dixit & Pindyck (1994): “Investment un<strong>de</strong>r<br />

Uncertainty” (dinâmica <strong>da</strong> indústria e jogos <strong>de</strong> OR: caps. 8 e 9).<br />

Bibliografia complementar que mais uso em teoria <strong>dos</strong> jogos:<br />

Dutta, P.K. (1999): “Strategies and Games”. MIT Press.<br />

Gibbons, R. (1992): "Game Theory for Applied Economists".<br />

Osborne, M.J. (2004): “An Introduction to Game Theory”.<br />

Fu<strong>de</strong>nberg, D. & J. Tirole (1991): “Game Theory”. MIT Press<br />

Shy, O. (1995): “Industrial Organization – Theory and Applications”.<br />

Menezes, F.M. & P. K. Monteiro (2005): "An Introduction to Auction Theory".<br />

Bibliografia complementar que mais uso em jogos <strong>de</strong> OR:<br />

Huisman, K.J.M. (2001): “Technology Investment: A Game<br />

Theoretic Real Options Approach”.<br />

Smit, H.T.J. & L. Trigeorgis (2004): “Strategic Investment – Real<br />

Options and Games”.<br />

1


O Que É a <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong>?<br />

A teoria <strong>dos</strong> jogos mo<strong>de</strong>la <strong>de</strong>cisões inter<strong>de</strong>pen<strong>de</strong>ntes<br />

entre agentes que se interagem (conflito ou cooperação).<br />

Os agentes po<strong>de</strong>m ser firmas, instituições, coalizões <strong>de</strong><br />

firmas ou pessoas, países, pessoas, animais irracionais, etc.<br />

O escopo <strong>de</strong> teoria <strong>dos</strong> jogos é bem amplo, sendo usado<br />

em vários ramos <strong>da</strong>s ciências sociais, como economia,<br />

mas também ciências biológicas (conflito <strong>de</strong> animais).<br />

Tem livros só com foco em biologia, em direito, finanças, etc.<br />

Sendo nosso foco em economia/finanças, vamos discutir<br />

a interação estratégica racional entre firmas ou pessoas.<br />

Não basta pensar qual a melhor <strong>de</strong>cisão para você, é necessário<br />

consi<strong>de</strong>rar o que os outros agentes po<strong>de</strong>m fazer e também que<br />

eles estão antecipando o que você po<strong>de</strong> fazer otimamente.<br />

É necessário “calçar os sapatos do outro jogador”, i. é, se colocar no<br />

lugar do outro, ver suas alternativas e ver o que ele sabe sobre você.<br />

Nossa ênfase será mais normativa, i. é, como o jogo <strong>de</strong>ve ser jogado.<br />

Mercado em Competição Perfeita<br />

Num mercado em competição perfeita to<strong>da</strong>s as firmas<br />

são (ou se comportam como) tomadoras <strong>de</strong> preço e<br />

produzem um mesmo bem homogêneo (commodity).<br />

As firmas não “exergam” uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> para<br />

maximizar o lucro ajustando quanti<strong>da</strong><strong>de</strong>s. Po<strong>de</strong>m produzir<br />

qualquer quanti<strong>da</strong><strong>de</strong> que o preço será o mesmo.<br />

Para a firma a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> (q x P) é uma reta horizontal e a<br />

elastici<strong>da</strong><strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong> (η) é infinito. O mercado tudo absorve.<br />

As firmas não po<strong>de</strong>m ajustar preços para maximizar o lucro, pois<br />

a firma na<strong>da</strong> ven<strong>de</strong>ria com um preço maior e um preço menor<br />

seria sub-ótimo, já que reduziria seu lucro (ou geraria prejuízo).<br />

Já a indústria “enxerga” uma curva <strong>da</strong><br />

<strong>de</strong>man<strong>da</strong> Q(P) ou gráfico Q x P.<br />

É + usa<strong>da</strong> a função <strong>de</strong>man<strong>da</strong> inversa P(Q).<br />

O preço <strong>de</strong> equilíbrio num certo instante t<br />

é <strong>da</strong>do pela interseção <strong>da</strong>s curvas <strong>de</strong><br />

<strong>de</strong>man<strong>da</strong> x suprimento <strong>da</strong> indústria:<br />

P<br />

P E<br />

Equilíbrio S<br />

E<br />

D<br />

Q E<br />

Q<br />

2


Mercado em Competição Perfeita<br />

Além disso, não é permitido as firmas entrar em colusão<br />

p/ maximizar o lucro ajustando o nível <strong>de</strong> produção Q.<br />

O conceito <strong>de</strong> indústria em competição perfeita in<strong>de</strong>pen<strong>de</strong><br />

do número <strong>de</strong> firmas, po<strong>de</strong> ocorrer até com só 1 firma.<br />

O resultado do duopólio <strong>de</strong> Bertrand equivale a comp. perfeita.<br />

Mas dinamicamente uma indústria converge <strong>da</strong> competição<br />

imperfeita para a perfeita, na maioria <strong>dos</strong> casos, apenas quando<br />

o número <strong>de</strong> firmas cresce p/ uma gran<strong>de</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> firmas.<br />

O resultado clássico (Marshall) mais importante p/ nós é:<br />

Em competição perfeita, com livre entra<strong>da</strong> <strong>de</strong> firmas, o preço<br />

em equilíbrio é tal que o VPL <strong>da</strong> firma entrante é zero.<br />

O mercado em equilíbrio com preço P, é condicional ao<br />

estado <strong>da</strong> <strong>de</strong>man<strong>da</strong> e <strong>da</strong> oferta <strong>da</strong> indústria no tempo t.<br />

Depois, essa teoria microeconômica clássica será estendi<strong>da</strong> p/<br />

um mo<strong>de</strong>lo dinâmico <strong>de</strong> competição perfeita. As curvas <strong>de</strong><br />

oferta e <strong>de</strong>man<strong>da</strong> oscilam e logo o preço será estocástico.<br />

Estruturas <strong>de</strong> Competição num Mercado<br />

VPL entrar = 0 Tipo <strong>de</strong> Competição<br />

VPL entrar ≥ 0<br />

Perfeita<br />

‣ Firma tomadora <strong>de</strong> preço;<br />

‣ Decisão: quanti<strong>da</strong><strong>de</strong> a produzir.<br />

Oligopólio<br />

‣ I<strong>de</strong>m duopólio.<br />

Duopólio<br />

‣ Firma tem <strong>de</strong>man<strong>da</strong> residual;<br />

‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />

Imperfeita<br />

Monopólio<br />

‣ Firma vê curva <strong>de</strong> <strong>de</strong>man<strong>da</strong>;<br />

‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />

Não-Cooperativo<br />

Cooperativo<br />

Estático<br />

‣ Colusão: tácita ou coor<strong>de</strong>na<strong>da</strong>.<br />

Dinâmico<br />

Seqüencial<br />

‣ Mo<strong>de</strong>los <strong>de</strong> lí<strong>de</strong>r-seguidor;<br />

‣ Decisão: quanti<strong>da</strong><strong>de</strong> ou preço.<br />

A<strong>da</strong>ptado <strong>de</strong> “Industrial<br />

Organization”, O. Shy (1995)<br />

Simultâneo<br />

Bertrand<br />

‣Decisão: preço<br />

<strong>Jogos</strong> Repeti<strong>dos</strong><br />

Cournot<br />

‣Decisão: quanti<strong>da</strong><strong>de</strong><br />

3


T. Schelling e o Pensamento Estratégico<br />

O raciocínio estratégico <strong>da</strong> T.J. é bem ilustrado a seguir:<br />

Prêmio Nobel <strong>de</strong> 2005, T. Schelling se diz só um usuário<br />

<strong>da</strong> teoria <strong>dos</strong> jogos, mas ele <strong>de</strong>u várias contribuições:<br />

A obra clássica <strong>de</strong> Thomas Schelling, “Estratégia do Conflito”<br />

(1960) <strong>de</strong>u muita intuição sobre conflitos tais como a guerra<br />

fria, assim como em outras situações <strong>de</strong> conflito e cooperação.<br />

O conceito <strong>de</strong> “commitment” crível: atitu<strong>de</strong>s aparentemente<br />

irracionais <strong>de</strong> eliminar opções para <strong>de</strong>ixar claro o compromisso<br />

<strong>de</strong> que ele irá seguir um caminho, criando uma ameaça crível.<br />

Ex.: caso do conquistador espanhol Cortés, que queimava os<br />

próprios navios para <strong>de</strong>ixar claro ao seu pessoal e ao inimigo que<br />

a opção <strong>de</strong> recuar seria impossível. Outro ex.: queimar pontes.<br />

Coor<strong>de</strong>nação tácita com o conceito <strong>de</strong> ponto focal.<br />

Ex.: um casal marca encontro em New York ao meio-dia, mas<br />

não especifica o local. Pontos focais: Empire State e Penn Station.<br />

Deu contribuições à teoria <strong>de</strong> barganha (1956), especialmente a<br />

discussão <strong>de</strong> ameaças críveis e não-críveis (citei na minha tese).<br />

OR e <strong>Jogos</strong>: <strong>Teoria</strong>s Complementares<br />

Em jogos <strong>de</strong> opções reais, o problema <strong>de</strong> maximização <strong>de</strong><br />

valor <strong>da</strong> firma que analisa um investimento, <strong>de</strong>ve<br />

consi<strong>de</strong>rar a presença <strong>de</strong> outras firmas como jogadores:<br />

Os “players” reagem otimamente aos processos estocásticos<br />

relevantes (exógeno) e às ações <strong>da</strong>s outras firmas (endógeno).<br />

On<strong>de</strong> “endógeno” significa que <strong>de</strong>pen<strong>de</strong> do nosso controle ótimo<br />

e “exógeno” não <strong>de</strong>pen<strong>de</strong> (entra como restrição na otimização).<br />

A teoria <strong>dos</strong> jogos é necessária e entra nas condições <strong>de</strong> contorno<br />

(principalmente), com consi<strong>de</strong>rações sobre o equilíbrio do jogo.<br />

As teorias <strong>dos</strong> jogos e <strong>de</strong> OR são teorias complementares:<br />

A teoria <strong>dos</strong> jogos tradicional sozinha ignora os avanços <strong>da</strong><br />

teoria <strong>de</strong> finanças sobre risco-retorno e sobre o valor <strong>da</strong><br />

flexibili<strong>da</strong><strong>de</strong> gerencial sob incerteza (ignora as opções reais).<br />

A teoria <strong>da</strong>s opções reais (OR) tradicional sozinha ignora o<br />

fato que o exercício <strong>de</strong> opções pelas outras firmas po<strong>de</strong> alterar<br />

o valor <strong>da</strong> sua opção real (ignora a interação estratégica).<br />

Conceitos <strong>de</strong> equilíbrio sob incerteza com opções são requeri<strong>dos</strong>.<br />

4


Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

Um jogo po<strong>de</strong> ser cooperativo ou não-cooperativo:<br />

Num jogo cooperativo é permitido aos jogadores fazerem<br />

acor<strong>dos</strong> entre si (um contrato, “acordo <strong>de</strong> cavalheiros”, etc.)<br />

Nos jogos não-cooperativos não são permiti<strong>dos</strong> acor<strong>dos</strong>.<br />

<strong>Jogos</strong> não-cooperativos são mais a<strong>de</strong>qua<strong>dos</strong> para mo<strong>de</strong>lar a<br />

competição e a evolução do mercado (microeconomia).<br />

<strong>Jogos</strong> cooperativos são mais a<strong>de</strong>qua<strong>dos</strong> p/ mo<strong>de</strong>lar barganha,<br />

contratos, a firma, acor<strong>dos</strong> sociais, acor<strong>dos</strong> internacionais...<br />

<strong>Jogos</strong> cooperativos são usa<strong>dos</strong> para mo<strong>de</strong>lar a firma, por ex.<br />

<strong>Jogos</strong> não-cooperativos usam conceitos <strong>de</strong> equilíbrio para<br />

prever o resultado <strong>de</strong> um jogo (em geral não são Pareto ótimo).<br />

<strong>Jogos</strong> cooperativos geralmente usam axiomas para estabelecer<br />

regras <strong>de</strong> como se <strong>de</strong>ve jogar. Busca-se o Pareto ótimo.<br />

Enfocaremos quase que só os jogos não-cooperativos por<br />

serem muito mais usa<strong>dos</strong> em economia e finanças (em<br />

especial a competição) do que os jogos cooperativos.<br />

Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

Os jogos po<strong>de</strong>m ser classifica<strong>dos</strong> como jogos <strong>de</strong> somafixa<br />

e jogos <strong>de</strong> soma variável (esses são mais relevantes).<br />

Regras do jogo (não-cooperativo, se não especificado):<br />

Os lances <strong>dos</strong> jogadores são simultâneos ou alterna<strong>dos</strong>?<br />

Quem joga e quando?<br />

O que ca<strong>da</strong> jogador sabe (conjunto <strong>de</strong> informação) na sua vez<br />

<strong>de</strong> jogar? O que os outros jogadores sabem nesse instante?<br />

Quais as ações e planos (estratégias) possíveis?<br />

Resulta<strong>dos</strong> e payoffs: para ca<strong>da</strong> conjunto <strong>de</strong> estratégias,<br />

qual é o resultado do jogo? Quanto vale esse resultado?<br />

Na teoria <strong>dos</strong> jogos tradicional, que em muitos casos analisa as<br />

<strong>de</strong>cisões <strong>de</strong> indivíduos, usa-se a função utili<strong>da</strong><strong>de</strong> espera<strong>da</strong>.<br />

Para firmas, a mo<strong>de</strong>rna teoria <strong>de</strong> finanças recomen<strong>da</strong> usar<br />

valores <strong>de</strong> mercado ou valores <strong>de</strong> opções reais (ativos reais).<br />

Nos jogos <strong>de</strong> opções reais os payoffs são valores <strong>de</strong> opções reais.<br />

5


<strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong>: Origens e Conceitos<br />

A mo<strong>de</strong>rna teoria <strong>dos</strong> jogos começa com Nash em 1950’s<br />

O chamado equilíbrio <strong>de</strong> Nash é o conceito mais importante e<br />

mais aceito <strong>da</strong> teoria <strong>dos</strong> jogos não-cooperativos.<br />

É a base <strong>de</strong> outros equilíbrios (perfeito, Bayesiano, etc.)<br />

Nash também formulou a mais importante solução em jogos<br />

cooperativos: a solução <strong>de</strong> Nash para jogos <strong>de</strong> barganha.<br />

Conceitos antigos como o minimax e maximin (ver anexo), vem<br />

per<strong>de</strong>ndo o interesse na literatura econômica.<br />

Algumas <strong>de</strong>finições básicas <strong>de</strong> teoria <strong>dos</strong> jogos.<br />

Defini-se estratégia s i do jogador i como uma regra <strong>de</strong> <strong>de</strong>cisão<br />

ou plano contingente completo que <strong>de</strong>screve as ações a serem<br />

toma<strong>da</strong>s em ca<strong>da</strong> possível evolução do jogo on<strong>de</strong> o jogador i é<br />

chamado a jogar. Se a estratégia for <strong>de</strong>terminística, é chama<strong>da</strong><br />

<strong>de</strong> estratégia pura, se probabilística é chama<strong>da</strong> estratégia mista.<br />

As estratégias <strong>dos</strong> outros jogadores são <strong>de</strong>nota<strong>da</strong>s por s − i .<br />

Um jogo é <strong>de</strong>scrito especificando os jogadores, as regras, os<br />

possíveis resulta<strong>dos</strong> e os valores (“payoffs”) <strong>de</strong>sses resulta<strong>dos</strong>.<br />

Representação Formal <strong>dos</strong> <strong>Jogos</strong><br />

Os jogos não-cooperativos po<strong>de</strong>m ser formaliza<strong>dos</strong> e<br />

apresenta<strong>dos</strong> em dois formatos (a serem <strong>de</strong>talha<strong>dos</strong>):<br />

Na forma normal (ou estratégica), <strong>de</strong>nota<strong>da</strong> por Γ N , com uma<br />

representação por matrizes para os payoffs <strong>dos</strong> jogadores;<br />

Na forma extensiva, <strong>de</strong>nota<strong>da</strong> por Γ E , com uma árvore <strong>de</strong> jogos.<br />

Árvore <strong>de</strong> jogos éuma árvore <strong>de</strong> <strong>de</strong>cisão generaliza<strong>da</strong> para<br />

múltiplos <strong>de</strong>cisores (os jogadores).<br />

Os jogos cooperativos precisam <strong>de</strong> um terceiro formato:<br />

É preciso consi<strong>de</strong>rar a possibili<strong>da</strong><strong>de</strong> <strong>de</strong> coalizões, isto é, subconjuntos<br />

<strong>dos</strong> N jogadores. Existem 2 N − 1 coalizões possíveis.<br />

As coalizões S ⊆ N jogam entre si diferentes tipos <strong>de</strong> jogos e<br />

internamente possuem uma regra <strong>de</strong> divisão do payoff ganho.<br />

A forma coalizão, <strong>de</strong>nota<strong>da</strong> por Γ C , através <strong>da</strong> <strong>de</strong>finição do par<br />

{N; C} no jogo <strong>de</strong> N jogadores e com função característica C(S).<br />

A função característica C(S) representa as possibili<strong>da</strong><strong>de</strong>s <strong>de</strong><br />

cooperação para a coalizão S. É a utili<strong>da</strong><strong>de</strong> total <strong>da</strong> coalização S<br />

(ou riqueza ou po<strong>de</strong>r <strong>de</strong> S) a ser transferi<strong>da</strong> aos seus membros.<br />

6


ExemplonaForma Normal ouEstratégica<br />

Exemplo: jogo do par ou ímpar com disputa <strong>de</strong> 1 R$<br />

Estratégias puras<br />

para o jog. 1<br />

Jogador 2<br />

(ímpar)<br />

par ímpar<br />

Estratégias puras<br />

para o jog. 2<br />

par<br />

Jogador 1<br />

(par)<br />

ímpar<br />

1; 0 0; 1<br />

0; 1 1; 0<br />

Payoff do jog. 1 Payoff do jog. 2<br />

Veremos que o único equilíbrio do jogo do par ou ímpar é o<br />

equilíbrio probabilístico ou em estratégias mistas: ca<strong>da</strong> jogador<br />

joga “par” com 50% <strong>de</strong> chance e “ímpar”com 50% chances.<br />

Dado um conjunto <strong>de</strong> estratégias puras S i<br />

, uma estratégia mista para<br />

um jogador i é uma função σ i<br />

: S i<br />

→ [0, 1], que assinala a ca<strong>da</strong> estratégia<br />

pura s i<br />

∈ S i<br />

, uma probabili<strong>da</strong><strong>de</strong> σ i<br />

(s i<br />

) ≥ 0. A soma <strong>dos</strong> σ p/ to<strong>dos</strong> s i é= 1.<br />

Jogo do Par ou Ímpar na Forma Extensiva<br />

A forma extensiva é mais usa<strong>da</strong> para jogos dinâmicos e com<br />

lances seqüenciais. Mas po<strong>de</strong> ser usa<strong>da</strong> também p/ jogos<br />

com lances simultâneos, como no jogo do par ou ímpar:<br />

par<br />

Jogador 1<br />

ímpar<br />

Jogador 2<br />

par ímpar par ímpar<br />

Elipse significa que o<br />

jog. 2 não sabe em qual<br />

<strong>dos</strong> dois nós ele está.<br />

(usa-se tb. reta traceja<strong>da</strong>)<br />

Convenção payoff:<br />

jog. 1 pediu par<br />

jog. 2 pediu ímpar<br />

(1; 0) (0; 1) (0; 1) (1; 0)<br />

Nos jogos simultâneos ou <strong>de</strong> informação imperfeita, usa-se uma<br />

elipse circun<strong>da</strong>ndo os nós do mesmo conjunto <strong>de</strong> informação.<br />

Se o jogo fosse <strong>de</strong> lances alterna<strong>dos</strong>, o jogador 2 saberia em<br />

que nó ele estaria e po<strong>de</strong>ria ganhar $1 com a melhor resposta.<br />

7


<strong>Jogos</strong> Dinâmicos <strong>de</strong> Opção<br />

<strong>Jogos</strong> dinâmicos envolvem seqüências <strong>de</strong> ações.<br />

Constitui a maioria <strong>dos</strong> jogos <strong>de</strong> opções reais.<br />

Ex.: jogo <strong>de</strong> opção real com duas firmas. Elas <strong>de</strong>ci<strong>de</strong>m<br />

<strong>de</strong> forma seqüencial se exercem (E) ou não exercem (NE)<br />

uma opção <strong>de</strong> entrar. Os payoffs são valores <strong>de</strong> opções.<br />

D i = valor em duopólio <strong>da</strong> firma i e M i = valor em monopólio <strong>de</strong> i.<br />

E<br />

E<br />

(D 1 ; D 2 ) (M 1 ; 0)<br />

Firma 1<br />

Firma 2<br />

NE E<br />

NE<br />

(0; M 2 )<br />

NE<br />

Note que na forma normal<br />

não se po<strong>de</strong>ria capturar a<br />

dinâmica do jogo. Por isso é<br />

necessária a forma extensiva.<br />

Aqui o jogo é <strong>de</strong> informação<br />

perfeita, pois a firma 2 <strong>de</strong>ci<strong>de</strong><br />

sabendo o lance jogado pela<br />

firma 1.<br />

(0; 0)<br />

Conceitos Básicos <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

Um jogo é dito <strong>de</strong> informação perfeita se ca<strong>da</strong> conjunto<br />

<strong>de</strong> informação só contém um nó <strong>de</strong> <strong>de</strong>cisão <strong>da</strong> árvore.<br />

Caso contrário é dito <strong>de</strong> informação imperfeita. Ex.: pôquer.<br />

Já o jogo <strong>de</strong> xadrêz é exemplo <strong>de</strong> jogo <strong>de</strong> informação perfeita.<br />

Algumas premissas usuais em teoria <strong>dos</strong> jogos:<br />

O jogo é assumido ser <strong>de</strong> memória perfeita (“perfect recall”), i.<br />

é, uma jogadora nunca esquece a informação que sabia antes<br />

<strong>de</strong> chegar até aquele estágio do jogo.<br />

Também se assume conhecimento comum (“common<br />

knowledge”), i. é, ca<strong>da</strong> jogador conhece a estrutura do jogo<br />

(inclusive os valores) e sabem que os outros também conhecem,<br />

que sabem que os outros sabem que eles conhecem, etc.<br />

Um perfil <strong>de</strong> estratégias puras <strong>de</strong> um jogo com J jogadores<br />

é um vetor s = (s 1<br />

, s 2<br />

, … s J<br />

) em que s i<br />

é escolhi<strong>da</strong> pelo<br />

jogador i. Po<strong>de</strong> ser escrito como (s i<br />

, s − i<br />

) para ressaltar o<br />

ponto <strong>de</strong> vista <strong>de</strong> i em relação aos outros J – 1 jogadores.<br />

8


Estratégia Dominante e o Dilema <strong>dos</strong> Prisioneiros<br />

Estratégia dominante é uma estratégia que é ótima para<br />

um jogador in<strong>de</strong>pen<strong>de</strong>ntemente <strong>da</strong>(s) estratégia(s)<br />

escolhi<strong>da</strong>(s) pelo(s) outro(s) jogador(es) (s − i ).<br />

Equilíbrio com estratégias dominantes é quando ca<strong>da</strong> jogador<br />

possui e joga a sua estratégia dominante. Ex. clássico a seguir.<br />

O dilema <strong>dos</strong> prisioneiros é um jogo clássico que ilustra a<br />

não-cooperação como equilíbrio com estratégia dominante.<br />

Dois ladrões são presos e coloca<strong>dos</strong> em salas separa<strong>da</strong>s. Para ca<strong>da</strong><br />

ladrão, o <strong>de</strong>tetive propõe que ele confesse o crime e sirva <strong>de</strong><br />

testemunha contra o outro. Se um <strong>dos</strong> ladrões confessar o crime e o<br />

outro não, aquele que confessou será posto em liber<strong>da</strong><strong>de</strong> e o outro<br />

cumprirá pena <strong>de</strong> 10 anos. Se os dois confessarem, ambos ficarão<br />

presos por 3 anos. Se nenhum <strong>dos</strong> dois confessarem, a penali<strong>da</strong><strong>de</strong><br />

será <strong>de</strong> apenas um ano. Qual o resultado mais provável do jogo?<br />

Note que se eles pu<strong>de</strong>ssem se comunicar e fazer acor<strong>dos</strong> críveis <strong>de</strong><br />

serem cumpri<strong>dos</strong>, a estratégia cooperativa (não-confessar) seria a<br />

melhor para ambos. Sem acordo, só há o incentivo <strong>de</strong> trair o outro.<br />

O Jogo Dilema <strong>dos</strong> Prisioneiros<br />

Os payoffs são “anos <strong>de</strong> ca<strong>de</strong>ia” com sinal negativo.<br />

Assim, valores mais próximos <strong>de</strong> zero são os preferíveis.<br />

confessa<br />

(não-coopera)<br />

Prisioneiro 2<br />

não confessa<br />

(coopera)<br />

Prisioneiro 1<br />

confessa<br />

(não-coopera)<br />

não confessa<br />

(coopera)<br />

−3; −3 0; −10<br />

−10; 0 −1; −1<br />

O equilíbrio é em estratégias dominantes (um caso<br />

particular <strong>de</strong> equilíbrio <strong>de</strong> Nash) e é muito comum em<br />

várias situações sociais (ex.: a tragédia <strong>dos</strong> comuns).<br />

9


Dilema <strong>dos</strong> Prisioneiros: O Jogo <strong>da</strong> Propagan<strong>da</strong><br />

Um exemplo <strong>de</strong> dilema <strong>dos</strong> prisioneiros na área <strong>de</strong><br />

<strong>de</strong>cisão <strong>de</strong> investimentos é o jogo <strong>da</strong> propagan<strong>da</strong>.<br />

Cenário: Duas firmas concorrentes, Firma 1 e Firma 2,<br />

têm <strong>de</strong> <strong>de</strong>cidir quanto gastar em propagan<strong>da</strong>.<br />

Estratégias: muita propagan<strong>da</strong>, pouca propagan<strong>da</strong>.<br />

Os resulta<strong>dos</strong> são mostra<strong>da</strong>s abaixo:<br />

Jogador 2<br />

muita pouca<br />

Jogador 1<br />

muita<br />

pouca<br />

4; 4<br />

10; 1<br />

1; 10 6; 6<br />

<br />

<br />

Equilíbrio em estratégias dominantes: Nesse jogo, ambas as firmas têm a<br />

mesma estratégia dominante. Dessa forma, o resultado do jogo é (4; 4).<br />

Dilema <strong>dos</strong> prisioneiros: o equilíbrio não é Pareto ótimo, não éo resultado<br />

que os jogadores escolheriam se eles pu<strong>de</strong>ssem cooperar <strong>de</strong> forma crível.<br />

Dilema <strong>dos</strong> Prisioneiros: História e Relevância<br />

O dilema <strong>dos</strong> prisioneiros é talvez o jogo mais conhecido<br />

porque é uma situação que se repete muito em<br />

economia, política e em outros ramos <strong>de</strong> conhecimento.<br />

Apesar <strong>de</strong> existir ganhos <strong>de</strong> cooperação, ca<strong>da</strong> jogador tem um<br />

incentivo <strong>de</strong> não-cooperar para qualquer estratégia do outro.<br />

Um ex. em política é a corri<strong>da</strong> nuclear: apesar <strong>de</strong> construir<br />

bombas ser caro, muitos países querem evitar a pior situação<br />

(menor payoff) que seria o outro país ter a bomba e ele não ter.<br />

Outro exemplo é a chama<strong>da</strong> “Tragédia <strong>dos</strong> Comuns”, um caso<br />

clássico <strong>de</strong> sociologia, em que apesar <strong>da</strong> cooperação gerar<br />

benefícios, frequentemente ela não ocorre. Ver sli<strong>de</strong>s do anexo.<br />

O esquema dilema <strong>dos</strong> prisioneiros surgiu em jan/1950<br />

quando os profs. M. Dresher e M. Flood usaram ele para<br />

criticar o então novo conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash (EN).<br />

Veremos que o resultado <strong>de</strong>sse jogo é um caso particular <strong>de</strong> EN<br />

A estória original é <strong>de</strong> A. Tucker (1950), orientador <strong>de</strong> Nash.<br />

10


O Jogo do Aquecimento Global<br />

Outra aplicação do dilema <strong>dos</strong> prisioneiros é o drama do<br />

aquecimento global. A cooperação (redução <strong>de</strong> emissões) é<br />

melhor para to<strong>dos</strong>, mas os países não reduzem as emissões.<br />

No discurso, to<strong>dos</strong> dizem que é “urgente” impedir o aquecimento<br />

global, mas poucos realmente se comprometem com isso.<br />

Na prática o que eles dizem é que é urgente que to<strong>dos</strong> os países,<br />

exceto o <strong>de</strong>les, reduzam as emissões.<br />

Ou seja, querem ter o benefício <strong>da</strong> redução <strong>de</strong> emissões, sem ter o<br />

custo <strong>de</strong> reduzir o crescimento econômico do seu país.<br />

Com a maioria <strong>dos</strong> países se comportando segundo os seus próprios<br />

interesses, o resultado <strong>de</strong>ve ser o <strong>de</strong>sastre ambiental, embora seja<br />

Pareto ótimo a cooperação. É o dilema <strong>dos</strong> prisioneiros.<br />

Ver no material o artigo traduzido do The Economist: “Quem<br />

per<strong>de</strong> e quem ganha no jogo do clima?”<br />

Esse problema gerado pelo dilema <strong>dos</strong> prisioneiros po<strong>de</strong><br />

ser solucionado com jogos repeti<strong>dos</strong> (a ser visto) e com a<br />

introdução <strong>de</strong> estratégias <strong>de</strong> punição e recompensa.<br />

Estratégia <strong>de</strong> Melhor Resposta<br />

Seja V i<br />

(σ i<br />

, σ − i<br />

) o valor <strong>da</strong> estratégia mista σ i<br />

para o<br />

jogador i quando os <strong>de</strong>mais jogam as estratégias mistas<br />

σ − i<br />

. A estratégia σ i<br />

éa melhor resposta <strong>de</strong> i para o perfil<br />

σ − i<br />

<strong>de</strong> J – 1 estratégias mistas <strong>dos</strong> outros jogadores se:<br />

V i<br />

(σ i<br />

, σ − i<br />

) ≥ V i<br />

(σ i<br />

’, σ − i<br />

) , para qualquer σ i<br />

’ ∈ ∆(S i<br />

)<br />

∆(S i<br />

) é o conjunto simplex do conjunto <strong>da</strong>s estratégias<br />

puras S i<br />

. O simplex é uma extensão do conjunto <strong>de</strong><br />

estratégias puras S i<br />

que assinala probabili<strong>da</strong><strong>de</strong>s a to<strong>da</strong>s<br />

as M estratégias puras disponíveis para o jogador i.<br />

A <strong>de</strong>finição <strong>de</strong> estratégia pura <strong>de</strong> melhor resposta é similar.<br />

A estratégia pura po<strong>de</strong> ser vista como uma estratégia mista<br />

<strong>de</strong>genera<strong>da</strong> (prob. = 1 p/ uma estratégia e zero para as <strong>de</strong>mais)<br />

O conceito <strong>de</strong> melhor resposta é importante, pois será<br />

visto que o equilíbrio <strong>de</strong> Nash po<strong>de</strong> ser visto como um<br />

ponto fixo <strong>de</strong> estratégias <strong>de</strong> melhor resposta simultânea.<br />

11


Equilíbrio <strong>de</strong> Nash (1950)<br />

O perfil <strong>de</strong> estratégias s = (s 1<br />

, s 2<br />

, … s J<br />

) é um equilíbrio <strong>de</strong><br />

Nash (EN) em estratégias puras <strong>de</strong> um jogo se, para todo<br />

jogador i = 1, 2, …, J, vale a <strong>de</strong>sigual<strong>da</strong><strong>de</strong>:<br />

V i<br />

(s i<br />

, s − i<br />

) ≥ V i<br />

(s i<br />

’, s − i<br />

) , para qualquer s i<br />

’ ∈ S i<br />

O EN implica que as estratégias que fazem parte <strong>de</strong>sse<br />

equilíbrio são simultaneamente as melhores respostas para<br />

to<strong>dos</strong> os jogadores. Esse é um resultado fun<strong>da</strong>mental.<br />

Dessa forma, não há incentivo para nenhum jogador <strong>de</strong>sviar<br />

<strong>de</strong>sse equilíbrio, unilateralmente. Ex.: dilema <strong>dos</strong> prisioneiros.<br />

Para saber se é equilíbrio <strong>de</strong> Nash, basta fazer a seguinte<br />

pergunta a ca<strong>da</strong> jogador separa<strong>da</strong>mente: mu<strong>da</strong>ndo a sua<br />

estratégia você ficaria melhor (aumentaria V i<br />

)? Se as respostas<br />

<strong>de</strong> to<strong>dos</strong> os jogadores forem negativas, então é um EN.<br />

A <strong>de</strong>finição <strong>de</strong> EN para estratégias mistas é similar à apresenta<strong>da</strong>.<br />

Para se testar se o perfil σ é EN, basta testar <strong>de</strong>svios <strong>de</strong> σ para as<br />

estratégias puras s. Se não houver incentivo para <strong>de</strong>sviar, σ éEN.<br />

Eq. <strong>de</strong> Nash: Competição Internacional<br />

Embraer x Bombadier no mercado <strong>de</strong> jatos executivos<br />

Suponha que sem subsídios para a Bombadier, a matriz<br />

<strong>de</strong> payoffs para a fabricação <strong>de</strong> um novo mo<strong>de</strong>lo <strong>de</strong> jato é:<br />

Desenvolve<br />

Bombadier<br />

Não Desenvolve<br />

Embraer<br />

Desenvolve<br />

−10; −10 100; 0<br />

Não Desenvolve<br />

0 ; 100 0; 0<br />

Ou seja, dois EN em estratégias puras (e um EN em<br />

estratégias mistas). Na prática, existem os riscos <strong>de</strong> ambos<br />

<strong>de</strong>senvolverem o jato e terem prejuízo, ou não investirem.<br />

12


Mercado <strong>de</strong> Jatos Executivos com Subsídios<br />

Agora suponha que o governo do Canadá dá $ 20 <strong>de</strong><br />

subsídio para a Bombadier para <strong>de</strong>senvolver jatos<br />

executivos (ex.: taxas <strong>de</strong> juros abaixo do mercado).<br />

A nova matriz <strong>de</strong> payoffs mostra a mu<strong>da</strong>nça do EN:<br />

Desenvolve<br />

Bombadier<br />

Não Desenvolve<br />

Embraer<br />

Desenvolve<br />

−10; +10 100; 0<br />

Não Desenvolve<br />

0; 120 0; 0<br />

Ou seja, o subsídio fez com que a estratégia investir (<strong>de</strong>senvolver<br />

o projeto <strong>de</strong> jato executivo) se tornasse estratégia dominante para<br />

a Bombadier. O único EN é a Bombadier sozinha no mercado.<br />

<strong>Jogos</strong> Repeti<strong>dos</strong>: Cooperação é Possível<br />

No dilema <strong>dos</strong> prisioneiros vimos que não é equilíbrio<br />

{cooperar; cooperar}, mesmo sendo Pareto dominante.<br />

No entanto, foi assumido que o jogo é jogado apenas uma vez.<br />

Existem casos em que o jogo po<strong>de</strong> ser repetido pelas<br />

firmas e o resultado {cooperar; cooperar} po<strong>de</strong> ser EN.<br />

Com a repetição, ca<strong>da</strong> firma po<strong>de</strong> criar reputação sobre o seu<br />

comportamento e apren<strong>de</strong>r sobre o comportamento <strong>dos</strong> rivais.<br />

Ocorre no caso <strong>de</strong> poucas firmas, com <strong>de</strong>man<strong>da</strong> e custos estáveis.<br />

Estu<strong>dos</strong> experimentais tais como “torneios <strong>de</strong> repeti<strong>dos</strong><br />

dilema <strong>de</strong> prisioneiros”, mostra que a estratégia “tit-fortat”<br />

(retribuição/retaliação) po<strong>de</strong> sustentar a cooperação<br />

Tit-for tat: estratégia é cooperar no instante inicial e continuar<br />

cooperando enquanto o outro coopera. Retaliar (não cooperar)<br />

se o outro não-coopera. Voltar a cooperar se o outro o fizer.<br />

Teoremas populares (“folk theorems”) para jogos repeti<strong>dos</strong><br />

infinitamente, mostram que a cooperação po<strong>de</strong> ser EN.<br />

13


Equilíbrio <strong>de</strong> Nash (EN): Notas<br />

O conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash (EN) po<strong>de</strong> ser<br />

intepretado e usado <strong>de</strong> várias maneiras:<br />

Normativo: aconselhar to<strong>dos</strong> os jogadores. O conselho tem <strong>de</strong><br />

ser equilíbrio no sentido <strong>de</strong> ter relativa estabili<strong>da</strong><strong>de</strong>, não sendo<br />

ótimo para um jogador ganhar mais ao não seguir o conselho.<br />

EN é melhor resposta simultânea e não há incentivo em <strong>de</strong>sviar.<br />

Predição: Num processo dinâmico <strong>de</strong> ajustes, o EN po<strong>de</strong> ser<br />

interpretado como um ponto estável. Muito usado em biologia.<br />

Sustentabili<strong>da</strong><strong>de</strong>: é um acordo “self-enforcing” (<strong>de</strong> autocumprimento),<br />

pois não precisa <strong>de</strong> aju<strong>da</strong> externa para manter<br />

ao ser do próprio interesse <strong>de</strong> ca<strong>da</strong> jogador seguir o EN.<br />

O conceito <strong>de</strong> EN ajudou a <strong>de</strong>ixar claro a distinção entre<br />

jogos não-cooperativos e jogos cooperativos:<br />

Em jogos cooperativos há acor<strong>dos</strong> que po<strong>de</strong>m ser força<strong>dos</strong> (em<br />

tribunais, contratos, etc.) Em jogos não-cooperativos nãohátais<br />

mecanismos ⇒ só resulta<strong>dos</strong> <strong>de</strong> equilíbrios são sustentáveis.<br />

Eq. <strong>de</strong> Nash: Exercício & Experimento<br />

Esse exercício é interessante como um experimento que<br />

po<strong>de</strong> ser feito em sala <strong>de</strong> aula, mas que você po<strong>de</strong> fazer<br />

numa ro<strong>da</strong> <strong>de</strong> amigos(as) e/ou familiares.<br />

Ilustra a necessi<strong>da</strong><strong>de</strong> do pensamento estratégico para toma<strong>da</strong> <strong>de</strong><br />

<strong>de</strong>cisão. Ou seja, tem <strong>de</strong> pensar no que os outros farão, etc.<br />

Peça para ca<strong>da</strong> participante escrever o seu nome e um<br />

número entre zero e 100 numa folha <strong>de</strong> papel.<br />

Informe antes que o ganhador do jogo será aquele que<br />

escrever o número mais próximo <strong>da</strong> meta<strong>de</strong> <strong>da</strong> média<br />

<strong>dos</strong> números escritos.<br />

Após a primeira ro<strong>da</strong><strong>da</strong>, conhecido o vencedor e o valor<br />

médio, peça a to<strong>dos</strong> que joguem novamente o jogo.<br />

O que ocorreu com a média e o lance vencedor, <strong>da</strong>do a “lição”<br />

obti<strong>da</strong> com o resultado <strong>da</strong> primeira vez que foi jogado?<br />

Determine o equilíbrio <strong>de</strong> Nash (EN) <strong>de</strong>sse jogo.<br />

14


Jogo “Assurance” ou “Stag-Hunt”<br />

O jogo Stag-Hunt e suas variantes, também conheci<strong>da</strong>s<br />

como “assurance game” (jogo <strong>da</strong> garantia) ou jogo <strong>de</strong><br />

coor<strong>de</strong>nação ou dilema <strong>da</strong> confiança, tem sido usado<br />

para mo<strong>de</strong>lar conflitos sociais (ex.: livro <strong>de</strong> Brian, 2004,<br />

“Stag Hunt and Evolution of Social Structure”).<br />

Mostra o dilema entre a segurança x cooperação social.<br />

Estória (Rousseau): dois caçadores po<strong>de</strong>m caçar uma lebre<br />

(hare) ou um cervo adulto (stag). A lebre po<strong>de</strong> ser caça<strong>da</strong> por<br />

uma só pessoa, mas o cervo necessita <strong>dos</strong> dois (cooperação).<br />

Jogo tem dois EN em estratégias puras (e um em est. mistas),<br />

sendo um risco dominante e outro payoff dominante. Ex.:<br />

Caçador 2<br />

Cervo Lebre<br />

Cervo 4 ; 4 0 ; 3<br />

Caçador 1<br />

Lebre 3 ; 0 3 ; 3<br />

Software Para <strong>Jogos</strong> na Forma Normal<br />

Um <strong>dos</strong> programas disponíveis na internet para resolver<br />

jogos na forma normal é um applet Java que fica em:<br />

http://www.gametheory.net/Mike/applets/NormalForm/NormalForm.html<br />

Existe também uma versão em português (link na pág. acima).<br />

O applet acha os equilíbrios para jogos <strong>de</strong> 2 jogadoras com até<br />

4 estratégias puras (matrizes até 4 x 4) e estratégias mistas só<br />

para o caso <strong>de</strong> matriz 2 x 2. Ver abaixo o ex. batalha <strong>dos</strong> sexos.<br />

Ele permite carregar alguns exemplos clássicos já prontos:<br />

15


Software Mais Geral <strong>de</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

O software Gambit é um software mais geral que<br />

resolve jogos na forma normal e na forma extensiva.<br />

Mesmo na forma normal, permite mais <strong>de</strong> dois jogadores<br />

e é menos limitado que o anterior. Escrito em C++, tem<br />

interface amigável para Windows. Última versão jan/2007.<br />

Webpage do Gambit: http://gambit.sourceforge.net/<br />

Inclui links para download e documentação (com arquivos<br />

<strong>de</strong> exemplos). Exs. <strong>de</strong> janelas (formas normal e extensiva):<br />

Preços e Curva <strong>de</strong> Deman<strong>da</strong> Inversa<br />

A curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> <strong>de</strong> um produto relaciona preços com a <strong>de</strong>man<strong>da</strong>.<br />

Preço mais baixo tem maior <strong>de</strong>man<strong>da</strong> e preço alto tem menor <strong>de</strong>man<strong>da</strong>.<br />

No duopólio, as firmas têm como <strong>da</strong>do uma função <strong>de</strong>man<strong>da</strong><br />

inversa p = f(Q T ): o preço do produto é função <strong>da</strong> produção <strong>da</strong><br />

indústria Q T = q 1 + q 2 . As estratégias <strong>da</strong>s firmas são q 1 e q 2 .<br />

Ver os gráficos <strong>da</strong>s curvas <strong>de</strong> <strong>de</strong>man<strong>da</strong> exponencial e linear (planilha).<br />

Nas figuras aparecem duas curvas <strong>de</strong> <strong>de</strong>man<strong>da</strong>, uma <strong>de</strong>las eleva<strong>da</strong><br />

refletindo uma economia aqueci<strong>da</strong> (vermelha) e a outra mais baixa,<br />

refletindo um <strong>de</strong>saquecimento do consumo (curva azul).<br />

16


Competição por Quanti<strong>da</strong><strong>de</strong>s em Duopólio<br />

Duas firmas divi<strong>de</strong>m um mercado geográfico <strong>de</strong> um produto.<br />

Equilíbrio <strong>de</strong> Cournot (1838): simultaneamente e <strong>de</strong> forma<br />

in<strong>de</strong>pen<strong>de</strong>nte os jogadores escolhem as quanti<strong>da</strong><strong>de</strong>s, e o<br />

preço é tal que o total ofertado é igual a <strong>de</strong>man<strong>da</strong>.<br />

Veremos que o resultado <strong>de</strong> Cournot é um EN único para esse jogo<br />

em que as estratégias são quanti<strong>da</strong><strong>de</strong>s escolhi<strong>da</strong>s simultaneamente.<br />

Curva <strong>de</strong> reação <strong>de</strong> Cournot: especifica a produção ótima <strong>de</strong> uma<br />

firma em função <strong>da</strong>s possíveis produções <strong>da</strong> outra firma.<br />

Equilíbrio <strong>de</strong> Stackelberg: sequencialmente, em dois estágios,<br />

uma firma (lí<strong>de</strong>r) estabelece sua produção e <strong>de</strong>pois a outra firma<br />

(seguidor), observando o lí<strong>de</strong>r, estabelece a sua própria produção.<br />

A produção e o lucro no mo<strong>de</strong>lo <strong>de</strong> Stackelberg são maiores para o<br />

lí<strong>de</strong>r e menores para o seguidor (vantagem <strong>de</strong> jogar primeiro). O<br />

lí<strong>de</strong>r maximiza o lucro <strong>da</strong>do a curva <strong>de</strong> reação do seguidor.<br />

Iremos ver <strong>de</strong>pois que esse resultado é um EN perfeito em subjogos<br />

para o jogo seqüencial em que as estratégias são quanti<strong>da</strong><strong>de</strong>s. Mas<br />

ele tem problemas <strong>de</strong> inconsistência temporal: não é EN se o jogo<br />

continuar após a entra<strong>da</strong> do seguidor (há incentivo p/ <strong>de</strong>sviar).<br />

Monopólio com Deman<strong>da</strong> Linear<br />

Da<strong>da</strong> a relação 1-1 entre preço e quanti<strong>da</strong><strong>de</strong> estabeleci<strong>da</strong><br />

na curva <strong>de</strong> <strong>de</strong>man<strong>da</strong>, um monopolista po<strong>de</strong> escolher ou<br />

preço ou quanti<strong>da</strong><strong>de</strong> a produzir, mas não ambas.<br />

O monopolista irá maximizar o lucro seja usando o preço<br />

ou usando a quanti<strong>da</strong><strong>de</strong> como variável <strong>de</strong> controle.<br />

Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear (a mais usa<strong>da</strong>) <strong>da</strong><strong>da</strong><br />

por p = a – b Q. Assuma que o custo fixo do monopolista<br />

é zero e o custo variável é c. O lucro do monopolista é:<br />

π M = p Q – c Q ⇒ π M = (a – b Q) Q – c Q = (a –c) Q –b Q 2 .<br />

Para maximizar o lucro usa-se a condição <strong>de</strong> 1ª or<strong>de</strong>m<br />

(CPO): ∂π M /∂Q = 0 (checar a <strong>de</strong> 2ª or<strong>de</strong>m: ∂ 2 π M /∂Q 2 < 0).<br />

Os valores obti<strong>dos</strong> (quanti<strong>da</strong><strong>de</strong>, preço e lucro, respectiv.) são:<br />

q<br />

M<br />

a−<br />

c<br />

2b<br />

= pM<br />

a+<br />

c<br />

=<br />

2<br />

π<br />

M<br />

(a − c)<br />

=<br />

4b<br />

2<br />

17


Duopólio em Quanti<strong>da</strong><strong>de</strong>s <strong>de</strong> Cournot<br />

No problema <strong>da</strong> escolha ótima <strong>de</strong> quanti<strong>da</strong><strong>de</strong> q i , a(s)<br />

firma(s) resolvem problemas <strong>de</strong> maximização <strong>de</strong> lucro π i .<br />

Para maximizar o lucro usa-se a condição <strong>de</strong> 1ª or<strong>de</strong>m<br />

(CPO): ∂π i /∂q i = 0 (checar a <strong>de</strong> 2ª or<strong>de</strong>m: ∂ 2 π i /∂q i2 < 0).<br />

No caso do duopólio, o equilíbrio <strong>de</strong> Nash-Cournot é<br />

obtido com ambas as firmas escolhendo as quanti<strong>da</strong><strong>de</strong>s<br />

que maximizam o lucro, consi<strong>de</strong>rando no problema <strong>de</strong><br />

otimização que a firma rival estará fazendo o mesmo.<br />

Pois o EN é a melhor resposta simultânea (não há incentivo<br />

para nenhum jogador <strong>de</strong>sviar se estiver sendo jogado o EN) e é<br />

assumido conhecimento comum (a firma sabe que a outra ...).<br />

Melhor resposta simultânea: curvas <strong>de</strong> melhor resposta se cruzam.<br />

Se o custo operacional (fixo + variável) <strong>de</strong> ca<strong>da</strong> firma é<br />

C i (q i ) e a função <strong>de</strong>man<strong>da</strong> é p(Q T ), as funções lucros são:<br />

π 1 = q 1 p(Q T ) − C 1 (q 1 ) e π 2 = q 2 p(Q T ) − C 2 (q 2 )<br />

Duopólio em Equilíbrio <strong>de</strong> Nash-Cournot<br />

Seja uma curva inversa <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear (por ser mais<br />

simples, é a mais usa<strong>da</strong>), on<strong>de</strong> os preços são <strong>da</strong><strong>dos</strong> por:<br />

p(Q T<br />

) = a − b Q T<br />

⇒ p(Q T<br />

) = a − b (q 1<br />

+ q 2<br />

) ,<br />

com q 1 ≥ 0 ; q 2 ≥ 0 ; e a e b tal que p > 0<br />

Se o custo fixo é zero, a função lucro <strong>da</strong> firma i (1 ou 2) é:<br />

π i = q i a − q i b (q 1 + q 2 ) − c i q i = q i (a − c i ) − q i b (q 1 + q 2 )<br />

On<strong>de</strong> c i é chamado <strong>de</strong> custo operacional variável <strong>da</strong> firma i.<br />

A curva <strong>de</strong> reação ou curva <strong>de</strong> melhor resposta <strong>da</strong> firma i<br />

(i = 1; 2) em relação a produção <strong>da</strong> firma j (j ≠ i), q i *(q j ),<br />

é obti<strong>da</strong> com a condição <strong>de</strong> 1ª or<strong>de</strong>m (CPO).<br />

A interseção <strong>da</strong>s duas curvas <strong>de</strong> reação, q 1<br />

*(q 2<br />

) e q 2<br />

*(q 1<br />

),<br />

é o ponto <strong>de</strong> melhor resposta simultânea ⇒ éEN!<br />

Para tal, basta substituir a curva <strong>de</strong> melhor resposta <strong>de</strong><br />

uma na <strong>da</strong> outra, isto é, obter q 1<br />

*(q 2<br />

*) e q 2<br />

*(q 1<br />

*). O par<br />

{q 1<br />

*(q 2<br />

*); q 2<br />

*(q 1<br />

*)} é EN (próx. sli<strong>de</strong>):<br />

18


Competição <strong>de</strong> Cournot em Duopólios<br />

Nesse caso com custo fixo igual a zero e <strong>de</strong>man<strong>da</strong> linear,<br />

as curvas <strong>de</strong> reação q i *(q j ), os lucros π i , o preço e as<br />

quanti<strong>da</strong><strong>de</strong>s em EN-Cournot {q 1 *(q 2 *); q 2 *(q 1 *)} são:<br />

Funções melhor<br />

resposta (reação):<br />

Funções Lucro<br />

em EN-Cournot:<br />

Preço em EN-Cournot:<br />

Quanti<strong>da</strong><strong>de</strong>s em EN<br />

(estratégias em EN):<br />

q(q)<br />

1 2<br />

a−c − b q<br />

2b<br />

a−c − b q<br />

2b<br />

1 2<br />

2 1<br />

= q(q)<br />

2 1<br />

=<br />

p<br />

EN-C<br />

= a − b Q<br />

q(q)<br />

=<br />

EN-C<br />

T<br />

a− 2 c + c<br />

3b<br />

* * 1 2<br />

1 2<br />

=<br />

a+ c + c<br />

3<br />

q(q)<br />

1 2<br />

=<br />

a− 2 c + c<br />

3b<br />

* * 2 1<br />

2 1<br />

Assim, quanto menor o seu próprio custo e maior o custo do oponente,<br />

maior o seu lucro e a sua produção no EN-Cournot (como esperado).<br />

Como a > c i , o preço em EN é maior que o custo médio <strong>da</strong>s firmas.<br />

Os gráficos a seguir ilustram o cruzamento <strong>da</strong>s curvas <strong>de</strong> reação (EN).<br />

Curvas <strong>de</strong> Reação em Cournot<br />

A curva <strong>de</strong> reação <strong>da</strong> firma (jogador) 1 dá a melhor<br />

resposta q 1 a ca<strong>da</strong> possível estratégia q 2 <strong>da</strong> firma 2.<br />

Solução <strong>de</strong> Monopólio (só firma 1 produz)<br />

a−<br />

c 1<br />

2b<br />

q 1<br />

Curva <strong>de</strong> Reação q 1 *(q 2 )<br />

q 2<br />

Produção q 2 equivale a<br />

Competição Perfeita<br />

(firma 1 não produz)<br />

a−<br />

c 1<br />

b<br />

A curva <strong>de</strong> reação <strong>da</strong> firma 2 é similar (troca os eixos <strong>dos</strong> X com<br />

os <strong>dos</strong> Y). Girando um <strong>dos</strong> gráficos (para que os eixos coinci<strong>da</strong>m)<br />

po<strong>de</strong>remos ver o cruzamentos <strong>da</strong>s curvas (= EN), ver sli<strong>de</strong>s:<br />

19


Curvas <strong>de</strong> Reação em Cournot<br />

A curva <strong>de</strong> reação <strong>da</strong> firma (jogador) 2 dá a melhor<br />

resposta q 2 a ca<strong>da</strong> possível estratégia q 1 <strong>da</strong> firma 1.<br />

q 2<br />

Girando ⇒<br />

a−<br />

c 2<br />

Curva <strong>de</strong> Reação q 2 *(q 1 )<br />

2b<br />

a−<br />

c 2<br />

b<br />

q 1<br />

q 2<br />

Curva <strong>de</strong> Reação q 2 *(q 1 )<br />

q 1<br />

q 1<br />

a−<br />

c 2<br />

b<br />

Curva <strong>de</strong> Reação q 2 *(q 1 )<br />

a −<br />

c 2<br />

2<br />

2b<br />

2b<br />

q 2<br />

a−<br />

c 2<br />

b<br />

Curvas <strong>de</strong> Reação e EN em Cournot<br />

O cruzamento <strong>da</strong>s curvas <strong>de</strong> reação é o ponto em que<br />

temos melhor resposta simultânea ⇒ EN.<br />

q 1<br />

q 2<br />

a−<br />

c 2<br />

b<br />

a−<br />

c 1<br />

2b<br />

Curva <strong>de</strong> Reação q 2 *(q 1 )<br />

EN-Cournot<br />

Curva <strong>de</strong> Reação q 1 *(q 2 )<br />

a−<br />

c 2<br />

2b<br />

a−<br />

c 1<br />

b<br />

20


Exemplo Numérico: Competição por Quanti<strong>da</strong><strong>de</strong>s<br />

Consi<strong>de</strong>re uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa linear, <strong>da</strong><strong>da</strong> pela<br />

equação: p = 30 − Q T<br />

(ver planilha duopolio_sob_certeza.xls)<br />

Por simplici<strong>da</strong><strong>de</strong>, seja o custo variável igual a zero, ou, <strong>de</strong><br />

forma alternativa, consi<strong>de</strong>re p a margem <strong>de</strong> lucro operacional.<br />

A função lucro π i<br />

<strong>da</strong> firma i é a margem vezes as ven<strong>da</strong>s:<br />

π i = p q i = (30 − Q T ) q i<br />

Na competição perfeita, as firmas irão produzir até a margem p<br />

cair a zero (logo, produzirão q 1 = q 2 = 15 ⇒ Q T = 30 ⇒ p = 0);<br />

No monopólio, a única firma escolhe Q T p/ maximizar o lucro<br />

(<strong>de</strong>riva<strong>da</strong> do lucro π em relação à produção = 0 ⇒ Q T = 15); e<br />

Colusão é quando as firmas se juntam e agem como monopólio<br />

Vimos que no duopólio on<strong>de</strong> as estratégias simultâneas<br />

são quanti<strong>da</strong><strong>de</strong>s, o equilíbrio <strong>de</strong> Cournot é o EN do jogo.<br />

A curva <strong>de</strong> reação <strong>da</strong> firma i é obti<strong>da</strong> pela maximização ∂π i / ∂q i =<br />

0, que dá as curvas <strong>de</strong> melhor resposta q i = f(q j ) p/ ca<strong>da</strong> jogador.<br />

O cruzamento <strong>de</strong>ssas curvas é o EN <strong>de</strong> Cournot (ponto fixo).<br />

Duopólio: Vários Possíveis Resulta<strong>dos</strong><br />

Para enten<strong>de</strong>r os possíveis equilíbrios, serão plota<strong>da</strong>s as curvas<br />

<strong>de</strong> reação <strong>da</strong>s duas firmas, i. é, as funções melhor resposta <strong>dos</strong><br />

dois jogadores <strong>da</strong><strong>da</strong> as estratégias <strong>da</strong>s outras firmas.<br />

Curva <strong>de</strong> Reação <strong>da</strong> Firma 2<br />

(vale para Cournot e Stackelberg)<br />

Equilíbrio <strong>de</strong> Stackelberg<br />

Equilíbrio Competitivo<br />

(*) Margem <strong>de</strong>pois <strong>da</strong> entra<strong>da</strong> do seguidor.<br />

Antes <strong>da</strong> entra<strong>da</strong> do seguidor a margem do<br />

lí<strong>de</strong>r é p = 30 – 15 = 15 = margem <strong>da</strong> colusão.<br />

Lucro = π i<br />

= (30 − Q T ) q i<br />

Uma solução<br />

<strong>de</strong> Colusão<br />

Curva <strong>de</strong><br />

Contrato<br />

Equilíbrio <strong>de</strong> Cournot<br />

Curva <strong>de</strong> Reação em<br />

Cournot, Firma 1<br />

Margem = p = 30 − Q T<br />

21


Cournot em Oligopólios: N Firmas<br />

Seja o caso <strong>de</strong> oligopólio com N firmas (N > 1) com<br />

<strong>de</strong>cisão simultânea competindo em quanti<strong>da</strong><strong>de</strong>s<br />

(Cournot). Consi<strong>de</strong>re as N firmas homogêneas (mesmo<br />

custo unitário c) e <strong>de</strong>man<strong>da</strong> linear (custo fixo = 0).<br />

A produção <strong>de</strong> ca<strong>da</strong> firma e a produção total <strong>da</strong> indústria em<br />

EN-Cournot é (basta resolver para 1 firma homogênea):<br />

q<br />

i<br />

= q =<br />

a − c<br />

(N + 1) b<br />

⇒ Q = q = N q =<br />

T<br />

∑<br />

i<br />

N (a − c)<br />

(N + 1) b<br />

O preço <strong>de</strong> equilíbrio no mercado (“market clearing price”) é:<br />

2<br />

a + N c<br />

(a − c)<br />

2<br />

p =<br />

Já o lucro <strong>de</strong> ca<strong>da</strong> firma é: π<br />

i<br />

= = b q<br />

2<br />

i<br />

N + 1<br />

(N + 1) b<br />

Agora po<strong>de</strong>mos ver o que ocorre no mercado quando N →∞:<br />

a − c<br />

lim Q<br />

T<br />

=<br />

lim p = c<br />

N →∞<br />

N →∞<br />

b<br />

Que são os resulta<strong>dos</strong> do caso <strong>de</strong> competição perfeita sem custo<br />

<strong>de</strong> entra<strong>da</strong> para produção e preço (= custo marginal; lucro = 0).<br />

Comparação <strong>dos</strong> Mo<strong>de</strong>los<br />

A produção <strong>da</strong> indústria é maior em competição perfeita (cp)<br />

do que em Cournot (C) que é maior que a do monopólio (m):<br />

(a −c) N (a −c) (a −c)<br />

Q<br />

cp<br />

= > Q<br />

C<br />

= > Q<br />

m<br />

=<br />

b (N+<br />

1) b 2 b<br />

Além disso, em Cournot a produção <strong>da</strong> indústria Q aumenta<br />

com a competição (n o <strong>de</strong> firmas N) e no limite ten<strong>de</strong> a c.p.:<br />

∂Q C<br />

(a − c)<br />

= > 0<br />

(a − c)<br />

2<br />

lim Q<br />

C<br />

= = Qcp<br />

∂ N (N+ 1) b<br />

N→∞<br />

b<br />

Já o preço é o contrário: o maior é em monopólio, seguido <strong>de</strong><br />

Cournot, e o menor preço é competição perfeita (= custo c):<br />

a + c a + N c<br />

p<br />

m<br />

= > p<br />

C<br />

= > p<br />

cp<br />

= c<br />

2 N + 1<br />

A competição (N gran<strong>de</strong>) reduz o preço:<br />

∂p C<br />

− (a − c)<br />

=<br />

2<br />

∂ N (N + 1)<br />

< 0<br />

(pois a > c)<br />

Exercício: mostre que o lucro <strong>da</strong> indústria tem a mesma<br />

or<strong>de</strong>nação acima para o preço e que diminui com N.<br />

22


Oligopólio <strong>de</strong> Cournot em Fusões & Aquisições<br />

Para ilustrar o caso <strong>de</strong> N firmas em Cournot, imagine<br />

um mercado petroquímico com 4 firmas homogêneas.<br />

Uma on<strong>da</strong> <strong>de</strong> fusões e aquisições fez com que o mercado<br />

fosse reduzido <strong>de</strong> 4 para 2 firmas, também homogêneas.<br />

Assuma que existam barreiras <strong>de</strong> entra<strong>da</strong> <strong>de</strong> produtos <strong>de</strong><br />

firmas estrangeiras <strong>de</strong>vido a custos <strong>de</strong> transporte e tarifas<br />

alfan<strong>de</strong>gárias, <strong>de</strong> forma que só essas firmas competem.<br />

Isso é realista no Brasil apenas <strong>de</strong>ntro <strong>de</strong> certos limites <strong>de</strong> preços.<br />

Assuma que a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> do mix <strong>de</strong> produtos é<br />

linear e <strong>da</strong><strong>da</strong> por p = 180 – 8 Q T , on<strong>de</strong> p = preço do mix<br />

<strong>de</strong> produtos e o custo médio unitário é c = 70 $/uni<strong>da</strong><strong>de</strong>.<br />

Determine os preços, quanti<strong>da</strong><strong>de</strong>s e lucros em equil. <strong>de</strong> Nash-<br />

Cournot antes e <strong>de</strong>pois <strong>da</strong>s fusões. Quem ganha e quem per<strong>de</strong>?<br />

Agora consi<strong>de</strong>re que as fusões permitiram uma redução <strong>de</strong><br />

custo unitário para c´ = 60 $/uni<strong>da</strong><strong>de</strong>. Quais são os novos<br />

preços, quanti<strong>da</strong><strong>de</strong>s e lucros? Use a planilha oligopolio.xls.<br />

Oligopólio <strong>de</strong> Cournot em Fusões & Aquisições<br />

Os resulta<strong>dos</strong> do caso <strong>de</strong> fusões sem reduzir custos são:<br />

Assim, as firmas ganharam com as fusões, mas em<br />

<strong>de</strong>trimento <strong>da</strong> ren<strong>da</strong> <strong>dos</strong> consumidores (maiores preços).<br />

Os resulta<strong>dos</strong> do caso <strong>de</strong> fusões com redução <strong>de</strong> custos são:<br />

Ain<strong>da</strong> assim os preços subiram, embora menos que o caso anterior.<br />

Qual seria a redução <strong>de</strong> custo necessária para que os<br />

preços ao consumidor não aumentem? R: c´ = 48 $/unid.<br />

23


<strong>Jogos</strong> Dinâmicos<br />

Até aqui vimos só jogos estáticos, on<strong>de</strong> os jogadores se<br />

encontravam uma só vez, o tempo não era uma variável.<br />

Agora serão vistos jogos dinâmicos on<strong>de</strong> o tempo é<br />

relevante e/ou os jogadores se encontram várias vezes.<br />

Os jogos dinâmicos po<strong>de</strong>m ser jogos repeti<strong>dos</strong> ou não-repeti<strong>dos</strong>.<br />

Os jogos dinâmicos po<strong>de</strong>m ser <strong>de</strong>terminísticos ou estocásticos.<br />

Antes, os elementos ação e estratégia se confundiam, mas<br />

em jogos dinâmicos é necessário lembrar a diferença:<br />

Uma estratégia s i do jogador i éum plano completo <strong>de</strong> ações tal<br />

que especifica uma ação factível a i, c em ca<strong>da</strong> contingência c na<br />

qual o jogador i possa ser chamado a jogar.<br />

Ca<strong>da</strong> contingência c po<strong>de</strong> ser interpreta<strong>da</strong> como ca<strong>da</strong> instante t.<br />

A ação <strong>de</strong> um jogador po<strong>de</strong> ou não ser observável pelo(s) outro(s).<br />

Para analisar jogos dinâmicos precisamos do conceito <strong>de</strong><br />

Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos (ENPS).<br />

Refinamentos do EN: Equilíbrio Perfeito<br />

O gran<strong>de</strong> problema prático do EN é que geralmente se<br />

têm múltiplos ENs. Isso é freqüente em jogos dinâmicos.<br />

A pergunta natural é: qual o equilíbrio que <strong>de</strong>ve prevalecer?<br />

Em jogos dinâmicos, o conceito <strong>de</strong> EN não consegue eliminar<br />

várias estratégias não-críveis. É necessário adicionar uma<br />

racionali<strong>da</strong><strong>de</strong> seqüencial no caminho do equilíbrio.<br />

Princípio <strong>da</strong> racionali<strong>da</strong><strong>de</strong> seqüencial: a estratégia <strong>de</strong> um jogador<br />

<strong>de</strong>ve especificar ações ótimas em to<strong>dos</strong> os pontos <strong>da</strong> árvore <strong>de</strong> jogos.<br />

Selten (1965) introduziu o conceito <strong>de</strong> equilíbrio <strong>de</strong> Nash<br />

perfeito em subjogos (ENPS) para jogos dinâmicos.<br />

ENPS usa o princípio <strong>da</strong> racionali<strong>da</strong><strong>de</strong> seqüencial e o<br />

conhecido processo <strong>de</strong> otimização backwards (retro-indução):<br />

Estabelece primeiro as estratégias ótimas nos nós terminais e<br />

<strong>de</strong>pois vai estabelecendo as estratégias ótimas nos nós anteriores.<br />

O precursor foi o teorema Zermelo (1913) que po<strong>de</strong> ser enunciado<br />

assim “todo jogo finito <strong>de</strong> informação perfeita tem um EN em<br />

estratégias puras que po<strong>de</strong> ser obtido através <strong>de</strong> retro-indução”.<br />

24


Subjogos<br />

Antes <strong>de</strong> <strong>de</strong>finir o ENPS é necessário <strong>de</strong>finir subjogo:<br />

Subjogo é um subconjunto do jogo Γ E<br />

com as proprie<strong>da</strong><strong>de</strong>s: (a)<br />

começa num conjunto <strong>de</strong> informação que contém apenas um<br />

nó <strong>de</strong> <strong>de</strong>cisão e contém to<strong>dos</strong> os nós sucessores; (b) não há<br />

conjuntos <strong>de</strong> informação quebra<strong>dos</strong>, i. é, se o nó <strong>de</strong> <strong>de</strong>cisão x<br />

está no subjogo, então ca<strong>da</strong> nó x’ ∈ H(x) (i. é, o conjunto <strong>de</strong><br />

informação on<strong>de</strong> está x) também estará no subjogo.<br />

Todo jogo tem pelo menos um subjogo que é o próprio jogo.<br />

Firma 1<br />

não é subjogo (não contém<br />

E NE to<strong>dos</strong> os nós sucessores)<br />

Firma 2<br />

E NE E<br />

(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )<br />

NE<br />

(0; 0)<br />

subjogo<br />

Quantos subjogos existem?<br />

R: 3 subjogos.<br />

Subjogos<br />

Exemplo <strong>da</strong> segun<strong>da</strong> condição para ser subjogo:<br />

Esse jogo só tem um único subjogo que é o próprio jogo.<br />

Po<strong>de</strong> ser interpretado como um jogo simultâneo ou como<br />

um jogo seqüencial on<strong>de</strong> a ação <strong>da</strong> firma 1 não é observável.<br />

Firma 1<br />

E<br />

NE<br />

Firma 2<br />

E NE E<br />

(D 1 ; D 2 ) (M 1 ; 0) (0; M 2 )<br />

NE<br />

(0; 0)<br />

Não é subjogo, pois não<br />

po<strong>de</strong> haver conjuntos <strong>de</strong><br />

informação quebra<strong>dos</strong>.<br />

Informação imperfeita x incompleta.<br />

Caso acima é informação imperfeita. Veremos <strong>de</strong>pois o outro caso.<br />

25


Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos<br />

O perfil <strong>de</strong> estratégias σ = (σ 1<br />

, σ 2<br />

, … σ J<br />

) no jogo na<br />

forma extensiva Γ E<br />

éum Equilíbrio <strong>de</strong> Nash Perfeito em<br />

Subjogos se ele induz um EN em ca<strong>da</strong> subjogo <strong>de</strong> Γ E<br />

.<br />

No jogo finito com informação perfeita ele po<strong>de</strong> ser obtido<br />

backwards e o Teorema <strong>de</strong> Zermelo diz que existe o ENPS.<br />

O ENPS é único caso nenhum jogador tenha os mesmos payoffs<br />

em nós terminais quaisquer. Faremos um exemplo numérico.<br />

Existe uma ligação estreita óbvia entre o conceito <strong>de</strong> ENPS e o<br />

<strong>de</strong> programação dinâmica: ambos usam otimização backwards.<br />

Para <strong>de</strong>terminar o ENPS inicia-se procurando o(s) EN nos nós<br />

terminais, substitui-se esse subjogo pelos payoffs do EN e analisa o<br />

sujogo pre<strong>de</strong>cessor, procurando o EN, etc., até chegar ao início.<br />

Nos casos <strong>de</strong> jogos infinitos, a <strong>de</strong>finição <strong>de</strong> ENPS permanece no<br />

sentido <strong>de</strong> que induz EN em to<strong>dos</strong> os subjogos, apesar <strong>de</strong> não ter<br />

a “última <strong>da</strong>ta” para trabalhar backwards. Faremos um exemplo.<br />

Trabalhar com horizonte infinito é fácil, pois o tempo <strong>de</strong>ixa <strong>de</strong> ser<br />

variável <strong>de</strong> estado (sempre terá um horizonte infinito pela frente).<br />

Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos<br />

Jogo abaixo: a forma normal mostra que existem<br />

dois EN. Forma extensiva mostra que só um é ENPS.<br />

1<br />

u<br />

2<br />

d<br />

0<br />

3<br />

½<br />

2<br />

U<br />

L<br />

1<br />

u<br />

D<br />

R<br />

2<br />

-2<br />

-2<br />

d<br />

1<br />

-1<br />

1<br />

UL<br />

UR<br />

DL<br />

DR<br />

0<br />

0<br />

½<br />

-2<br />

3<br />

3<br />

2<br />

-2<br />

0<br />

0<br />

1<br />

1<br />

3<br />

3<br />

-1<br />

-1<br />

• Dois EN em estratégias puras (ver forma normal). Mas um <strong>de</strong>les<br />

não é crível (não é sequencialmente racional).<br />

• Um ENPS em estratégias puras: (DL ; u). É o EN “crível”.<br />

26


Procedimento Backward Induction<br />

O procedimento <strong>de</strong> retro-indução (backward induction) é:<br />

Começe nos nós terminais do jogo e i<strong>de</strong>ntifique quem joga.<br />

Ache a <strong>de</strong>cisão ótima do jogador nos nós <strong>de</strong> <strong>de</strong>cisão comparando<br />

os payoffs que os jogadores recebem em ca<strong>da</strong> nó terminal.<br />

Registre essa escolha, ela é parte <strong>da</strong> estratégia ótima <strong>dos</strong> jogadores.<br />

Po<strong>da</strong>r a árvore cortando to<strong>dos</strong> os ramos que se originaram <strong>de</strong> #1.<br />

Atribuir a ca<strong>da</strong> um <strong>de</strong>sses novos nós terminais os payoffs obti<strong>dos</strong><br />

quando a ação ótima é realiza<strong>da</strong> nesse nó.<br />

Uma nova árvore <strong>de</strong> jogo existe e é menor que a original.<br />

Se não existirem mais nós <strong>de</strong> <strong>de</strong>cisão, o jogo termina. Se ain<strong>da</strong><br />

existirem nós <strong>de</strong> <strong>de</strong>cisão, aplicar os passos #1 a #4 até não haver<br />

mais nós <strong>de</strong> <strong>de</strong>cisão.<br />

Para ca<strong>da</strong> jogador, selecione as <strong>de</strong>cisões ótimas em ca<strong>da</strong> nó. Esse<br />

conjunto <strong>de</strong> <strong>de</strong>cisões constitem as estratégias ótimas <strong>de</strong>sse jogo.<br />

O resultado é um equilíbrio <strong>de</strong> Nash perfeito em subjogos.<br />

O ENPS po<strong>de</strong> ser único ou não (mesmo payoff em nós <strong>de</strong> <strong>de</strong>cisão).<br />

Ex: Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

O caso a seguir é uma variante do mo<strong>de</strong>lo <strong>de</strong> Stackelberg<br />

<strong>de</strong> lí<strong>de</strong>r e seguidor (caso mais geral é visto em segui<strong>da</strong>).<br />

A motivação <strong>de</strong>sse exemplo é um famoso caso <strong>de</strong> 1945: o<br />

processo antitrust contra o po<strong>de</strong>r <strong>de</strong> monopólio <strong>da</strong> Alcoa,<br />

que dominava 90% do mercado <strong>de</strong> alumínio nos EUA.<br />

A Alcoa foi con<strong>de</strong>na<strong>da</strong> porque o juiz enten<strong>de</strong>u que o rápido<br />

acúmulo <strong>de</strong> capaci<strong>da</strong><strong>de</strong> <strong>de</strong> produção por parte <strong>da</strong> Alcoa, que<br />

excedia muito os níveis <strong>de</strong> <strong>de</strong>man<strong>da</strong>, tinha como objetivo criar<br />

uma barreira <strong>de</strong> entra<strong>da</strong> para inibir a entra<strong>da</strong> <strong>de</strong> competidores.<br />

Veremos que a teoria <strong>dos</strong> jogos e o ENPS po<strong>de</strong> justificar a<br />

<strong>de</strong>cisão do juiz americano, assim como o argumento usado.<br />

Suponha que duas firmas estão consi<strong>de</strong>rando entrar ou<br />

não no mercado, e também como (capaci<strong>da</strong><strong>de</strong>) entrar.<br />

Seja P o preço <strong>de</strong> equilíbrio e Q T a produção total <strong>da</strong> indústria<br />

que aqui é a soma <strong>da</strong>s produções <strong>da</strong>s duas firmas q 1 + q 2 .<br />

27


Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa linear <strong>da</strong><strong>da</strong> por:<br />

P = 900 – Q T ou P = 900 – q 1 –q 2<br />

Assuma que existem só duas alternativas <strong>de</strong><br />

investimento em capaci<strong>da</strong><strong>de</strong>s: pequena e gran<strong>de</strong>.<br />

A uni<strong>da</strong><strong>de</strong> pequena <strong>de</strong>man<strong>da</strong> um investimento I p<br />

= US$<br />

50.000 e permite produzir 100 uni<strong>da</strong><strong>de</strong>s.<br />

A uni<strong>da</strong><strong>de</strong> gran<strong>de</strong> teria <strong>de</strong> investir I g<br />

= US$ 175.000 e<br />

permitiria produzir qualquer quanti<strong>da</strong><strong>de</strong> <strong>de</strong> uni<strong>da</strong><strong>de</strong>s.<br />

Assim, só a uni<strong>da</strong><strong>de</strong> pequena é que tem restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>.<br />

Suponha que em ambos os casos o custo operacional é zero.<br />

Assuma que a entra<strong>da</strong> <strong>da</strong>s firmas é seqüencial:<br />

Primeiro a firma 1 <strong>de</strong>ci<strong>de</strong> se entra e com que capaci<strong>da</strong><strong>de</strong> e<br />

<strong>de</strong>pois a firma 2, observando a ação <strong>da</strong> firma 1, <strong>de</strong>ci<strong>de</strong> se<br />

entra ou não e com que capaci<strong>da</strong><strong>de</strong>.<br />

Determine o Equilíbrio <strong>de</strong> Nash Perfeito em Subjogos (ENPS).<br />

Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Para achar o ENPS, vamos fazer alguns cálculos:<br />

Suponha que a firma i está sozinha no mercado. Assim, o preço<br />

duma uni<strong>da</strong><strong>de</strong> é P = 900 – q i e a receita R i = q i (900 – q i ).<br />

O lucro <strong>de</strong> i é maximizado escolhendo q i = 450, que dá uma<br />

receita (= lucro oper., pois o custo oper. = 0) <strong>de</strong> R* i = 202.500.<br />

Mas a firma i só produz 450 se ela investir na uni<strong>da</strong><strong>de</strong> gran<strong>de</strong>.<br />

Se ela investiu na uni<strong>da</strong><strong>de</strong> pequena, ela só produziria 100 e só<br />

obteria uma receita (lucro) <strong>de</strong> R = 80.000.<br />

Suponha que esses valores estão to<strong>dos</strong> em valor presente, <strong>de</strong><br />

forma que os VPLs <strong>dos</strong> dois casos anteriores seriam:<br />

Uni<strong>da</strong><strong>de</strong> gran<strong>de</strong>: VPL g = R – I g = 202.500 – 175.000 = $ 27.500.<br />

Uni<strong>da</strong><strong>de</strong> pequena: VPL p = R – I p = 80.000 – 50.000 = $ 30.000.<br />

Agora suponha que ambas as firmas estão no mercado. Assim,<br />

a receita <strong>da</strong> firma i é R i = q i (900 – q i –q j ). A função melhor<br />

resposta <strong>de</strong> i é <strong>da</strong><strong>da</strong> pela condição <strong>de</strong> primeira or<strong>de</strong>m: ∂R i /∂q i<br />

= 0 ⇒ q* i = 450 – q j /2. Resolvendo o sistema q* 1 = 450 – q* 2 /2 e<br />

q* 2 = 450 – q* 1 /2 obtemos q* 1 = q* 2 = 300.<br />

28


Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Esse cálculo consi<strong>de</strong>ra que ambas as firmas não têm restrição <strong>de</strong><br />

capaci<strong>da</strong><strong>de</strong>s (investiram em uni<strong>da</strong><strong>de</strong>s gran<strong>de</strong>s).<br />

Nesse caso sem restrição e com as duas firmas no mercado, as<br />

firmas teriam receitas R i = (900 – 300 – 300) 300 = 90.000. Nesse<br />

caso os VPLs seriam negativos: VPL 1 = VPL 2 = 90.000 – 175.000<br />

⇒ VPL 1 = VPL 2 = – 85.000.<br />

Se ambas as firmas estão no mercado, mas com capaci<strong>da</strong><strong>de</strong><br />

restrita, a receita será R i = (900 – 100 – 100) 100 = 70.000.<br />

Logo, VPL 1 = VPL 2 = 70.000 – 50.000 ⇒ VPL 1 = VPL 2 = 20.000.<br />

Se ambas as firmas estão no mercado, uma (i) com capaci<strong>da</strong><strong>de</strong><br />

sem restrição e a outra (j) com capaci<strong>da</strong><strong>de</strong> restrita, então a que<br />

não tem restrição produziria no ótimo q* i = 450 – 100/2 = 400.<br />

Logo, o preço será P = 900 – 400 – 100 = 400; as receitas <strong>da</strong>s duas<br />

firmas serão: R i = 400 x 400 = 160.000 e R i = 400 x 100 = 40.000.<br />

Os VPLs serão: VPL i = 160.000 – 175.000 ⇒ VPL i = – 15.000 e<br />

VPL j = 40.000 – 50.000 ⇒ VPL j = – 10.000.<br />

Assim, uma análise não-estratégica recomen<strong>da</strong>ria entrar com a planta<br />

pequena ou não entrar. Mas análise estratégica <strong>da</strong>rá outro resultado!<br />

Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Esse jogo seqüencial é mostrado na forma extensiva, on<strong>de</strong> N = não-entrar;<br />

P = entrar com capaci<strong>da</strong><strong>de</strong> pequena; e G = entrar com capaci<strong>da</strong><strong>de</strong> gran<strong>de</strong>.<br />

N (0; 0)<br />

Firma 2<br />

P (0; 30)<br />

Firma 1<br />

N<br />

P<br />

Firma 2<br />

G<br />

N<br />

P<br />

G<br />

(0; 27,5)<br />

(30; 0)<br />

(20; 20)<br />

(− 10; − 15)<br />

Backwards:<br />

Primeiro a<br />

escolha ótima<br />

<strong>da</strong> firma 2 em<br />

ca<strong>da</strong> subjogo<br />

terminal.<br />

G<br />

N<br />

(27,5; 0)<br />

P<br />

(− 15; − 10)<br />

Firma 2<br />

G<br />

(− 85; − 85)<br />

29


Barreira <strong>de</strong> Entra<strong>da</strong> com Excesso <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Agora po<strong>de</strong>mos substituir os subjogos terminais pelo payoff advindo <strong>da</strong><br />

escolha ótima <strong>da</strong> firma 2. Com isso ficará claro a escolha ótima <strong>da</strong> firma 1.<br />

Firma 1<br />

N<br />

P<br />

(0; 30)<br />

(20; 20)<br />

A firma 1 escolhe a ação ótima<br />

nesse subjogo, consi<strong>de</strong>rando as<br />

respostas ótimas <strong>da</strong> firma 2.<br />

G<br />

(27,5; 0)<br />

Assim, o único ENPS é o par <strong>de</strong> estratégias (G; N), ou<br />

seja, a firma 1 entra com capaci<strong>da</strong><strong>de</strong> gran<strong>de</strong> e a firma 2<br />

não entra no mercado. Com isso, temos um monopólio!<br />

Esse resultado é interessante, já que sem competição (sem a<br />

firma 2 ameaçar entrar), o ótimo para a firma 1 seria entrar<br />

com uma capaci<strong>da</strong><strong>de</strong> pequena (VPL = 30 > 27,5).<br />

Logo, o excesso <strong>de</strong> capaci<strong>da</strong><strong>de</strong> inibiu a entra<strong>da</strong> do competidor!<br />

Exemplo 2: Equilíbrio <strong>de</strong> Stackelberg<br />

Stackelberg: entra<strong>da</strong> em um mercado com competição<br />

em quanti<strong>da</strong><strong>de</strong>s e com ações seqüenciais, i. é, primeiro<br />

entra a firma 1 (lí<strong>de</strong>r) com q 1 e <strong>de</strong>pois, observando a<br />

quanti<strong>da</strong><strong>de</strong> q 1 , entra a firma 2 (seguidor) com q 2 *(q 1 ).<br />

Firmas iguais com custo marginal c. As firmas já têm capaci<strong>da</strong><strong>de</strong>s<br />

irrestritas. Deman<strong>da</strong> p(Q) = a − b Q. Determine o único ENPS.<br />

Firma 1<br />

q 1<br />

0 q 1<br />

Firma 2<br />

q 2<br />

0 q 2<br />

(π 1 ; π 2 )<br />

Lembrando: em jogos dinâmicos finitos buscase<br />

o ENPS por retro-indução (“backwards”).<br />

Assim, primeiro verifica-se o q 2 ótimo para a<br />

firma 2, <strong>da</strong>do que a firma 1 já entrou com q 1 .<br />

A firma 2 observou q 1 e a melhor resposta <strong>da</strong><br />

firma 2 é a sua curva <strong>de</strong> reação q 2 *(q 1 ).<br />

A firma 1 sabe que a firma 2 irá observar o<br />

valor q 1 e sabe que a rival irá jogar q 2 *(q 1 ).<br />

Assim, basta a firma 1 jogar q 1 * <strong>de</strong> forma a<br />

maximizar π 1 , <strong>da</strong>do que a rival joga q 2 *(q 1 ).<br />

30


Exemplo: Equilíbrio <strong>de</strong> Stackelberg<br />

Vimos que a função lucro π 1 <strong>da</strong> firma 1 e a curva <strong>de</strong><br />

reação q 2 *(q 1 ) <strong>da</strong> firma 2 p/ C i (q i ) = c i q i , são <strong>da</strong><strong>da</strong>s por:<br />

π 1 = q 1 P(Q T ) − C 1 (q 1 ) ⇒ π 1 = q 1 (a − c 1 ) − q 1 b (q 1 + q 2 )<br />

* a−c 2<br />

− b q1<br />

Firmas<br />

* a−c − b q1<br />

q(q)<br />

2 1<br />

=<br />

2b homogêneas<br />

⇒ q(q)<br />

2 1<br />

=<br />

2b<br />

Assim, temos um problema <strong>de</strong> maximização <strong>de</strong> π 1 ,<br />

escolhendo q 1 e substituindo q 2 pela função q 2 *(q 1 ):<br />

a − c − b q<br />

Max P(q<br />

1<br />

+ q(q))<br />

2 1<br />

q<br />

1<br />

− C(q)<br />

1<br />

1 1<br />

q<br />

= Max q<br />

1<br />

(a − c) − b q<br />

1<br />

(q<br />

1<br />

+ )<br />

1<br />

q1<br />

2 b<br />

Aplicando a CPO (condição <strong>de</strong> primeira or<strong>de</strong>m) ∂π 1 /∂q 1 = 0:<br />

* (a − c)<br />

* (a − c)<br />

q<br />

1<br />

= ⇒ q<br />

2<br />

=<br />

2 b<br />

4 b<br />

Exercício: Mostre que o lucro π 1 > π 2 e <strong>de</strong>termine o preço P.<br />

A firma 2 tem menor lucro por ter mais informação que a<br />

firma 1 (sabe q 1 ): aqui é <strong>de</strong>svantagem ser informado!<br />

No jogo do par-ou-ímpar, ao contrário, ter mais informação era melhor.<br />

Inconsistência Temporal<br />

O resultado <strong>de</strong> Stackelberg é não apenas EN como<br />

também ENPS, <strong>de</strong>s<strong>de</strong> que o jogo termine no 2 o estágio.<br />

A figura abaixo (do exemplo <strong>da</strong> parte 1, com P(Q) = 30 - Q)<br />

mostra que a quanti<strong>da</strong><strong>de</strong> q 1 não é melhor resposta para q 2 .<br />

Assim, se houvesse um terceiro estágio seria ótimo para o lí<strong>de</strong>r<br />

reduzir a sua produção q 1 para aumentar o seu lucro π 1 .<br />

Esse problema é chamado <strong>de</strong> problema <strong>de</strong> inconsistência temporal.<br />

Stackelberg:<br />

* (a − c)<br />

q<br />

1<br />

=<br />

2 b<br />

* (a − c)<br />

q<br />

2<br />

=<br />

4 b<br />

Na prática a pergunta é:<br />

Será a estratégia q 1 um<br />

compromisso crível?<br />

31


Inconsistência Temporal<br />

O resultado <strong>de</strong> Stackelberg é um exemplo do problema<br />

<strong>de</strong> inconsistência temporal (“time inconsistency”):<br />

Como a quanti<strong>da</strong><strong>de</strong> q 1 <strong>de</strong> Stackelberg não é a melhor resposta<br />

para o q 2 do seguidor, se o jogo continua essas quanti<strong>da</strong><strong>de</strong>s<br />

<strong>de</strong>ixam <strong>de</strong> ser equilíbrio, pois existe um incentivo para o lí<strong>de</strong>r<br />

mu<strong>da</strong>r (reduzir) o valor <strong>de</strong> q 1 num terceiro estágio do jogo.<br />

Ver, por ex., o livro do Fu<strong>de</strong>nberg & Tirole (1991, pgs. 74-77).<br />

Inconsistência temporal em geral <strong>de</strong>screve a situação<br />

on<strong>de</strong> as preferências do <strong>de</strong>cisor mu<strong>da</strong>m ao longo do tempo<br />

O que é preferido num certo instante é inconsistente com o que<br />

é preferido num outro instante do tempo. Os jogadores com<br />

freqüência “re-otimizam” no curto-prazo, abandonando o<br />

plano <strong>de</strong> longo-prazo que antes era ótimo por um que era pior.<br />

É comum que a série <strong>de</strong> <strong>de</strong>cisões “ótimas” <strong>de</strong> curto-prazo tenha<br />

resulta<strong>dos</strong> piores do que o compromisso do plano <strong>de</strong> longo-prazo.<br />

Esse tema é relacionado com “credibili<strong>da</strong><strong>de</strong>” e “compromisso”.<br />

Inconsistência Temporal e Commitment<br />

Esse tema ganhou populari<strong>da</strong><strong>de</strong> após ser premiado com<br />

o Nobel <strong>de</strong> Economia <strong>de</strong> 2004 para Kydland & Prescott.<br />

O paper clássico (que inaugurou um tema em macroeconomia)<br />

<strong>de</strong>les é “Rules Rather than Discretion: The Inconsistency of<br />

Optimal Plans”, Journal of Political Economy, 1977.<br />

Política monetária: Banco Central em vez <strong>de</strong> perseguir meta <strong>de</strong><br />

longo-prazo (commitment) <strong>de</strong> baixa inflação, ele po<strong>de</strong> afrouxar a<br />

política <strong>de</strong>vido ao incentivo <strong>de</strong> aumentar o emprego com emissão<br />

<strong>de</strong> moe<strong>da</strong> (“curva Phillips”). No final há <strong>de</strong>semprego e inflação!<br />

Essa inconsistência está muito liga<strong>da</strong> ao conceito <strong>de</strong><br />

compromisso (“commitment”) não-crível. Ex. na política:<br />

Um governo po<strong>de</strong> anunciar que não negocia com terroristas<br />

em caso <strong>de</strong> seqüestros. Entretanto, o terrorista sabe que isso é<br />

um compromisso não-crível, vazio (“bravata”), a menos que<br />

haja uma lei com punição prevista para quem negociar.<br />

Para um compromisso ser crível é necessário que não hajam<br />

incentivos para <strong>de</strong>sviar no curto e longo-prazo.<br />

32


Inconsistência Temporal e Macroeconomia<br />

Uma política macroeconômica tem inconsistência<br />

temporal quando o governo anuncia uma política <strong>de</strong><br />

longo-prazo ótima (ex.: baixa inflação), mas <strong>de</strong> forma<br />

que há incentivos para <strong>de</strong>sviar no curto-prazo.<br />

Os agentes econômicos são racionais ⇒ consi<strong>de</strong>ram que o<br />

compromisso do governo é não-crível e reajustam os preços<br />

Uma maneira <strong>de</strong> conduzir uma política monetária<br />

com consistência temporal é <strong>da</strong>r autonomia ou<br />

in<strong>de</strong>pendência ao Banco Central para que faça essa<br />

política <strong>de</strong> forma a cumprir uma meta <strong>de</strong> inflação.<br />

O BC tem <strong>de</strong> ser avaliado por cumprir essa meta e não<br />

por agra<strong>da</strong>r empresários ou centrais sindicais.<br />

Assim o BC não terá incentivos <strong>de</strong> <strong>de</strong>sviar no curto-prazo.<br />

É isso que tem sido feito no Brasil e em outros países com<br />

muito sucesso. Credibili<strong>da</strong><strong>de</strong> do BC é a palavra-chave.<br />

<strong>Jogos</strong> Repeti<strong>dos</strong><br />

Jogo repetido é um jogo na forma extensiva que consiste<br />

<strong>de</strong> algum número <strong>de</strong> repetições <strong>de</strong> um jogo básico<br />

chamado estágio-jogo (“stage-game”).<br />

O estágio-jogo é geralmente um jogo bem conhecido <strong>de</strong> dois<br />

jogadores. O jogo todo é às vezes chamado <strong>de</strong> superjogo.<br />

Os jogos repeti<strong>dos</strong> po<strong>de</strong>m ser finitos ou infinitos. Geralmente<br />

os equilíbrios são totalmente diferentes em ca<strong>da</strong> caso.<br />

Quando a ameaça <strong>de</strong> retaliação é crível, alguns resulta<strong>dos</strong> que<br />

não seriam EN no stage-game muitas vezes são sustentáveis no<br />

superjogo. Isso ocorre principalmente em jogos infinitos.<br />

Mas po<strong>de</strong> ocorrer em jogos repeti<strong>dos</strong> finitos, especialmente os<br />

que têm múltiplos EN no estágio-jogo. Veremos um exemplo.<br />

Nos jogos repeti<strong>dos</strong> finitos <strong>de</strong> informação perfeita, se o<br />

estágio-jogo tem um único EN (como no dilema <strong>dos</strong><br />

prisioneiros), então o único ENPS é sempre jogar o EN.<br />

A prova (“backwards”) é óbvia.<br />

33


<strong>Jogos</strong> Infinitamente Repeti<strong>dos</strong><br />

Nos jogos repeti<strong>dos</strong> finitos existe uma última <strong>da</strong>ta <strong>de</strong><br />

jogo. Mas em várias interações sociais não existe essa<br />

<strong>da</strong>ta-limite. Nesse caso, são mais a<strong>de</strong>quado os jogos que<br />

potencialmente po<strong>de</strong>m ser infinitamente repeti<strong>dos</strong>.<br />

Nos jogos infinitamente repeti<strong>dos</strong> é mais fácil sustentar<br />

como ENPS uma ação que não é EN no estágio-jogo.<br />

Ex.: cooperar no dilema <strong>dos</strong> prisioneiros po<strong>de</strong> ser ENPS no Γ E∞ .<br />

Mas é necessário usar estratégias <strong>de</strong> punição e recompensa.<br />

Um <strong>dos</strong> critérios p/ comparar estratégias é o VPL (valor<br />

presente líquido) do fluxo <strong>de</strong> lucros <strong>de</strong>scontado por δ < 1.<br />

O fator <strong>de</strong> <strong>de</strong>sconto δ po<strong>de</strong> ser vista como 1/(1 + µ), on<strong>de</strong> µ éa<br />

taxa <strong>de</strong> <strong>de</strong>sconto ajusta<strong>da</strong> ao risco (<strong>da</strong><strong>da</strong> pelo CAPM, por ex.).<br />

O lucro total (VPL) <strong>da</strong> firma i é <strong>da</strong>do por:<br />

VPL i = π i, 1 + (π i, 2 δ) + (π i, 3 δ 2 ) + … + (π i, t δ t − 1 ) + …<br />

Que é finito para π i, t finito, ∀ t. Note que a soma <strong>da</strong> PG infinita<br />

<strong>de</strong> razão menor que 1 é finita: 1 + δ + δ 2 + … = 1/(1 − δ).<br />

Estratégias <strong>de</strong> Punição com Repetição Infinita<br />

Em jogos repeti<strong>dos</strong> os teoremas populares usam as<br />

chama<strong>da</strong>s estratégias <strong>de</strong> punição (“trigger strategies”)<br />

para obter certos payoffs. As três mais usa<strong>da</strong>s são:<br />

Estratégia “Grim” (rígi<strong>da</strong>, intransigente): comece com a ação<br />

“cooperar” (C); continue com C a menos que algum jogador<br />

escolha “não-cooperar” (NC), nesse caso jogue NC p/ sempre.<br />

Na repetição infinita do dilema <strong>dos</strong> prisioneiros po<strong>de</strong>-se sustentar<br />

a cooperação (não-confessar) como ENPS com essa estratégia,<br />

pois quem <strong>de</strong>svia tem um ganho imediato, mas uma per<strong>da</strong> eterna.<br />

Estratégia “tit-for-tat” (“olho-por-olho…”): comece com a<br />

ação “cooperar” (C); nos outros perío<strong>dos</strong>, escolha em t a ação<br />

que o outro jogador escolheu em t − 1. Desvio: ações cíclicas.<br />

Não é ENPS no dilema <strong>dos</strong> prisioneiros, mas com ela Rapoport<br />

ganhou o torneio <strong>de</strong>sse jogo repetido 200 vezes (Axelrod, 1984)!<br />

Estratégia “minimax”: Punir visando a máxima per<strong>da</strong> ao outro<br />

jogador, que então minimiza a máxima per<strong>da</strong> ele que po<strong>de</strong> ter.<br />

Como na “grim”, po<strong>de</strong> ser ENPS a <strong>de</strong>pen<strong>de</strong>r do fator <strong>de</strong> <strong>de</strong>sconto.<br />

34


Exemplo Estilo Dilema <strong>dos</strong> Prisioneiros<br />

Seja um jogo repetido infinitamente em que o estágiojogo<br />

é do estilo dilema <strong>dos</strong> prisioneiros com os payoffs:<br />

Jogador 2<br />

Coopera Não-Coopera<br />

Jogador 1<br />

Coopera<br />

Não-Coopera<br />

3; 3 0; 5<br />

5; 0 1; 1<br />

Com repetição infinita, note que ca<strong>da</strong> subjogo é igual ao<br />

anterior com exceção talvez <strong>da</strong> sua história pregressa.<br />

Com a estratégia “grim” e o fator <strong>de</strong> <strong>de</strong>sconto δ∈[0, 1],<br />

não há incentivo para <strong>de</strong>sviar <strong>da</strong> estratégia grim se:<br />

3 (1 + δ + δ 2 +…) = 3 / (1 − δ) ≥ 5 + 1(δ + δ 2 +…) = 5 + δ / (1 − δ)<br />

Algebrando se vê que isso ocorre se e somente se δ≥½.<br />

Esse valor limite (½) <strong>de</strong>pen<strong>de</strong> <strong>da</strong> estrutura <strong>de</strong> payoffs do jogo.<br />

<strong>Jogos</strong> Estocásticos Repeti<strong>dos</strong> (Shapley)<br />

A versão clássica <strong>de</strong> jogos estocásticos é <strong>de</strong>vido a<br />

Shapley (1953). Hoje existe uma nova literatura mais<br />

complexa <strong>de</strong> jogos <strong>de</strong> opções, que consi<strong>de</strong>ra processos<br />

estocásticos e exercício ótimo <strong>de</strong> opções (reais ou financ.)<br />

A versão clássica é um jogo dinâmico repetido (finito ou<br />

infinito) em que existem probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> transição <strong>de</strong><br />

um estágio-jogo para outro estágio.<br />

Assim, a ca<strong>da</strong> estágio do jogo o payoff é em geral diferente,<br />

existindo probabili<strong>da</strong><strong>de</strong>s p/ ca<strong>da</strong> possível estado <strong>da</strong> natureza.<br />

A ca<strong>da</strong> estágio os jogadores <strong>de</strong>vem tomar ações que <strong>de</strong>pen<strong>de</strong>m<br />

não só do estado (e a matriz <strong>de</strong> payoffs) corrente, mas também<br />

<strong>dos</strong> possíveis esta<strong>dos</strong> nos próximos estágios do jogo.<br />

<strong>Jogos</strong> estocásticos clássicos são generalizações <strong>de</strong> jogos<br />

repeti<strong>dos</strong> para um ambiente <strong>de</strong> payoffs estocásticos.<br />

Ver no anexo o caso do jogo <strong>de</strong> cotas <strong>da</strong> OPEP em que a<br />

<strong>de</strong>man<strong>da</strong> é estocástica, mas com só dois esta<strong>dos</strong> <strong>da</strong> natureza.<br />

35


<strong>Jogos</strong> <strong>de</strong> Informação Incompleta<br />

Em muitos jogos é mais realista consi<strong>de</strong>rar que existe<br />

informação incompleta sobre os payoffs <strong>dos</strong> rivais.<br />

Nesses jogos, ca<strong>da</strong> firma só recebe informações parciais sobre<br />

os valores do jogo, representa<strong>da</strong>s por distribuições <strong>de</strong><br />

probabili<strong>da</strong><strong>de</strong>s a priori sobre os possíveis cenários <strong>dos</strong> payoffs.<br />

Um <strong>dos</strong> jogos <strong>de</strong>ssa classe mais importantes é o jogo <strong>de</strong><br />

informação assimétrica, em que existe uma parte<br />

informa<strong>da</strong> e outra parte não (ou menos) informa<strong>da</strong>.<br />

Assimetria <strong>de</strong> informação já <strong>de</strong>u 5 prêmios Nobel em economia<br />

Iremos ver alguns casos clássicos, como os jogos <strong>de</strong> sinalização.<br />

O método geral para resolver os jogos <strong>de</strong> informação<br />

incompleta é o método Bayesiano (Harsanyi, 1967-68).<br />

O jogo original é transformado num jogo equivalente <strong>de</strong> Bayes<br />

com informação completa, embora imperfeita.<br />

Harsanyi <strong>de</strong>senvolveu o conceito <strong>de</strong> equilíbrio Bayesiano.<br />

Informação Incompleta e Equilíbrio Bayesiano<br />

Nesse jogo <strong>de</strong> informação incompleta, a natureza faz o<br />

primeiro lance escolhendo a realização <strong>de</strong> θ i<br />

, a variável<br />

aleatória (v.a.) sobre o valor ou “tipo” <strong>de</strong> ca<strong>da</strong> jogador i.<br />

Ca<strong>da</strong> jogador i tem uma função valor V i<br />

(s i<br />

, s − i<br />

, θ i<br />

), on<strong>de</strong> θ i<br />

∈Θ i<br />

é uma v.a. escolhi<strong>da</strong> pela natureza, só observa<strong>da</strong> pelo jogador i.<br />

É assumido, como premissa, que a distribuição conjunta <strong>dos</strong><br />

payoffs (valores) <strong>dos</strong> jogadores são <strong>de</strong> conhecimento comum.<br />

Estratégia pura p/ o jogador i é a regra <strong>de</strong> <strong>de</strong>cisão ou função<br />

s i<br />

(θ i<br />

) que dá a escolha para ca<strong>da</strong> realização do seu tipo θ i<br />

.<br />

O valor esperado condicional do jogador i é <strong>da</strong>do por:<br />

O equilíbrio Bayesiano <strong>de</strong> Nash (EBN) é <strong>de</strong>finido <strong>de</strong> forma<br />

similar ao EN, mas para valores espera<strong>dos</strong> condicionais.<br />

Um perfil <strong>de</strong> estratégias puras s = (s 1<br />

, s 2<br />

, … s J<br />

) é EBN se, para<br />

to<strong>dos</strong> os J jogadores:<br />

36


Informação Incompleta Vira Imperfeita<br />

Harsanyi transformou um jogo <strong>de</strong> informação incompleta em<br />

um jogo <strong>de</strong> informação completa mas imperfeita. Para isso, a<br />

natureza joga. Ex.: informação incompleta sobre a firma 1:<br />

Natureza joga:<br />

Com probabili<strong>da</strong><strong>de</strong> p, a<br />

firma 1 é do tipo alto custo<br />

Com probabili<strong>da</strong><strong>de</strong> 1 - p, a<br />

firma 1 é do tipo baixo custo<br />

Firma1tipoAC<br />

E<br />

NE<br />

informação<br />

imperfeita<br />

E<br />

Firma1tipoBC<br />

NE<br />

Firma 2<br />

E<br />

NE<br />

E<br />

NE<br />

E<br />

NE<br />

E<br />

NE<br />

(D 1 ; D 2 ) (M 1 ; 0)<br />

(0; M 2 )<br />

(0; 0)<br />

(D’ 1 ; D’ 2 ) (M’ 1 ; 0)<br />

(0; M 2 )<br />

(0; 0)<br />

Crise 2007/8 e Informação Assimétrica<br />

A crise financeira que começou em agosto <strong>de</strong> 2007<br />

(crédito imobiliário sub-prime) e se agravou a partir <strong>de</strong><br />

setembro <strong>de</strong> 2008 (crise sistêmica), é um exemplo radical<br />

<strong>da</strong> gravi<strong>da</strong><strong>de</strong> do problema <strong>de</strong> assimetria <strong>de</strong> informação.<br />

Assimetria <strong>de</strong> informação: como um banco não sabe se o outro<br />

tem ou não títulos “podres”, ele não empresta para o outro que<br />

fica com problemas para “fechar o caixa” do dia.<br />

Se um banco, mesmo sólido, não honrar um pagamento <strong>de</strong>vido<br />

a essa paralisia no mercado interbancário, ele po<strong>de</strong> sofrer uma<br />

“corri<strong>da</strong> bancária” e quebrar. Se quebra, não honra os seus<br />

<strong>de</strong>mais compromissos, criando mais dificul<strong>da</strong><strong>de</strong>s p/ os outros ...<br />

Assim, rapi<strong>da</strong>mente ocorre um gran<strong>de</strong> problema <strong>de</strong> liqui<strong>de</strong>z<br />

<strong>de</strong>vido a essa falta <strong>de</strong> confiança entre os bancos. A crise <strong>de</strong><br />

confiança é alavanca<strong>da</strong> pela assimetria <strong>de</strong> informação.<br />

A crise financeira <strong>de</strong> 1929 se tornou recessão e <strong>de</strong>pois<br />

<strong>de</strong>pressão nos anos 30: o Banco Central (FED) errou ao<br />

restringir ain<strong>da</strong> mais o crédito/reduzir liqui<strong>de</strong>z.<br />

37


Crise 2007/8 e Informação Assimétrica<br />

Os Bancos Centrais apren<strong>de</strong>ram com o erro <strong>de</strong> 1929 e<br />

hoje em dia a atuação padrão <strong>dos</strong> BCs nesses momentos<br />

é prover liqui<strong>de</strong>z no mercado interbancário para reduzir<br />

os efeitos <strong>da</strong> informação assimétrica entre os bancos.<br />

Isso é o que tem sido feito <strong>de</strong>s<strong>de</strong> agosto/07 por BCs <strong>dos</strong> EUA,<br />

Europa e Japão. No início, essa política foi bem sucedi<strong>da</strong>.<br />

O problema é que o volume <strong>de</strong> créditos “podres” parece<br />

ser muito maior que se imaginava. Terão os BCs cacifes<br />

suficientes p/ conter a crise? Qual o tamanho do rombo?<br />

O “pacote” aprovado pelo congresso americano em 03/10/2008<br />

é uma maneira <strong>de</strong> tentar revelar o tamanho do problema, ao<br />

propor a compra <strong>de</strong>sses títulos “podres”, assim como isolar o<br />

problema que causou a crise <strong>de</strong> confiança interbancária.<br />

Sem ele, po<strong>de</strong>ria acontecer o mesmo problema do Japão nos anos<br />

90 (crise imobiliária também) que teve prolonga<strong>da</strong> recessão.<br />

Problemas: custo ↑↑ do pacote; dúvi<strong>da</strong> se será ele suficiente já que<br />

persiste a assimetria <strong>de</strong> informação; e quanto pagar pelos títulos.<br />

Crise 2007/8: Epílogo?<br />

Em julho <strong>de</strong> 2009 aparentemente a crise <strong>de</strong> confiança no<br />

sistema financeiro terminou e a economia se recupera.<br />

Isso po<strong>de</strong> ser comemorado como um sucesso nas políticas <strong>dos</strong><br />

governos (especialmente os Banco Centrais) p/ reduzir os efeitos<br />

<strong>da</strong> assimetria <strong>de</strong> informação (provendo liqui<strong>de</strong>z ao mercado<br />

bancário e <strong>da</strong>ndo estímulos econômicos a economia real).<br />

Não foi repetido o erro <strong>de</strong> 1929. Se fosse, a situação seria bem pior.<br />

Há indicadores surpreen<strong>de</strong>ntes <strong>de</strong> recuperação econômica.<br />

Bancos americanos estão mostrando lucros semestrais eleva<strong>dos</strong>.<br />

Já a redução <strong>da</strong> assimetria <strong>de</strong> informação em sí (quem <strong>de</strong>tém os<br />

títulos podres) foi apenas parcialmente alcança<strong>da</strong>, já que a<br />

mu<strong>da</strong>nça nas regras contábeis <strong>de</strong> marcação a mercado está<br />

ocultando problemas com ativos podres (assimetria persiste).<br />

Marcação a mercado aqui significa lançar no balanço o valor <strong>de</strong><br />

mercado dum ativo e não o valor nominal. Os bancos americanos<br />

estão po<strong>de</strong>ndo colocar o valor nominal <strong>de</strong> vários ativos no balanço.<br />

O problema é que não é claro se isso causará crises mais adiante.<br />

Também, o custo elevado <strong>de</strong> estímulo <strong>da</strong> economia, po<strong>de</strong>rá causar<br />

problemas fiscais nos governos, com inflação, elevação <strong>dos</strong> juros, etc.<br />

38


Caso <strong>da</strong> Enron: Auditoria, Consultoria e Incentivos<br />

Um exemplo <strong>de</strong> falha <strong>de</strong> mercado foi a falência <strong>da</strong> Enron e o<br />

papel(ão) <strong>da</strong>s cias. “in<strong>de</strong>pen<strong>de</strong>ntes” <strong>de</strong> auditoria. Esse caso foi<br />

analisado por Stiglitz (Valor Econômico, 17/02/02):<br />

Firmas <strong>de</strong> auditoria <strong>de</strong> balanços existem para evitar que a assimetria<br />

<strong>de</strong> informação cause prejuízos ao investidor por omissão ou falsi<strong>da</strong><strong>de</strong>.<br />

A firma <strong>de</strong> auditoria joga jogos repeti<strong>dos</strong> com os investidores, logo<br />

teria o incentivo <strong>da</strong> reputação p/ bem informá-los sobre a Enron.<br />

No entanto, quando a mesma empresa que audita também presta<br />

consultoria, aparece outro (e perverso) incentivo <strong>de</strong> curto-prazo:<br />

“agra<strong>da</strong>r os clientes que não gostam <strong>de</strong> relatórios <strong>de</strong>sfavoráveis”.<br />

A auditora <strong>da</strong> Enron em 2001 chegou ao cúmulo <strong>de</strong> aju<strong>da</strong>r a<br />

<strong>de</strong>struir diversos documentos (supostas provas <strong>de</strong> irregulari<strong>da</strong><strong>de</strong>s).<br />

A. Levitt, ex-presi<strong>de</strong>nte <strong>da</strong> SEC, tentou no passado proibir a mistura <strong>de</strong><br />

ativi<strong>da</strong><strong>de</strong>s <strong>de</strong> auditoria e consultoria pela mesma empresa.<br />

Stiglitz argumenta que “a questão central <strong>de</strong> nossa época é<br />

encontrar o equilíbrio certo entre governo e mercado”.<br />

Mesmo com essas imperfeições no mercado, Stiglitz adverte:<br />

“precisamos resistir a tentação <strong>de</strong> ir para o extremo oposto”.<br />

Prêmio Nobel em 2007<br />

Esse prêmio Nobel em 2007 foi p/ a teoria <strong>de</strong> <strong>de</strong>senho<br />

<strong>de</strong> mecanismos, relaciona<strong>da</strong> com jogos Bayesianos.<br />

Veremos exemplos: bônus p/ gerentes e <strong>de</strong>senho <strong>de</strong> leilões.<br />

Foram três ganhadores, sendo que dois <strong>de</strong>les<br />

(Maskin e Myerson) têm na teoria <strong>dos</strong> jogos seu<br />

principal foco <strong>de</strong> pesquisas (mas Hurwicz também<br />

usou conceitos <strong>de</strong> teoria <strong>dos</strong> jogos nessa teoria).<br />

Hurwicz (falecido em 2008) foi o fun<strong>da</strong>dor <strong>da</strong> teoria e <strong>de</strong><br />

conceitos tais como o <strong>de</strong> “incentivo-compatível”.<br />

Myerson foi quem fez o link entre mecanismos incetivocompatível<br />

e jogos Bayesianos, o princípio <strong>da</strong> revelação II.<br />

Maskin refinou essa teoria com a teoria <strong>da</strong> implementação<br />

e tem outras contribuições em jogos cooperativos e nãocooperativos,<br />

<strong>de</strong>sigual<strong>da</strong><strong>de</strong> <strong>de</strong> ren<strong>da</strong>, patentes, etc.<br />

Myerson e Maskin estiveram no <strong>Rio</strong> em 2008 (LACEA).<br />

Tive a honra <strong>de</strong> ser o apresentador <strong>da</strong> palestra do Maskin.<br />

39


Desenho <strong>de</strong> Mecanismo e Princípio <strong>da</strong> Revelação<br />

A teoria do <strong>de</strong>senho <strong>de</strong> mecanismo combina o mo<strong>de</strong>lo <strong>de</strong><br />

principal-agente com o conceito <strong>de</strong> equilíbrio Nash-Bayesiano.<br />

Mecanismo é um jogo: especifica as estratégias possíveis e os payoffs.<br />

Mecanismo direto é aquele que simplesmente pergunta ao agente<br />

para revelar a sua informação priva<strong>da</strong>.<br />

Estratégias disponíveis são simplesmente reportar sobre o seu tipo.<br />

Se for ótimo (ENB) para um jogador revelar a ver<strong>da</strong><strong>de</strong>, tal<br />

mecanismo é chamado <strong>de</strong> incentivo-compatível.<br />

O teorema do princípio <strong>da</strong> revelação diz que se po<strong>de</strong> restringir a<br />

busca do mecanismo ótimo para aqueles que sejam diretos<br />

(pergunta o tipo) e incentivo-compatível (revelador <strong>da</strong> ver<strong>da</strong><strong>de</strong>).<br />

Prova-se que não há per<strong>da</strong> <strong>de</strong> payoff ao <strong>de</strong>scartar os mecanismos<br />

que não aten<strong>da</strong>m ao princípio <strong>da</strong> revelação.<br />

O link com jogos Bayesianos é <strong>de</strong>vido a Myerson (1979):<br />

Princípio <strong>da</strong> Revelação II: Qualquer equilíbrio Nash-Bayesiano<br />

(ENB) <strong>de</strong> qualquer jogo Bayesiano, po<strong>de</strong> ser representado por um<br />

mecanismo direto incentivo-compatível.<br />

Ex.: Incentivos para Gerentes em Corporações<br />

Exemplo simples <strong>de</strong> mecanismo incentivando tanto<br />

revelar a ver<strong>da</strong><strong>de</strong> sobre a meta factível <strong>de</strong> produção<br />

(Q f ), como maior empenho <strong>da</strong><strong>da</strong> a meta.<br />

Um bônus baseado no nível <strong>de</strong> produção Q incentiva maior<br />

empenho, mas incentiva mais os gerentes <strong>de</strong> UNs maiores e<br />

<strong>de</strong>sestimula gerentes <strong>de</strong> UNs menores.<br />

Também bônus baseado na diferença Q − Q f estimula os<br />

gerentes a reportarem valores baixos para Q f .<br />

Weitzman (1976) propõe o seguinte mecanismo para<br />

induzir os gerentes a reportarem a ver<strong>da</strong><strong>de</strong> sobre Q f e ao<br />

mesmo tempo induzir esforço para aumentar Q:<br />

Bônus B = β Q f<br />

+ α (Q − Q f<br />

) se Q > Q f<br />

e<br />

B = β Q f<br />

− γ (Q f<br />

− Q) se Q ≤ Q f<br />

On<strong>de</strong>: γ > β > α > 0<br />

40


Incentivos para Gerentes em Corporações<br />

Vejamos um exemplo numérico (Pindyck & Rubinfeld, 1995,<br />

Microeconomics, pp.613-616), com γ = 0,5 ; β = 0,3 ; α = 0,2.<br />

Assuma que a ver<strong>da</strong><strong>de</strong>ira meta factível é Q f = 20.000 uni<strong>da</strong><strong>de</strong>s.<br />

Bônus<br />

($/ano)<br />

B = 0,3 Q f + 0,2 (Q − Q f ) se Q > Q f<br />

B = 0,3 Q f − 0,5 (Q f − Q) se<br />

Q ≤ Q f<br />

Q f<br />

= 30.000<br />

9.000 Q f<br />

= 20.000<br />

Q f<br />

= 10.000<br />

6.000<br />

3.000<br />

$6.000 é o nível que a se<strong>de</strong> quer pagar<br />

Resultado: bônus obe<strong>de</strong>ce<br />

o princípio <strong>da</strong> revelação<br />

(dizer a ver<strong>da</strong><strong>de</strong> sobre Q f<br />

é<br />

ótimo) e tem incentivo para<br />

aumentar a produção Q<br />

10.000 20.000 30.000 40.000<br />

Produção Q (uni<strong>da</strong><strong>de</strong>s/ano)<br />

Introdução à <strong>Teoria</strong> <strong>dos</strong> Leilões<br />

Do ponto <strong>de</strong> vista <strong>de</strong> mo<strong>de</strong>lagem, a teoria <strong>dos</strong> leilões<br />

po<strong>de</strong> ser vista como uma aplicação <strong>da</strong> teoria <strong>de</strong> <strong>de</strong>senho<br />

<strong>de</strong> mecanismos ou <strong>de</strong> jogos Bayesianos.<br />

Leilão po<strong>de</strong> ser visto como um mecanismo <strong>de</strong> mercado<br />

para equilibrar oferta e <strong>de</strong>man<strong>da</strong> (market clearing mec.).<br />

Outros mecanismos incluem a ven<strong>da</strong> a preço fixo (ex.: loja<br />

comum) e barganha (ex.: na ven<strong>da</strong> <strong>de</strong> uma casa, se barganha a<br />

diferença <strong>de</strong> valor p/ o comprador e o valor p/ o ven<strong>de</strong>dor).<br />

Leilão é mais flexível que a ven<strong>da</strong> a preço fixo e talvez consuma<br />

menos tempo que a barganha, mas não garante o maior preço.<br />

Leilão: regras <strong>de</strong> formação <strong>de</strong> preço são explícitas e conheci<strong>da</strong>s.<br />

Leilões são usa<strong>dos</strong> para produtos em que não existe mercado<br />

estabelecido. Exs.: objetos raros, privatizações, carros usa<strong>dos</strong>…<br />

São usa<strong>dos</strong> porque o ven<strong>de</strong>dor está incerto sobre o preço <strong>de</strong> ven<strong>da</strong>.<br />

Geralmente quem estabelece as regras do leilão é o<br />

ven<strong>de</strong>dor, que está incerto sobre o preço do objeto.<br />

Há informação incompleta para o leiloeiro e para os “bid<strong>de</strong>rs”.<br />

41


Leilões: Motivação e Conceitos Básicos<br />

A essência <strong>de</strong> qualquer situação <strong>de</strong> leilão é que os<br />

compradores valoram o bem <strong>de</strong> forma diferente:<br />

Seja porque eles têm valores priva<strong>dos</strong> diferentes (ex.: mercado<br />

<strong>de</strong> arte, colecionador versus mero admirador) ou porque eles<br />

têm estimativas diferentes do valor inter<strong>de</strong>pen<strong>de</strong>nte do bem<br />

(ex.: áreas para exploração <strong>de</strong> petróleo, as firmas têm<br />

diferentes estimativas <strong>de</strong> probabilid. <strong>de</strong> sucesso, volume, etc.),<br />

mas to<strong>dos</strong> ven<strong>de</strong>riam petróleo ao mesmo valor <strong>de</strong> mercado.<br />

Valor comum é um caso especial <strong>de</strong> valor inter<strong>de</strong>pen<strong>de</strong>nte<br />

<br />

Muitas situações <strong>da</strong> economia tb. po<strong>de</strong>m ser mo<strong>de</strong>la<strong>da</strong>s<br />

como leilões. Ex.: as aquisições (“takeovers”) <strong>de</strong> firmas:<br />

Dois tipos <strong>de</strong> takeover: (a) disciplinar, pois a firma estaria mal<br />

administra<strong>da</strong> e a firma po<strong>de</strong> se valorizar com novos gerentes;<br />

(b) sinergético, em que a firma compradora teria benefícios<br />

específicos com a junção <strong>da</strong>s firmas. No caso disciplinar temos<br />

valor comum e no caso sinergético temos valor privado.<br />

Formatos ou Tipos <strong>de</strong> Leilões<br />

Os leilões po<strong>de</strong>m ser classifica<strong>dos</strong> <strong>de</strong> diversas maneiras.<br />

Po<strong>de</strong>m ser abertos (lances públicos, oral ou não) ou sela<strong>dos</strong>.<br />

Leilões abertos po<strong>de</strong>m ser com preços ascen<strong>de</strong>ntes (inglês, o<br />

mais popular) ou com preços <strong>de</strong>scen<strong>de</strong>ntes (holandês).<br />

Leilões fecha<strong>dos</strong> (sela<strong>dos</strong>) <strong>de</strong> primeiro preço e <strong>de</strong> segundo preço.<br />

Leilões <strong>de</strong> objeto único ou <strong>de</strong> múltiplos objetos.<br />

Leilões <strong>de</strong> primeiro preço (ou 1 o lance), o mais alto lance (bid)<br />

ganha o bem e paga o seu bid. Leilões <strong>de</strong> 2 o preço (lance) o<br />

preço mais alto também ganha, mas só paga o 2 o maior bid.<br />

O leilão <strong>de</strong> 2º lance (ou <strong>de</strong> Vickrey) tem sido usado, por ex.,<br />

para ven<strong>da</strong> <strong>de</strong> manuscritos antigos pelo Antebellum Covers.<br />

Outro tipo <strong>de</strong> leilão é o leilão em que to<strong>dos</strong> pagam (“all-pay<br />

auction”). Usado para mo<strong>de</strong>lar situações tais como: disputa<br />

por me<strong>da</strong>lha <strong>de</strong> ouro nas olimpía<strong>da</strong>s; eleições; lobbies, etc.<br />

Nem sempre o leiloeiro consegue a maior receita. Ver ex. em:<br />

http://isc.temple.edu/economics/Econ_92/Game%20Hwk/Auctions/hwk11-auctions.htm<br />

42


Estratégias Ótimas do Comprador<br />

A <strong>de</strong>cisão <strong>de</strong> quanto oferecer (“bi<strong>da</strong>r”) num leilão é uma<br />

<strong>de</strong>cisão sob incerteza. Em alguns casos é bem simples:<br />

No leilão aberto inglês, se você tem um valor privado = v, então<br />

a regra é permanecer no leilão enquanto o último lance b ≤ v.<br />

Nesse caso sua estratégia ótima in<strong>de</strong>pen<strong>de</strong> <strong>da</strong>s estratégias <strong>dos</strong><br />

outros jogadores: não é necessário estimar os planos <strong>dos</strong> rivais.<br />

No leilão selado <strong>de</strong> 2º lance, veremos que é ótimo <strong>da</strong>r um lance<br />

igual ao seu valor privado (b = v), já que se ganhar paga ≤ v.<br />

O caso <strong>de</strong> leilão selado <strong>de</strong> 1º lance não é tão simples:<br />

O melhor seria ganhar o leilão com lance b < v, mas pagando o<br />

mínimo possível: b apenas um pouco maior que o 2º maior bid.<br />

Se <strong>de</strong>r um lance muito baixo, a chance <strong>de</strong> ganhar diminui; se<br />

<strong>de</strong>r um lance muito alto, o payoff v – b é pequeno se ganhar.<br />

Estratégia ótima: escolha b <strong>de</strong> forma a maximizar o payoff<br />

esperado = probabilid. <strong>de</strong> vencer x payoff se vencer (= v – b).<br />

Regra prática: presuma que você tem a maior valoração,<br />

estime a 2ª maior valoração (v 2 ) e dê um lance b = v 2 .<br />

Vickrey: Leilão <strong>de</strong> Segundo Maior Lance<br />

Num leilão <strong>de</strong> valor privado, ca<strong>da</strong> pessoa (tipo) avalia o bem<br />

<strong>de</strong> forma diferente (e ninguém quer pagar mais do que vale).<br />

Leilãoselado<strong>de</strong> segundo lance: ganha o envelope com o<br />

maior lance, mas só paga o valor do segundo maior lance.<br />

Vickrey em 1961 (logo, antes <strong>de</strong> Harsanyi em 1967/8<br />

formular o equilíbrio Bayesiano, consi<strong>de</strong>rar tipos, etc.)<br />

mostrou as estratégias ótimas para esse leilão:<br />

Vickrey mostrou que <strong>da</strong>r um lance igual a quanto vale o bem para<br />

ca<strong>da</strong> tipo éumaestratégia dominante e in<strong>de</strong>pen<strong>de</strong> do tipo.<br />

Será ótimo p/ to<strong>dos</strong> os jogadores revelar quanto realmente vale o bem p/<br />

ca<strong>da</strong> um (ca<strong>da</strong> tipo irá <strong>da</strong>r um lance diferente) e ganha quem acreditar<br />

que o bem é mais valioso. Ou seja, será ótimo “bi<strong>da</strong>r” seu próprio valor.<br />

Portanto, o leilão <strong>de</strong> 2º lance aten<strong>de</strong> ao princípio <strong>da</strong> revelação.<br />

Logo, esse leilão incentiva ca<strong>da</strong> tipo a dizer a ver<strong>da</strong><strong>de</strong> sobre o valor<br />

do bem e ganha quem mais está interessado no bem (é eficiente).<br />

Com muitos tipos participando do leilão, no limite, o leiloeiro conseguiria<br />

ven<strong>de</strong>r o bem pelo valor máximo (menos δ) do tipo com maior avaliação.<br />

43


Vickrey: Leilão <strong>de</strong> Segundo Maior Lance<br />

Vamos mostrar que é ótimo para ca<strong>da</strong> pessoa (tipo) <strong>da</strong>r o lance<br />

exatamente igual a quanto vale para ela.<br />

Suponha que o objeto valha V θ para o tipo θ.<br />

Será que existe algum incentivo para <strong>da</strong>r um lance maior ou menor?<br />

Se o tipo θ <strong>de</strong>r um lance V + > V θ então se ele ganhar o objeto (isto é, se V + ><br />

V 2 on<strong>de</strong> V 2 éo segundo maior lance) po<strong>de</strong>m ocorrer dois cenários:<br />

V θ<br />

V 2 V 2<br />

V +<br />

Se V 2 < V θ<br />

então ele obtém a mesma utili<strong>da</strong><strong>de</strong> V θ<br />

− V 2<br />

tanto com lance V + como V θ<br />

Se V + > V 2 > V θ<br />

então ele obtém utili<strong>da</strong><strong>de</strong> negativa V θ<br />

− V 2<br />

com o lance V + e assim<br />

ele estaria pior se <strong>de</strong>sviando <strong>de</strong> V θ<br />

. Logo ele não tem incentivo para <strong>de</strong>sviar e jogar V +<br />

Se o tipo θ <strong>de</strong>r um lance V − < V θ então po<strong>de</strong>m ocorrer dois cenários:<br />

V 2<br />

V −<br />

V 2<br />

V θ<br />

Se V 2 < V − então ele obtém a mesma utili<strong>da</strong><strong>de</strong> V θ<br />

− V 2<br />

tanto com lance V − como V θ<br />

Se V − < V 2 < V θ<br />

então ele não ganharia o objeto e estaria pior jogando V − pois ele<br />

po<strong>de</strong>ria ganhar com V θ<br />

e obter utili<strong>da</strong><strong>de</strong> positiva. Logo não há incentivo para jogar V −<br />

Logo, jogar o seu valor V θ é equilíbrio separador dominante (Nash-Bayesiano).<br />

MATERIAL<br />

ANEXO<br />

Os anexos nos materiais do curso contém sli<strong>de</strong>s que<br />

reforçam os conceitos teóricos e/ou apresentam<br />

exemplos adicionais que não serão discuti<strong>dos</strong> em<br />

sala <strong>de</strong> aula, mas que po<strong>de</strong>m ser úteis para um<br />

melhor entendimento <strong>de</strong> conceitos apresenta<strong>dos</strong>.<br />

44


Websites Úteis<br />

Existem muitos websites com materiais <strong>de</strong> teoria <strong>dos</strong> jogos.<br />

Dois websites muito ricos em materiais e informação são:<br />

http://www.gametheory.net/<br />

http://plato.stanford.edu/entries/game-theory/<br />

Experiência do professor em teoria <strong>dos</strong> jogos e jogos <strong>de</strong> OR:<br />

Paper pioneiro em jogos <strong>de</strong> opções reais (1997, Dallas, EUA):<br />

1º jogo <strong>de</strong> OR <strong>de</strong> guerra <strong>de</strong> atrito; 1º jogo <strong>de</strong> OR em petróleo).<br />

Mais dois papers (esses com o Prof. José Paulo) em jogos <strong>de</strong><br />

OR, sendo um recém publicado e outro aceito para publicação.<br />

Tese <strong>de</strong> doutorado: capítulo <strong>de</strong> jogos <strong>de</strong> OR. Ver capítulo 4 (e<br />

aplicação no capítulo 5) do arquivo <strong>da</strong> tese em:<br />

http://www.puc-rio.br/marco.ind/pdf/tese_doutor_marco_dias.pdf<br />

Ministra curso <strong>de</strong> teoria <strong>dos</strong> jogos na Petrobras também, além <strong>de</strong><br />

usar em aplicações <strong>de</strong> teoria <strong>de</strong> jogos em parceiras <strong>da</strong> Petrobras.<br />

Competição Imperfeita e <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

A ferramenta neo-clássica para análise <strong>de</strong> competição<br />

imperfeita éa teoria <strong>dos</strong> jogos (“game theory”).<br />

A teoria <strong>dos</strong> jogos ganhou o Nobel <strong>de</strong> Economia em 1994 com<br />

Nash (equilíbrio básico), Harsanyi (equilíbrio com informação<br />

incompleta) e Selten (equilíbrio perfeito em jogos dinâmicos).<br />

Ganhou <strong>de</strong> novo em 2005 com Aumann (jogos repeti<strong>dos</strong> e<br />

cooperação) e Schelling (teoria do conflito e do “commitment”).<br />

Aplicações <strong>da</strong> teoria <strong>dos</strong> jogos também ganharam o Nobel em<br />

1996 (teoria <strong>dos</strong> incentivos com informação assimétrica) com<br />

Mirrlees e Vickrey; em 2001 (teor. <strong>de</strong> merca<strong>dos</strong> com informação<br />

assimétrica) com Akerlof, Spence e Stiglitz; e em 2007 (teoria <strong>de</strong><br />

<strong>de</strong>senho <strong>de</strong> mecanismos) com Hurwicz, Maskin e Myerson.<br />

A teoria <strong>dos</strong> jogos também permite analisar interações<br />

estratégicas <strong>de</strong> cooperação entre as firmas.<br />

Do ponto <strong>de</strong> vista <strong>da</strong> firma, a teoria <strong>dos</strong> jogos permite<br />

mo<strong>de</strong>lar <strong>de</strong> forma endógena os efeitos <strong>da</strong> competição e<br />

<strong>da</strong>s oportuni<strong>da</strong><strong>de</strong>s <strong>de</strong> cooperação.<br />

45


História Resumi<strong>da</strong> <strong>da</strong> <strong>Teoria</strong> <strong>dos</strong> <strong>Jogos</strong><br />

Veremos <strong>de</strong> forma resumi<strong>da</strong> os principais fatos históricos.<br />

Em 1913, Zermelo estabelece o 1º teorema <strong>da</strong> teoria <strong>dos</strong> jogos;<br />

Déca<strong>da</strong> <strong>de</strong> 20: Borel, formulação <strong>de</strong> estratégias mistas e solução<br />

minimax; John von Neumann provou o famoso teorema minimax.<br />

1944: von Neumann & Morgenstern publicam o 1º livro <strong>de</strong> T. <strong>dos</strong> J.<br />

1950-1953: Nash publica seus famosos artigos, com os conceitos <strong>de</strong><br />

equilíbrio <strong>de</strong> Nash em jogos não-cooperativos e a solução <strong>de</strong> Nash em<br />

jogos cooper. <strong>de</strong> barganha. Inicia a era mo<strong>de</strong>rna <strong>da</strong> teoria <strong>dos</strong> jogos.<br />

1960: Schelling publica seu famoso livro “The Strategy of Conflict”.<br />

1965: Selten publica o paper sobre equilíbrio perfeito em sub-jogos.<br />

1967-68: Harsanyi publica artigos sobre equilíbrio Nash-Bayesiano.<br />

1972: Maynard Smith publica artigo sobre eq. evolucionário estável.<br />

1994: Prêmio Nobel em Economia para Nash, Selten e Harsanyi.<br />

2005: Prêmio Nobel em Economia para Aumann e Schelling.<br />

2007: Prêmio Nobel em Economia p/ Hurwicz, Maskin e Myerson.<br />

Para muito mais <strong>de</strong>talhes históricos, ver na internet:<br />

http://www.econ.canterbury.ac.nz/personal_pages/paul_walker/gt/hist.htm<br />

Forma Normal x Forma Extensiva<br />

Duas formas extensivas po<strong>de</strong>m ter a mesma forma normal. Exemplo:<br />

Firma 1<br />

A<br />

B<br />

(1; 2)<br />

Firma 2<br />

C<br />

D<br />

(3; 1)<br />

(2; 4)<br />

A<br />

B<br />

C<br />

D<br />

1; 2 1; 2<br />

3; 1 2; 4<br />

Reta traceja<strong>da</strong>:<br />

firma 2 não sabe<br />

em que nó está.<br />

Firma 1<br />

A<br />

B<br />

Firma 2<br />

Firma 2<br />

C (1; 2) Note que os jogos são diferentes:<br />

na árvore <strong>de</strong> cima o jogador 2<br />

sabe o que o jogador 1 jogou.<br />

D Precisamos <strong>da</strong> forma extensiva.<br />

(1; 2)<br />

●Na árvore <strong>de</strong> baixo eu estou<br />

(3; 1)<br />

C<br />

usando uma reta traceja<strong>da</strong> para<br />

dizer que o jogador 2 não sabe em<br />

D<br />

que nó está (conjunto <strong>de</strong><br />

(2; 4) informação com dois nós).<br />

46


Dilema <strong>dos</strong> Prisioneiros: Exemplos<br />

A Tragédia <strong>dos</strong> Comuns (Hume, 1739): dois pescadores e um<br />

único lago têm incentivo <strong>de</strong> fazer pesca pre<strong>da</strong>tória, embora o<br />

melhor para ambos (Pareto ótimo) seja a pescaria leve:<br />

Pescador 1<br />

Estratégias<br />

Pescaria Leve<br />

Pescaria Intensa<br />

Pescador 2<br />

Pescaria Leve Pescaria Intensa<br />

32, 32<br />

28, 35<br />

35, 28 30, 30<br />

Se os ci<strong>da</strong>dões respon<strong>de</strong>rem só a incentivos priva<strong>dos</strong>, os recursos<br />

públicos serão <strong>de</strong>masia<strong>da</strong>mente <strong>de</strong>pleta<strong>dos</strong>. Além disso, os bens<br />

públicos não serão provi<strong>dos</strong> (ver a seguir) e isso justifica os impostos.<br />

Bens Públicos: contribuição para uma construir uma ponte:<br />

ninguém contribui se for opcional (que é pior para ambos).<br />

Contribuinte 1<br />

Estratégias<br />

Contribui<br />

Não Contribui<br />

Contribuinte 2<br />

Contribui Não Contribui<br />

32, 32<br />

28, 35<br />

35, 28 30, 30<br />

Características e Nomes <strong>da</strong>s Estratégias<br />

Contribuinte 1<br />

Estratégias<br />

Contribui<br />

Não Contribui<br />

Contribui<br />

Contribuinte 2<br />

Não Contribui<br />

Dominância <strong>de</strong> Pareto: nenhum jogador está pior e pelo menos um<br />

está melhor. Ex.: (32, 32) Pareto domina (30, 30).<br />

(35, 28) domina (30, 30)? Não, pois 28 < 30.<br />

(32, 32), (28, 35) e (35, 28) são ditos Pareto Ótimo, pois só se po<strong>de</strong><br />

melhorar o valor <strong>de</strong> um às custas do prejuízo do outro.<br />

Desses o mais eficiente (maior ganho conjunto) é o (32, 32) que soma 64.<br />

Free Ri<strong>de</strong>r (benefício grátis): No caso <strong>de</strong> (35, 28), dizemos que o<br />

contribuinte 1 está sendo um free ri<strong>de</strong>r, pois tem o benefício <strong>da</strong> ponte<br />

mas na<strong>da</strong> paga por ela.<br />

Externali<strong>da</strong><strong>de</strong> Negativa: o jogador 1 passando <strong>de</strong> pagante para nãopagante<br />

gera uma externali<strong>da</strong><strong>de</strong> negativa para o jogador 2, pois<br />

reduz o valor do jogador 2, que arcará com uma maior contribuição.<br />

Conflito individual x social. Sonegadores prejudicam os pagantes.<br />

32, 32<br />

28, 35<br />

35, 28 30, 30<br />

47


A Tragédia <strong>dos</strong> Comuns<br />

Esse clássico <strong>da</strong> sociologia (Hume, 1739) é um caso<br />

particular do dilema <strong>dos</strong> prisioneiros. Mostra o seguinte:<br />

Se o “bolo” é comum, as pessoas (a maioria) são incentiva<strong>da</strong>s a<br />

contribuirem o mínimo possível e a tirarem o máximo proveito.<br />

Caso clássico: a colônia <strong>de</strong> Plymouth (EUA, 1621) assinou um<br />

contrato coletivo em que to<strong>da</strong> a produção era comum e entregue<br />

para armazenamento comunitário, sendo que ca<strong>da</strong> indivíduo<br />

receberia uma fração igual, não importando a sua contribuição.<br />

O resultado foi que a produção era insuficiente até para consumo<br />

próprio: faltava comi<strong>da</strong>, mas sobrava ócio e acomo<strong>da</strong>ção. Os<br />

homens lamentavam ter <strong>de</strong> “trabalhar para a esposa e filho <strong>dos</strong><br />

outros”, sem ter recompensa. A experiência foi um fracasso.<br />

Dois anos <strong>de</strong>pois foi <strong>de</strong>sfeito o contrato, ca<strong>da</strong> família obteve a sua<br />

própria terra e a comuni<strong>da</strong><strong>de</strong> teve estímulo e progrediu.<br />

Como já dizia Aristóteles: “Aquilo que é comum ao maior<br />

número <strong>de</strong>spertará sobre si os menores cui<strong>da</strong><strong>dos</strong>”.<br />

Ver artigo “A Tragédia <strong>dos</strong> Comuns” <strong>de</strong> João Mauad (O Globo,<br />

julho <strong>de</strong> 2009) na pasta 72, para <strong>de</strong>talhes.<br />

Competição com Projetos <strong>de</strong> P&D<br />

Mesmo com apenas duas firmas no mercado<br />

(duopólio), a competição po<strong>de</strong> ser muito intensa.<br />

Em indústrias maduras, é freqüente a competição em<br />

preços através <strong>de</strong> inovações <strong>de</strong> redução <strong>de</strong> custo.<br />

O gasto em P&D para reduzir custos po<strong>de</strong> não ser Pareto<br />

ótimo para as firmas, mas freqüentemente é a estratégia<br />

dominante para ambas as firmas (dilema <strong>dos</strong> prisioneiros):<br />

Firma 1<br />

P&D<br />

Não-P&D<br />

P&D<br />

20 ; 10 40 ; −10<br />

−10 ; 30<br />

Firma 2<br />

Não-P&D<br />

30 ; 20<br />

A estratégia <strong>de</strong> P&D nesse<br />

contexto cria barreiras <strong>de</strong><br />

entra<strong>da</strong> para novas firmas<br />

interessa<strong>da</strong>s nesse mercado.<br />

Ocorre mais se a <strong>de</strong>man<strong>da</strong><br />

é mais elástica com o preço.<br />

Uma alternativa ao P&D<br />

(não analisa<strong>da</strong>) é reduzir<br />

custos com ganhos <strong>de</strong> escala.<br />

48


Equil. <strong>de</strong> Nash: Jogo Batalha <strong>dos</strong> Sexos<br />

Uma versão do jogo clássico <strong>da</strong> batalha <strong>dos</strong> sexos é:<br />

Um casal tem <strong>de</strong> <strong>de</strong>cidir o que fazer na sexta-feira à noite.<br />

Eles concor<strong>da</strong>m em ir ao cinema, mas ele prefere assistir<br />

um filme <strong>de</strong> ação e ela prefere assistir um romance.<br />

Ir ao cinema sozinho é o pior resultado (menor utili<strong>da</strong><strong>de</strong>).<br />

As utili<strong>da</strong><strong>de</strong>s são mostra<strong>da</strong>s abaixo. Quais os EN do jogo?<br />

ELE<br />

Dica: ver as melhores respostas simultâneas <strong>dos</strong> jogadores.<br />

ELA<br />

Resposta:<br />

Ação Romance Os EN em estratégias puras<br />

são dois: {ação; ação} e<br />

Ação 2; 1 0; 0<br />

{romance; romance}. Tem<br />

um EN em estratég. mistas<br />

que é jogar uma estratégia<br />

com probabili<strong>da</strong><strong>de</strong> <strong>de</strong> 2/3<br />

Romance 0; 0 1; 2 e a outra com prob. 1/3.<br />

Ver sli<strong>de</strong>s seguintes.<br />

Batalha <strong>dos</strong> Sexos: Solução em Est. Mistas<br />

Sejam π 1<br />

e π 2<br />

as probabili<strong>da</strong><strong>de</strong>s com que ele e ela,<br />

respectivamente, escolhem “filme <strong>de</strong> ação”.<br />

O payoff esperado <strong>de</strong>le (Payoff 1<br />

) será <strong>da</strong>do por:<br />

2 π 1<br />

π 2<br />

+(1−π 1<br />

) (1 −π 2<br />

)=π 1<br />

(3 π 2<br />

− 1) +1−π 2<br />

O payoff esperado <strong>de</strong>la (Payoff 2<br />

) será <strong>da</strong>do por:<br />

π 1<br />

π 2<br />

+2(1−π 1<br />

) (1 −π 2<br />

) = π 2<br />

(3 π 1<br />

− 2) +2 (1−π 1<br />

)<br />

Curvas <strong>de</strong> reação <strong>da</strong>s firmas 1 e 2 (<strong>de</strong>riva e faz = 0):<br />

∂Payoff 1 /∂ π 1 = 0 = 3 π 2 − 1 ⇒ π 2 = 1/3 ⇒ qualquer π 1 éótimose π 2 = 1/3<br />

Se ela joga π 2 < 1/3, por ex. π 2 = 0, Payoff 1 = 1 − π 1 ⇒ ótimo: π 1 = 0;<br />

Se ela joga π 2 > 1/3, por ex. π 2 = 1, Payoff 1 = 2 π 1 ⇒ ótimo 1 : π 1 = 1, etc.<br />

⎧ 0 caso π 1<br />

2<br />

<<br />

3<br />

⎪<br />

π<br />

1<br />

1<br />

= ⎨qualquer valor entre 0 e 1 caso π<br />

2<br />

=<br />

3<br />

⎪<br />

⎪1 caso π 1<br />

2<br />

><br />

⎩<br />

3<br />

⎧ 0 caso π 2<br />

1<br />

<<br />

3<br />

⎪<br />

π<br />

2<br />

2<br />

= ⎨qualquer valor entre 0 e 1 caso π1<br />

=<br />

3<br />

⎪<br />

⎪1 caso π 2<br />

1<br />

><br />

⎩<br />

3<br />

49


Batalha <strong>dos</strong> Sexos: EN em Estratégias Mistas<br />

π 2<br />

1<br />

Equilíbrios<br />

<strong>de</strong> Nash com<br />

estratégias<br />

puras<br />

1/3<br />

Curva <strong>de</strong> reação <strong>de</strong>la<br />

Repare que as curvas <strong>de</strong><br />

reação não são funções.<br />

Elas são correspondências.<br />

Curva <strong>de</strong> reação <strong>de</strong>le<br />

Equilíbrio <strong>de</strong> Nash<br />

com estratégias<br />

mistas.<br />

2/3 1<br />

Equilíbrios em estratégias mistas: três, sendo um não-<strong>de</strong>generado,<br />

que é ele jogar “ação” com 2/3 <strong>de</strong> probabili<strong>da</strong><strong>de</strong>; e ela jogar<br />

“ação” com 1/3 <strong>de</strong> probabili<strong>da</strong><strong>de</strong> (⇒ ela joga “romance” com 2/3).<br />

Esse caso resulta: {ação; ação} tem probab. 2/3 x 1/3 = 2/9 <strong>de</strong> ocorrer;<br />

{romance; romance} tem 1/3 x 2/3 = 2/9; e irem sozinhos, probab. = 5/9.<br />

π 1<br />

Tópicos em EN em Estratégias Mistas<br />

O valor <strong>de</strong> uma estratégia mista é o valor esperado <strong>dos</strong><br />

“payoffs” <strong>da</strong>s relevantes estratégias puras randomiza<strong>da</strong>s.<br />

As probabili<strong>da</strong><strong>de</strong>s <strong>da</strong>s estratégias mistas são resulta<strong>dos</strong> <strong>da</strong> análise<br />

<strong>de</strong> equilíbrio. Elas não são exógenas (estimativas <strong>de</strong> esta<strong>dos</strong> <strong>da</strong><br />

natureza) e nem advin<strong>da</strong>s <strong>de</strong> preferências <strong>dos</strong> jogadores.<br />

Elas foram calcula<strong>da</strong>s maximizando payoffs simultaneamente.<br />

Essas probabs. são tais que fazem o outro jogador ficar indiferente<br />

entre jogar as suas diferentes estratégias puras relevantes.<br />

Nem sempre as probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> estratégias mistas são intuitivas<br />

já que não refletem características individuais e sim estratégicas.<br />

A análise gráfica anterior é viável para o caso <strong>de</strong> dois jogadores<br />

com duas estratégias ca<strong>da</strong>. Mas po<strong>de</strong>-se usar méto<strong>dos</strong> analítico ou<br />

numéricos p/ obter os pontos fixos <strong>de</strong> melhor resposta simultânea.<br />

Se há múltiplos EN em estrat. puras ⇒ há EN em estrat. mistas<br />

com a randomização <strong>dos</strong> EN em estratégias puras.<br />

Nesse exemplo tivemos três equilíbrios <strong>de</strong> Nash (EN).<br />

Múltiplos EN: qual <strong>de</strong>les é o mais provável ou recomendável?<br />

Veremos alguns refinamentos <strong>de</strong> EN que reduz o n o <strong>de</strong> equilíbrios.<br />

50


Exercício sobre Estratégias Mistas<br />

Mostre que o jogo do par ou ímpar com disputa <strong>de</strong> 1 R$<br />

(ver início <strong>da</strong> parte 1) tem apenas um único EN em<br />

estratégias mistas que é jogar σ* = (1/2 ; 1/2), on<strong>de</strong> o 1 o<br />

termo é a probabili<strong>da</strong><strong>de</strong> do 1 o jogador jogar um n o par e<br />

o 2 o termo é a probabili<strong>da</strong><strong>de</strong> do 2 o jogador jogar n o par.<br />

Verifique que o EN em estratégias mistas não-<strong>de</strong>genera<strong>da</strong>s tem<br />

a proprie<strong>da</strong><strong>de</strong> <strong>de</strong> fazer o outro jogador ficar indiferente entre<br />

o que jogar.<br />

Dica: siga os passos do jogo Batalha <strong>dos</strong> Sexos. Verificar que só<br />

existe um ponto <strong>de</strong> cruzamento nas correspondências <strong>de</strong> melhor<br />

resposta (cruzamento = simultaneamente melhor resposta).<br />

Mostre que o EN seria exatamente o mesmo (1/2 ; 1/2)<br />

se em vez <strong>de</strong> “disputa por R$ 1” fosse “aposta <strong>de</strong> R$ 1”, i.<br />

é, se nos payoffs on<strong>de</strong> está “zero” fosse “− 1”.<br />

Nesse formato, o jogo do par-ou-ímpar correspon<strong>de</strong> ao jogo <strong>de</strong><br />

soma zero “matching pennies” <strong>dos</strong> livros <strong>da</strong> língua inglesa.<br />

Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />

Esse exemplo (e outro <strong>da</strong> OPEP a ser visto) é retirado do<br />

livro do Dutta (Strategy and Games), publicado em 1999.<br />

Assim, a análise foi feita no contexto <strong>de</strong> baixos preços do<br />

petróleo na déca<strong>da</strong> <strong>de</strong> 90, quando sobrava petróleo no mercado.<br />

Consi<strong>de</strong>re o jogo <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s no mercado <strong>de</strong> petróleo<br />

em que temos dois jogadores: OPEP e Não-OPEP.<br />

É uma aplicação do resultado <strong>de</strong> Cournot. Assuma a seguinte<br />

curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear: P(Q T ) = a – b (Q T ) = a – b (q O + q N )<br />

On<strong>de</strong> q O e q N são as produções <strong>da</strong> OPEP e Não-OPEP, respectivamente.<br />

Note que o parâmetro “a” dá o preço máximo <strong>de</strong>ssa função. No<br />

livro o autor colocou a = 65 ($/bbl) refletindo os baixos preços <strong>da</strong><br />

época (em <strong>de</strong>z/98 o petróleo chegou a ficar abaixo <strong>de</strong> 10 $/bbl).<br />

Ele usou b = 1/3, <strong>de</strong> forma que a <strong>de</strong>man<strong>da</strong> é: P = 65 – 1/3 (q O + q N ).<br />

Assuma que (naquela época) os custos unitários <strong>de</strong> produção <strong>da</strong><br />

OPEP e Não-OPEP são, respectivamente <strong>de</strong> 5 e 10 US$/bbl.<br />

Hoje esses custos seriam bem maiores. Depois iremos colocar<br />

valores mais representativos <strong>da</strong> atuali<strong>da</strong><strong>de</strong> para ver o que ocorre.<br />

51


Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />

Os lucros <strong>dos</strong> dois jogadores (receita – custos oper.) são:<br />

O lucro <strong>da</strong> OPEP é: π O<br />

= q O<br />

[65 – 1/3 (q O<br />

+ q N<br />

)] – 5 q O<br />

;<br />

O lucro Não-OPEP é: π N<br />

= q N<br />

[65 – 1/3 (q O<br />

+ q N<br />

)] – 10 q N<br />

As curvas <strong>de</strong> reação (melhor resposta) são obti<strong>da</strong>s com a CPO<br />

(∂π O<br />

/∂q O<br />

= 0; e ∂π N<br />

/∂q N<br />

= 0) p/ maximizar esses lucros e são:<br />

* 180 − qN<br />

q<br />

O(q N) =<br />

se qN<br />

≤ 180 (e zero caso contrário)<br />

2<br />

* 165 − qO<br />

q<br />

N(q O) =<br />

se qO<br />

≤ 165 (e zero caso contrário)<br />

2<br />

O cruzamento <strong>de</strong>ssas curvas (retas) – ou substituindo<br />

uma na outra – chega na solução <strong>de</strong> Nash-Cournot.<br />

Com a solução q* O e q* N , é fácil obter o preço e os lucros:<br />

OPEP<br />

Não-OPEP<br />

Quanti<strong>da</strong><strong>de</strong>s<br />

65 (MM bbl/d)<br />

50 (MM bbl/d)<br />

Preço (US$/bbl)<br />

26,67<br />

26,67<br />

Lucro (MM $/d)<br />

1.408,3<br />

833,3<br />

Exemplo <strong>de</strong> Cournot: OPEP x Não-OPEP<br />

A planilha jogos <strong>da</strong> OPEP.xls permite (re)calcular o jogo.<br />

Sabemos hoje que os custos subiram muito em relação à<br />

déca<strong>da</strong> <strong>de</strong> 90 (~ 2 a 3 vezes), principalmente os não-OPEP.<br />

Além disso, a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> é muito mais alta e por isso<br />

o preço máximo está muito acima <strong>de</strong> 65 (já bateu em 79).<br />

Vamos re-calcular o jogo usando os <strong>da</strong><strong>dos</strong>: a = 130; b = 1; e<br />

custos marginais unitários c O = 12 $/bbl e c N = 30 $/bbl:<br />

Quanti<strong>da</strong><strong>de</strong>s Preço (US$/bbl) Lucro (MM $/d)<br />

OPEP 45,3 (MM bbl/d) 57,33<br />

2.055<br />

Não-OPEP 27,3 (MM bbl/d) 57,33<br />

747<br />

Embora a soma <strong>da</strong>s produções estejam próximas do ano <strong>de</strong><br />

2007 (~ 72,4 MM bbl/d), estão ~ inverti<strong>da</strong>s as produções.<br />

Existem restrições <strong>de</strong> capaci<strong>da</strong><strong>de</strong> não-consi<strong>de</strong>ra<strong>da</strong>s aqui. Além<br />

disso, só a OPEP tem algum comportamento estratégico. Os<br />

países Não-OPEP se comportam como tomadores <strong>de</strong> preços.<br />

O mo<strong>de</strong>lo <strong>de</strong> Cournot não se a<strong>da</strong>pta bem nesse caso.<br />

52


Deman<strong>da</strong> Residual e o Mercado <strong>de</strong> Petróleo<br />

Em muitos casos po<strong>de</strong>mos analisar o conflito <strong>de</strong> dois<br />

competidores usando análise simplifica<strong>da</strong>.<br />

Imagine o mercado <strong>de</strong> petróleo com os produtores<br />

sendo a firma 1, a firma 2 e o resto do mundo.<br />

Assim, a produção <strong>da</strong> indústria é Q T<br />

= q 1<br />

+ q 2<br />

+ q resto<br />

.<br />

Seja uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear <strong>da</strong><strong>da</strong> por:<br />

p(Q T<br />

) = a – b (Q T<br />

) = a – b (q 1<br />

+ q 2<br />

+ q resto<br />

).<br />

Que po<strong>de</strong> ser re-escrito como uma <strong>de</strong>man<strong>da</strong> residual:<br />

p(Q T<br />

) = (a – b q resto<br />

) – b (q 1<br />

+ q 2<br />

) ⇒<br />

⇒ p(Q T<br />

) = a´ – b (q 1<br />

+ q 2<br />

)<br />

Assim, <strong>de</strong>s<strong>de</strong> que se mantenha a produção do resto do<br />

mundo constante, bastaria ajustar o parâmetro a <strong>da</strong><br />

função <strong>de</strong>man<strong>da</strong>. Mas essa é um abor<strong>da</strong>gem simplifica<strong>da</strong>.<br />

A rigor, se mu<strong>da</strong>r q 1 e/ou q 2 , q resto po<strong>de</strong>ria se ajustar otimamente.<br />

Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />

Seja o seguinte jogo <strong>de</strong> quotas <strong>da</strong> OPEP (planilha<br />

jogos <strong>da</strong> OPEP.xls , aba “quotas”) com <strong>de</strong>man<strong>da</strong> linear<br />

residual <strong>da</strong><strong>da</strong> por p = α − β (q A + q V ), on<strong>de</strong>:<br />

α = 100; β = 5; as produções são q A (Arábia) e q V (Venezuela),<br />

que po<strong>de</strong>m produzir só as cotas ou acima. Sejam os custos<br />

unitários c A = 12 $/bbl (Arábia) e c V = 20 $/bbl (Venezuela).<br />

As cotas estabeleci<strong>da</strong>s são 8 milhões <strong>de</strong> bbl/dia para a Arábia<br />

Saudita e 2 milhões <strong>de</strong> bbl/dia para a Venezuela.<br />

Caso esses países não respeitem as quotas, eles iriam produzir<br />

um montante 25% acima <strong>da</strong>s quotas: 10 MM bbl/d para a<br />

Arábia Saudita e 2,5 MM bbl/d para a Venezuela.<br />

Calcule o EN <strong>de</strong>sse jogo consi<strong>de</strong>rando que a escolha <strong>da</strong><br />

quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> pelos países é simultânea.<br />

Calcule também os preços do petróleo em ca<strong>da</strong> possível resultado.<br />

Se o mercado ficar mais aquecido e a <strong>de</strong>man<strong>da</strong> subir<br />

(fazendo α = 120). Qual o novo EN? Por que mudou?<br />

53


Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />

No primeiro caso, a planilha <strong>de</strong>staca o EN e mostra os<br />

resulta<strong>dos</strong> <strong>de</strong> payoffs (em milhões US$/dia), preços:<br />

Analisando o jogo vemos que ambos os países têm uma<br />

estratégia dominante. A estratégia <strong>da</strong> Arábia Saudita é<br />

sempre cooperar (produzir só as cotas) e a <strong>da</strong> Venezuela<br />

é sempre trair a OPEP (produzir acima <strong>da</strong>s cotas).<br />

Aqui a Arábia sempre coopera por puro interesse próprio!<br />

Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />

No exemplo numérico anterior os preços estiveram na<br />

faixa <strong>de</strong> 37,5 a 50 US$/bbl. Veremos agora o que ocorre<br />

se a <strong>de</strong>man<strong>da</strong> estiver mais aqueci<strong>da</strong> (α = 120):<br />

Vemos que ambos os países têm estratégias dominantes,<br />

mas agora para ambos os países essa estratégia é sempre<br />

não-cooperar (produzir acima <strong>da</strong>s cotas).<br />

Note que obtemos um esquema <strong>de</strong> dilema <strong>dos</strong> prisioneiros: o<br />

melhor para ambos (Pareto ótimo) seria obe<strong>de</strong>cer as quotas!<br />

54


Jogo <strong>de</strong> Cotas <strong>da</strong> OPEP com Dois Países<br />

A mu<strong>da</strong>nça <strong>de</strong> EN ocorreu porque agora, com a maior<br />

<strong>de</strong>man<strong>da</strong> (α = 120), a produção extra obtém preços<br />

maiores e a Arábia passa a ter incentivo <strong>de</strong> não-cooperar.<br />

Como é praxe <strong>de</strong> jogos não-cooperativos, a cooperação po<strong>de</strong><br />

emergir como resultado apenas se for equilíbrio.<br />

Em jogos repeti<strong>dos</strong>, a cooperação <strong>da</strong> OPEP po<strong>de</strong> emergir se os<br />

membros usarem estratégias <strong>de</strong> punição (será visto).<br />

Exercício 1: mostre que para uma <strong>de</strong>man<strong>da</strong> intermediária<br />

com α = 114,5 existem dois EN em estratégias puras.<br />

Exercício 2: seja o caso original (com α = 100, etc.), mas<br />

tendo a Venezuela um custo bem maior c V = 38 $/bbl.<br />

Mostre que nesse caso o único EN é {cooperar ; cooperar} e<br />

esse equilíbrio também é em estratégias dominantes p/ ambos.<br />

⇒ O resultado <strong>de</strong>sse jogo <strong>de</strong>pen<strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong>, custos, etc.<br />

Discutiremos agora mo<strong>de</strong>los <strong>de</strong> escolha ótima <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s<br />

(Cournot) <strong>de</strong> um range contínuo <strong>de</strong> possíveis quanti<strong>da</strong><strong>de</strong>s.<br />

Duopólio <strong>de</strong> Cournot: Caso com Custo Fixo<br />

Seja a função <strong>de</strong>man<strong>da</strong> linear: p(Q T<br />

) = a − b Q T<br />

Seja o caso mais geral <strong>de</strong> custo operacional C i (q i ).<br />

Por simplici<strong>da</strong><strong>de</strong> assuma que ∂ 2 C i /∂q i2 = 0 (função linear, tem<br />

custo variável e um custo fixo constante) e ∂C i /∂q j = 0 p/ i ≠ j (a<br />

produção <strong>da</strong> firma i não influencia o custo <strong>da</strong> firma j).<br />

A CPO e as resultantes curvas <strong>de</strong> reação são <strong>da</strong><strong>da</strong>s por:<br />

O EN-Cournot é o par {q 1 *(q 2 *); q 2 *(q 1 *)} obtido pela<br />

substituição <strong>de</strong> uma curva <strong>de</strong> reação na outra, que dá:<br />

55


Exercícios sobre EN-Cournot<br />

O que ocorre se uma <strong>da</strong>s firmas investe em P&D para<br />

reduzir seus custos a fim <strong>de</strong> ter maior competitivi<strong>da</strong><strong>de</strong><br />

em quanti<strong>da</strong><strong>de</strong>s (Cournot)?<br />

Diga o que ocorreria na curva <strong>de</strong> reação, no lucro <strong>de</strong> ca<strong>da</strong><br />

firma, nas quanti<strong>da</strong><strong>de</strong>s em equilíbrio e no preço.<br />

Resolva o problema anterior sem custo fixo, mas com<br />

custo variável quadrático: c i (q i ) = q i2 .<br />

Resolva agora com o custo variável linear anterior, mas<br />

com custo fixo f i > 0 e com q i > 0.<br />

Dilema <strong>dos</strong> Prisioneiros e <strong>Jogos</strong> Cooperativos<br />

Todo jogo não-cooperativo po<strong>de</strong> ser transformado<br />

num jogo cooperativo (embora nem sempre seja<br />

prático, legal ou ético), com a função característica.<br />

A conversão <strong>de</strong> qualquer jogo não cooperativo com N-<br />

jogadores para a forma <strong>de</strong> coalizão (função característica),<br />

é <strong>de</strong>vido a von-Newman & Morgenstern (1944).<br />

No caso anterior, as coalizões seriam <strong>de</strong> um ou <strong>de</strong><br />

dois jogadores com a seguinte função característica:<br />

C(1) = C(2) = 4; C(1; 2) = 12.<br />

A coalizão <strong>de</strong> só um jogador teria o resultado do jogo nãocooperativo,<br />

que no caso é o mínimo que ca<strong>da</strong> jogador<br />

po<strong>de</strong> receber. A coalizão <strong>de</strong> dois jogadores tem valor igual<br />

ao máximo payoff conjunto que a coalizão po<strong>de</strong> obter.<br />

Nesse caso o maior valor é 6 + 6 = 12 > 10 + 0 > 4 + 4.<br />

Em jogos repeti<strong>dos</strong> a cooperação po<strong>de</strong> emergir como<br />

equilíbrio <strong>de</strong> um jogo não-cooperativo (a ser visto).<br />

56


Forma <strong>de</strong> Coalizão & <strong>Jogos</strong> Cooperativos<br />

Coalizão é quando um grupo <strong>de</strong> jogadores se coor<strong>de</strong>nam<br />

em torno dum objetivo comum visando ter maior po<strong>de</strong>r.<br />

Quando são firmas que <strong>de</strong>viam competir na economia, é ilegal<br />

ou anti-ético e a coalizão é chama<strong>da</strong> <strong>de</strong> colusão coor<strong>de</strong>na<strong>da</strong>.<br />

Em outros contextos (ex.: parti<strong>dos</strong> políticos numa eleição ou<br />

votando uma lei) não é ilegal e (geralmente) nem anti-ético.<br />

<strong>Jogos</strong> cooperativos em forma <strong>de</strong> coalizão se divi<strong>de</strong>m em:<br />

<strong>Jogos</strong> com utili<strong>da</strong><strong>de</strong> transferível (TU), em que existe uma regra<br />

simples qualquer <strong>de</strong> divisão <strong>da</strong> utili<strong>da</strong><strong>de</strong> em ca<strong>da</strong> coalizão S.<br />

Também são chama<strong>dos</strong> <strong>de</strong> jogos com “si<strong>de</strong> payments” (pagamentos<br />

laterais) e são mais simples e mais analisa<strong>dos</strong> do que os jogos NTUs:<br />

<strong>Jogos</strong> com utili<strong>da</strong><strong>de</strong> não-transferível (NTU), em que não existe<br />

uma regra simples <strong>de</strong> divisão <strong>da</strong> utili<strong>da</strong><strong>de</strong> e sim p/ ca<strong>da</strong> S um<br />

vetor s j -dimensional <strong>de</strong> funções payoff p/ ca<strong>da</strong> S com s j players.<br />

Veremos um exemplo simples <strong>de</strong> jogo TU: votação com N = 3<br />

jogadores (= eleitores), para ilustrar a forma <strong>de</strong> coalizão.<br />

<strong>Jogos</strong> Cooperativos TU. Ex: Votação<br />

Seja um jogo eleitoral (cooperat. TU) em que os eleitores<br />

(jogadores) têm várias possibili<strong>da</strong><strong>de</strong>s (candi<strong>da</strong>tos a votar).<br />

Os eleitores po<strong>de</strong>m se associar, i.é, formar coalizões (em torno<br />

dum candi<strong>da</strong>to). Ganha a eleição a coalizão S que tem mais<br />

eleitores. Seja uma eleição com N = 3 eleitores (jogadores).<br />

Seja a função característica C(S), com a normalização:<br />

“Gran<strong>de</strong> coalizão” C(N) = 1. Para ca<strong>da</strong> jogador i, C({i}) = 0.<br />

Além disso, C(S) = 1 se a coalizão S vencer e C(S) = 0 se S per<strong>de</strong>r.<br />

A forma <strong>de</strong> coalizão no jogo TU especifica {N = 3; C(S)}, on<strong>de</strong>:<br />

C(S)<br />

⎧ 0 se # S < 2<br />

= ⎨<br />

⎩ .1 se # S ≥ 2<br />

Esse tipo <strong>de</strong> jogo tem gran<strong>de</strong> relevância em sociologia,<br />

mas menos importância em economia.<br />

Em termos <strong>de</strong> jogos cooperativos, os mais importantes p/<br />

a economia são os jogos <strong>de</strong> barganha cooperativa.<br />

57


Oligopólio e Colusões: Equilíbrio <strong>de</strong> Coalizões<br />

Uma literatura que vem crescendo é a que combina<br />

jogos cooperativos com jogos não-cooperativos.<br />

Nela se discute competição entre coalizões, saí<strong>da</strong>s <strong>de</strong> membros<br />

<strong>de</strong> uma coalizão para entrar em outra (e o que ocorrerá com a<br />

coalizão rejeita<strong>da</strong>) e equilíbrio entre coalizões.<br />

O seguinte exemplo usando o oligopólio <strong>de</strong> Cournot p/ 3<br />

firmas homogêneas é discutido no livro <strong>de</strong> Ray (A Game-<br />

Theoretic Perspective on Coalition Formation, 2007).<br />

Para facilitar a análise, seja K = (a – c) 2 /b. O lucro <strong>da</strong> firma i é:<br />

2<br />

(a − c)<br />

K<br />

π<br />

i<br />

= ⇒ π<br />

2 i<br />

=<br />

2<br />

(N + 1) b ( N + 1)<br />

Sem acordo (sem colusão) o lucro <strong>de</strong> ca<strong>da</strong> uma é <strong>de</strong> π i = K/16.<br />

Se as três firmas entram em colusão (N = 1), o lucro <strong>da</strong><br />

coalizão é π total = K/4. Nesse caso, qualquer que seja a regra <strong>de</strong><br />

divisão <strong>da</strong> colusão, pelo menos uma firma não ganharia mais<br />

do que π i = K/12. Esse valor é maior que sem colusão (K/16).<br />

Oligopólio e Colusões: Equilíbrio <strong>de</strong> Coalizões<br />

Será que existe incentivo para uma firma <strong>de</strong>sviar <strong>da</strong><br />

colusão? Seja o caso <strong>de</strong> uma firma saindo <strong>da</strong> colusão:<br />

Nesse caso é como se tivesse duas firmas no mercado (N = 2), a<br />

firma que <strong>de</strong>sviou (i = 1) e a coalizão <strong>de</strong> duas firmas (j = 2 + 3).<br />

Nesse caso, π 1 = π 2+3 = K/9. Para a firma 1 isso parece atrativo,<br />

pois K/9 > K/12 e assim parece haver incentivo para <strong>de</strong>sviar.<br />

Mas nesse caso pelo menos uma <strong>da</strong>s firmas <strong>da</strong> coalizão <strong>de</strong> duas<br />

firmas teria um lucro não maior do que D/18. Esse valor é<br />

menor do que ela obteria também saindo <strong>da</strong> coalizão (K/16).<br />

Assim, se uma firma <strong>de</strong>ixar a coalizão <strong>de</strong> três firmas, o ótimo será<br />

a quebra total <strong>da</strong> colusão, ficando as três firmas produzindo <strong>de</strong><br />

forma competitiva (separa<strong>da</strong>s) e lucrando ca<strong>da</strong> uma K/16.<br />

Assim, na análise <strong>de</strong> equilíbrio <strong>da</strong> coalizão <strong>de</strong> 3 firmas, não é<br />

ótimo para a firma 1 <strong>de</strong>sviar, pois ela <strong>de</strong>verá antecipar que a<br />

coalizão restante seria <strong>de</strong>sfeita e assim em vez <strong>de</strong> payoff <strong>de</strong><br />

colusão igual a K/12, ela obteria no final apenas K/16.<br />

Logo, a colusão <strong>de</strong> três firmas é estável (coalitional equilibrium).<br />

58


Equilíbrio <strong>de</strong> Coalizões e Função Partição<br />

No exemplo anterior vimos que a função característica é<br />

insuficiente para <strong>de</strong>screver a competição entre coalizões.<br />

No caso <strong>da</strong> coalizão <strong>de</strong> duas firmas temos <strong>de</strong> dizer não só o<br />

payoff <strong>da</strong> coalizão <strong>de</strong> 2 (função característica) como também o<br />

payoff <strong>da</strong> firma que está fora <strong>da</strong> coalizão.<br />

Essa <strong>de</strong>scrição mais completa é chama<strong>da</strong> <strong>de</strong> função partição.<br />

Exercício (livro do Ray, pgs. 18-19, “Bens Públicos”):<br />

Analizar a estabili<strong>da</strong><strong>de</strong> <strong>da</strong>s coalizões e mostre que uma firma<br />

terá incentivo <strong>de</strong> <strong>de</strong>ixar a gran<strong>de</strong> coalizão (<strong>de</strong> 3 firmas), mas as<br />

outras duas firmas não terão incentivos <strong>de</strong> dissolver a coalizão<br />

<strong>de</strong> duas firmas restantes (ao contrário do caso anterior).<br />

A função partição é (ver a<br />

planilha public_goods.xls):<br />

<strong>Jogos</strong> Estritamente Competitivos & Soma Zero<br />

<strong>Jogos</strong> <strong>de</strong> soma fixa (<strong>de</strong> payoffs) são chama<strong>dos</strong> <strong>de</strong> jogos<br />

estritamente competitivos, pois um jogador só aumenta o<br />

seu payoff se houver uma redução no payoff <strong>de</strong> outro.<br />

O resultado <strong>de</strong>sses jogos são sempre Pareto eficiente, pois só se<br />

po<strong>de</strong> melhorar o payoff dum jogador se piorar o <strong>de</strong> outro.<br />

Uma classe particular é a classe <strong>dos</strong> jogos <strong>de</strong> soma zero. Mas<br />

muitos autores chamam os jogos <strong>de</strong> soma fixa <strong>de</strong> jogos <strong>de</strong> soma<br />

zero. Aqui usaremos os dois termos <strong>de</strong> forma intercambiável.<br />

<strong>Jogos</strong> estritamente competitivos se tem um “vencedor” e<br />

um “per<strong>de</strong>dor”. Exs.: xadrêz, pôquer, futebol, etc.<br />

Esses jogos tem pouca importância em economia, já que a<br />

maioria <strong>dos</strong> jogos na economia são jogos <strong>de</strong> soma variável.<br />

Minimax (ou minmax) é um método <strong>da</strong> teoria <strong>da</strong> <strong>de</strong>cisão<br />

tradicional para minimizar a máxima per<strong>da</strong> possível.<br />

Também po<strong>de</strong> ser visto como a estratégia <strong>de</strong> punir um outro<br />

jogador, minimizando o máximo que o outro po<strong>de</strong> obter.<br />

59


<strong>Jogos</strong> <strong>de</strong> Soma Zero, Maximin e Minimax<br />

Em jogos estritamente competitivos com 2-jogadores,<br />

minimizar o payoff adversário equivale a maximizar o<br />

seu próprio payoff. Assim, a matriz <strong>de</strong> jogos po<strong>de</strong> ter<br />

apenas uma entra<strong>da</strong> <strong>de</strong> payoff (do jogador 1), em que:<br />

O jogador 1 tenta maximizar o seu payoff e o jogador 2 tenta<br />

minimizar esse payoff (⇒ maximizando o seu próprio payoff).<br />

Dado o que o adversário está fazendo, a estratégia <strong>de</strong> segurança<br />

do jogador 1 é maximizar o conjunto <strong>de</strong> seus payoff mínimos<br />

(estratégia maximin), enquanto que para o jogador 2 ela é a <strong>de</strong><br />

minimizar o conjunto <strong>de</strong> máximos <strong>de</strong> 1 (estratégia minimax).<br />

Assim, po<strong>de</strong>mos <strong>de</strong>finir estratégias maximin e minimax:<br />

● O equilíbrio do jogo (s*1; s*2) é<br />

Máx Mín v<br />

1(s 1, s<br />

2)<br />

obtido resolvendo o problema:<br />

s1∈S1<br />

s2 ∈S2<br />

Máximo v (s , s *)<br />

Mín Máx v (s , s )<br />

s<br />

∈S<br />

s ∈S<br />

2 2 1 1<br />

1 1 2<br />

s ∈S<br />

1 1<br />

1 1 2<br />

Mínimo v (s *, s )<br />

s<br />

∈S<br />

2 2<br />

1 1 2<br />

Estratégias MiniMax & Maximin<br />

O teorema minimax <strong>de</strong> John von Neumann (1928) diz:<br />

Admitindo estratégias mistas, a estratégia minimax sempre existe<br />

em jogos <strong>de</strong> soma zero com dois jogadores e é única.<br />

As estratégias minimax e maximin surgiram na análise<br />

<strong>de</strong> jogos <strong>de</strong> soma fixa, mas po<strong>de</strong>m ser usa<strong>da</strong>s em jogos <strong>de</strong><br />

soma variável. Mas o eq. <strong>de</strong> Nash é muito mais aceito.<br />

Nos jogos <strong>de</strong> soma variável, em economia, estrat. minimax só<br />

tem algum interesse como estratégias <strong>de</strong> punição em jogos<br />

repeti<strong>dos</strong>, a fim <strong>de</strong> forçar a cooperação <strong>dos</strong> jogadores.<br />

O payoff minimax m i é o menor payoff que os rivais do jogador i<br />

po<strong>de</strong>m impor ao jogador i. É uma punição mais severa do que o EN.<br />

O jogador i se <strong>de</strong>fen<strong>de</strong> jogando a estratégia maximin.<br />

Como observa Rasmusen no seu livro <strong>de</strong> teoria <strong>dos</strong> jogos:<br />

Nos jogos <strong>de</strong> soma variável, a estratégia minimax é para<br />

sádicos e a estratégia maximin é para paranóicos!<br />

Em jogos <strong>de</strong> soma zero, a estratégia minimax ép/ neuróticos<br />

otimistas e a estratégia maximin p/ neuróticos pessimistas!<br />

60


Simplex <strong>de</strong> Três Jogadores<br />

Em topologia, simplex é um invólucro convexo no R n .<br />

No caso <strong>de</strong> 3 estratégias puras ele é um tetraedro no 3 com 4<br />

pontos: (0, 0, 0); (1, 0, 0); (0, 1, 0) e (0, 0, 1). Ver a figura.<br />

Os valores são normaliza<strong>dos</strong>: os valores do gráfico po<strong>de</strong>m ser<br />

interpreta<strong>dos</strong> como percentagens. Assim é usado para<br />

estratégias mistas (probabili<strong>da</strong><strong>de</strong>s aloca<strong>da</strong>s p/ ca<strong>da</strong> estratégia).<br />

Em muitas aplicações só interessa o plano eficiente que dá o<br />

payoff máximo: plano x 1 + x 2 + x 3 = 1.<br />

Por isso po<strong>de</strong>-se trabalhar no R 2 com esse triângulo eficiente.<br />

x 3<br />

x 1<br />

x 2<br />

Fonte: Wikipedia<br />

Curva <strong>de</strong> Deman<strong>da</strong> Linear e Lucro<br />

O mercado <strong>de</strong> um produto qualquer tem uma curva <strong>de</strong><br />

<strong>de</strong>man<strong>da</strong> p = f(q), on<strong>de</strong> p é o preço e q a quanti<strong>da</strong><strong>de</strong> total<br />

<strong>de</strong>man<strong>da</strong><strong>da</strong>. Suponha uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> linear.<br />

a<br />

p<br />

p = a − bq<br />

β<br />

Assuma que a = 16 + c , on<strong>de</strong> c é o custo unitário do produto<br />

(⇒ margem = p − c) e suponha b = 1 (⇒ β = 45 0 )<br />

Função lucro π é a margem vezes as ven<strong>da</strong>s: π = (p − c) q<br />

Logo, π = (a − bq − c) q = (16 - q) q ⇒ π = 16 q − q 2<br />

q<br />

61


Competição Perfeita e Monopólio<br />

Na competição perfeita, as firmas são tomadoras <strong>de</strong> preço e<br />

irão produzir com margem igual a zero, isto é, p = c . Logo, a<br />

quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> em competição perfeita será:<br />

c = a − bq ⇒ a − c = bq ⇒ 16 = 1 . q ⇒ q = 16<br />

No caso <strong>de</strong> monopólio, isto é, com apenas uma firma no<br />

mercado, o monopolista irá produzir <strong>de</strong> forma a maximizar<br />

o lucro. Logo a quanti<strong>da</strong><strong>de</strong> produzi<strong>da</strong> em monopólio será tal<br />

que maximiza o lucro π = 16 q − q 2 :<br />

Condições <strong>de</strong> maximização:<br />

∂π = 0 ; e<br />

∂ 2 π<br />

∂q<br />

∂q < 0 2<br />

∂π = 16 − 2q = 0 ⇒ q = 8<br />

Conclusão<br />

∂q<br />

Competição produz 16<br />

∂ 2 π<br />

∂q = − 2 < 0 (logo é um máximo) Monopólio produz 8<br />

2<br />

Cournot com Função Deman<strong>da</strong> Genérica<br />

Para uma curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> inversa genérica p(Q) com<br />

N ≥ 1 firmas <strong>de</strong> mesmo custo variável c e custofixo= 0,<br />

a condição <strong>de</strong> primeira or<strong>de</strong>m (CPO) é <strong>da</strong><strong>da</strong> por:<br />

p’(Q*) (Q*/N) + p(Q*) = c<br />

Para N = 1 temos o caso <strong>de</strong> monopólio.<br />

Quando N → ∞temos o caso <strong>de</strong> competição perfeita com p = c.<br />

Além <strong>da</strong> CPO, <strong>de</strong>pois <strong>de</strong>ve-se verificar a existência ou não <strong>de</strong><br />

solução <strong>de</strong> canto, i. é, com q i = 0.<br />

Cournot permite também ser visto <strong>de</strong> forma dinâmica:<br />

Se um par <strong>de</strong> estratégias iniciais não é EN, então os <strong>de</strong>svios<br />

seqüenciais <strong>de</strong> ca<strong>da</strong> jogador para a sua curva <strong>de</strong> melhor<br />

resposta <strong>da</strong>do o que o outro jogou, converge para o único EN-<br />

Cournot.<br />

62


Competição <strong>de</strong> Curto-Prazo: Quanti<strong>da</strong><strong>de</strong> x Preços<br />

A competição <strong>de</strong> curto-prazo com quanti<strong>da</strong><strong>de</strong>s (Cournot)<br />

supõe que o preço resulta do balanço oferta x <strong>de</strong>man<strong>da</strong>.<br />

É como se existe um leilão do produto. Mas quem é o leiloeiro?<br />

Parece mais natural as firmas escolherem preços no curto-prazo.<br />

A primeira tentativa <strong>de</strong> mo<strong>de</strong>lar a competição por preços<br />

foi <strong>de</strong> Bertrand (1883), na crítica ao livro <strong>de</strong> Cournot.<br />

Ele argumentou que seria mais provável que a competição<br />

entre as firmas fossem em preços e não em quanti<strong>da</strong><strong>de</strong>s.<br />

Mas quando uma firma pensa em reajustar preços, <strong>de</strong>ve levar<br />

em conta que a outra firma também po<strong>de</strong> reajustar o preço.<br />

Ex.: a IBM tem <strong>de</strong> <strong>de</strong>cidir que preço cobrar <strong>de</strong> seus “personal<br />

computers”, levando em conta a reação <strong>da</strong>s rivais Dell e HP.<br />

O que diferencia a competição <strong>de</strong> preços <strong>dos</strong> casos <strong>de</strong> monopólio e<br />

competição perfeita, em que essa interação estratégica não existe.<br />

Veremos o mo<strong>de</strong>lo clássico <strong>de</strong> Bertrand <strong>de</strong> duopólio simétrico.<br />

Esse mo<strong>de</strong>lo <strong>de</strong> duopólio leva a resulta<strong>dos</strong> <strong>de</strong> competição perfeita.<br />

Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />

Como em Cournot é um jogo simultâneo <strong>de</strong> curto-prazo,<br />

mas as estratégias <strong>de</strong> Bertrand são preços p i ∈ S i = [0, ∞).<br />

Encontraremos um equilíbrio <strong>de</strong> Nash totalmente diferente!<br />

As premissas fun<strong>da</strong>mentais do duopólio <strong>de</strong> Bertrand são:<br />

1) As firmas ven<strong>de</strong>m o mesmo produto (produto homogêneo) e só<br />

têm custos variáveis que são iguais c 1 = c 2 (firmas homogêneas);<br />

2) Se uma firma cobrar um preço menor que a rival, ela obterá<br />

to<strong>da</strong> a <strong>de</strong>man<strong>da</strong> do produto e terá capaci<strong>da</strong><strong>de</strong> <strong>de</strong> atendê-la; e<br />

3) Cobrando preços iguais, ca<strong>da</strong> firma leva a meta<strong>de</strong> <strong>da</strong> <strong>de</strong>man<strong>da</strong>.<br />

A premissa crítica é a segun<strong>da</strong>, pois supõe não haver restrição<br />

<strong>de</strong> capaci<strong>da</strong><strong>de</strong>, po<strong>de</strong>ndo uma só firma aten<strong>de</strong>r todo o mercado.<br />

Para calcular o(s) EN-Bertrand do jogo, note que numa<br />

competição “guerra <strong>de</strong> preços”, o preço tem dois limites:<br />

Limite inferior éo custo c: não é ótimo p < c (teria prejuízo); e<br />

Limite superior éo preço <strong>de</strong> monopólio p M : ótimo p/ 1 firma.<br />

Pois é razoável supor que os lucros são tais que 0 ≤ π 1 + π 2 ≤π M .<br />

63


Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />

Para <strong>de</strong>terminar o EN temos <strong>de</strong> traçar as curvas <strong>de</strong><br />

reação <strong>da</strong>s duas firmas, pois o preço ótimo <strong>da</strong> firma 1<br />

<strong>de</strong>pen<strong>de</strong> do preço cobrado pela firma 2 (ver gráfico):<br />

Deman<strong>da</strong> <strong>da</strong> firma 1 ⎧ Q(p ) se p < p<br />

(<strong>de</strong>scontínua):<br />

q (p , p ) se p p<br />

⎪ 2<br />

⎪⎩ 0 se p > p<br />

Problema:<br />

Máx π = (p −c) q (p , p )<br />

p1<br />

1 1 2<br />

⎪ Q(p<br />

1<br />

)<br />

1 1 2<br />

= ⎨<br />

1<br />

=<br />

2<br />

1 1 1 1 2<br />

1 2<br />

Se a firma 2 joga p 2 ≤ c, a melhor<br />

resposta<strong>da</strong>firma 1 ép 1 = c.<br />

‣Preços menores <strong>da</strong>riam prejuízo e<br />

preços maiores não ven<strong>de</strong>riam na<strong>da</strong>.<br />

Se a firma 2 jogar p 2 ∈ (c, p M ], o<br />

melhor é jogar p 1 apenas um pouco<br />

menor que p 2 e ter todo o mercado.<br />

‣Preços iguais dividiriam o mercado e<br />

preços maiores não ven<strong>de</strong>riam na<strong>da</strong>.<br />

Se a firma 2 jogar p 2 > p M , o melhor é<br />

jogar p 1 = p M e ter todo mercado.<br />

‣ Preço p 1 tal que p M < p 1 < p 2 teria todo<br />

o mercado tb., mas com menor lucro.<br />

Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />

Como as firmas são homogêneas, o problema é simétrico<br />

em relação à reta <strong>de</strong> 45 o . Assim, plotando no mesmo<br />

gráfico a curva <strong>de</strong> melhor resposta <strong>da</strong> firma 2, p 2 *(p 1 ):<br />

O único ponto <strong>de</strong> cruzamento,<br />

i. é, melhor resposta simultânea,<br />

é o ponto {p 1 = c; p 2 = c}, que é<br />

o único EN-Bertrand.<br />

Assim, o único equilíbrio <strong>de</strong><br />

Nash é ca<strong>da</strong> firma escolher um<br />

preço igual ao custo marginal.<br />

Logo, no EN-Bertrand o lucro<br />

operacional <strong>de</strong> ca<strong>da</strong> firma é zero.<br />

O resultado equivale ao do obtido<br />

no caso <strong>de</strong> mercado em competição<br />

perfeita, mas com só duas firmas!<br />

64


Duopólio <strong>de</strong> Preços <strong>de</strong> Bertrand<br />

Em resumo, o único EN <strong>de</strong>sse jogo é ambas as firmas<br />

jogarem preço = custo como na competição perfeita<br />

(mas só tem duas firmas no mercado!)<br />

Note que se uma <strong>da</strong>s firmas não jogar p 1 = p 2 = c, existe<br />

incentivo para a outra <strong>de</strong>sviar (não seria EN), pois:<br />

Se p 1 = p 2 > c , a firma 1 ou a firma 2 <strong>de</strong>svia para p i −ε;<br />

Se p 1 > p 2 = c , a firma 2 <strong>de</strong>svia para p 2 + ε;<br />

Se p 1 > c > p 2 , a firma 2 <strong>de</strong>svia para p 1 −ε;<br />

Se c > p 1 > p 2 , a firma 1 ou a firma 2 <strong>de</strong>svia para c;<br />

Se p 1 > p 2 > c , a firma 1 <strong>de</strong>svia para p 2 −ε; e<br />

Se p 2 > p 1 = c , a firma 1 <strong>de</strong>svia para p 1 + ε.<br />

Exercício: Mostre que não há EN em estratégias puras na<br />

competição com preços num produto homogêneo se o custo<br />

marginal (constante) <strong>de</strong> uma firma for maior que a <strong>da</strong> outra.<br />

Os Paradoxos <strong>de</strong> Bertrand<br />

O fato <strong>da</strong> presença <strong>de</strong> apenas mais uma única firma ser<br />

suficiente para passar <strong>de</strong> monopólio para competição<br />

perfeita com firmas tendo lucro zero é difícil <strong>de</strong> acreditar.<br />

Isso é chamado <strong>de</strong> paradoxo (clássico) <strong>de</strong> Bertrand.<br />

Um outro paradoxo é por que uma firma entraria nessa<br />

indústria se o lucro operacional é igual a zero?<br />

Além disso, suponha que existe algum custo fixo <strong>de</strong> entrar no<br />

mercado ou produzir. Então se uma firma entrar (monopólio)<br />

a outra firma não irá entrar (pois não pagaria o custo fixo).<br />

Logo, mesmo um pequeno custo fixo (<strong>de</strong> produção ou <strong>de</strong> entra<strong>da</strong>)<br />

é barreira suficiente para o mercado ser um provável monopólio!<br />

Um paradoxo relacionado ao clássico é que o preço <strong>de</strong><br />

equilíbrio in<strong>de</strong>pen<strong>de</strong> <strong>da</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> firmas no mercado.<br />

No caso <strong>de</strong> N > 2 firmas homogêneas competindo em preços<br />

(Bertrand), mostra-se que o único EN é to<strong>dos</strong> jogarem p i = c.<br />

65


Soluções <strong>dos</strong> Paradoxos <strong>de</strong> Bertrand<br />

A 1 a proposta <strong>de</strong> solução p/ o paradoxo <strong>de</strong> Bertrand foi<br />

<strong>de</strong> colocar restrições <strong>de</strong> capaci<strong>da</strong><strong>de</strong>s (Edgeworth, 1897).<br />

A premissa <strong>de</strong> que reduzindo um pouco o preço se obtém todo<br />

o mercado é muito forte na maioria <strong>dos</strong> casos. Exemplo:<br />

Imagine uma pequena ci<strong>da</strong><strong>de</strong> com dois hotéis. Como o número <strong>de</strong><br />

quartos é fixo por hotel, uma guerra <strong>de</strong> preços não teria lógica<br />

pois um hotel não po<strong>de</strong>ria absorver to<strong>da</strong> a <strong>de</strong>man<strong>da</strong>.<br />

Com restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>s, passa a ser ótimo um preço p i > c.<br />

Produtos diferencia<strong>dos</strong>: outra solução é que os produtos<br />

<strong>da</strong>s firmas geralmente não são totalmente homogêneos.<br />

Por ex., a firma que ven<strong>de</strong> um software não tem restrição <strong>de</strong><br />

capaci<strong>da</strong><strong>de</strong>s, mas geralmente tem alguma diferenciação: p i ≠ p j<br />

Dinâmica <strong>da</strong> competição e/ou incerteza na <strong>de</strong>man<strong>da</strong>.<br />

As firmas geralmente não se encontram apenas uma vez no<br />

mercado, como assume o mo<strong>de</strong>lo. Elas jogam jogos repeti<strong>dos</strong> e<br />

existe a ameaça <strong>de</strong> punição que po<strong>de</strong> levar a cooperação p i > c.<br />

Incerteza na <strong>de</strong>man<strong>da</strong> também po<strong>de</strong> levar a p i > c (livro do Shy).<br />

Dois Estágios: Cournot + Bertrand = Cournot<br />

O paper clássico <strong>de</strong> Kreps & Scheinkman (1983) mostra<br />

o caso em dois estágios em que as firmas escolhem<br />

capaci<strong>da</strong><strong>de</strong> (Cournot) no primeiro estágio e então<br />

seguem uma competição <strong>de</strong> preços <strong>de</strong> Bertrand.<br />

O primeiro estágio po<strong>de</strong> tanto ser visto como o <strong>de</strong> investimento<br />

em capaci<strong>da</strong><strong>de</strong>s como o <strong>de</strong> acúmulo <strong>de</strong> estoques.<br />

Em muitos casos é um estágio necessário antes <strong>de</strong> ir ao mercado.<br />

No segundo estágio as quanti<strong>da</strong><strong>de</strong>s não po<strong>de</strong>m altera<strong>da</strong>s (logo,<br />

restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>) e as firmas escolhem preços.<br />

Eles mostram que o resultante equilíbrio <strong>de</strong> Nash (perfeito<br />

em subjogos, a ser visto) é os jogadores escolherem as<br />

quanti<strong>da</strong><strong>de</strong>s e os preços iguais ao <strong>de</strong> Cournot em 1 estágio!<br />

Os autores concluem que “Com premissas bran<strong>da</strong>s sobre a<br />

<strong>de</strong>man<strong>da</strong>, o único equilíbrio resultante é o <strong>de</strong> Cournot”.<br />

Mo<strong>de</strong>los <strong>de</strong> Cournot, Bertrand, etc., são mais <strong>de</strong>talha<strong>dos</strong><br />

em bons livros <strong>de</strong> organização industrial (Tirole, Shy, etc.)<br />

66


Bertrand com Restrição <strong>de</strong> Capaci<strong>da</strong><strong>de</strong><br />

Consi<strong>de</strong>re que as firmas têm capaci<strong>da</strong><strong>de</strong> limita<strong>da</strong>, <strong>de</strong><br />

forma que no máximo produzem q 1máx = k 1 e q 2máx = k 2 .<br />

Para a firma 1, se ela jogar os preços para baixo, não irá obter<br />

todo o mercado e sim k 1 . Se ela jogar os preços acima, p 1 > p 2 , ela<br />

não per<strong>de</strong> todo o mercado, pois a firma 2 no máximo produz k 2 .<br />

A figura ilustra essa idéia, on<strong>de</strong> c = custo unitário marginal:<br />

p<br />

p(k 2 )<br />

p = c<br />

<strong>de</strong>man<strong>da</strong> atendi<strong>da</strong><br />

pela firma 2<br />

Digamos que a firma 2 aten<strong>da</strong> as k 2<br />

primeiras uni<strong>da</strong><strong>de</strong>s <strong>de</strong>man<strong>da</strong><strong>da</strong>s.<br />

A firma 1 tem incentivo p/ <strong>de</strong>sviar<br />

<strong>de</strong> p* = c, pois po<strong>de</strong>ria jogar um<br />

preço p 1 > c e obter lucro positivo<br />

(em vez <strong>de</strong> lucro = 0 com p = c)<br />

A firma 2 não po<strong>de</strong> “roubar” o<br />

mercado jogando p = c, pois não<br />

teria capaci<strong>da</strong><strong>de</strong> <strong>de</strong> atendê-lo.<br />

p 1<br />

k 2 ven<strong>da</strong>s <strong>da</strong> firma 1<br />

Q T<br />

Cournot + Bertrand = Cournot<br />

A <strong>de</strong>monstração do mo<strong>de</strong>lo <strong>de</strong> Kreps & Scheinkman não<br />

é simples e envolve conceitos ain<strong>da</strong> a serem vistos.<br />

Entretanto iremos mostrar a idéia com um exemplo simples.<br />

Seja um curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> <strong>da</strong><strong>da</strong> por p = 10 – Q T e c 1 = c 2 = 1.<br />

Usando as equações vistas, a produção em Cournot é q 1 = q 2 = 3.<br />

No primeiro estágio as firmas investem em capaci<strong>da</strong><strong>de</strong>s.<br />

Suponha que por algum motivo tenham escolhi<strong>dos</strong> investir<br />

numa capaci<strong>da</strong><strong>de</strong> <strong>de</strong> produzir a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> Cournot q* = 3.<br />

No segundo estágio do jogo as firmas irão escolher preços, mas<br />

com restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>. Vimos que nesse caso as firmas<br />

têm incentivos para <strong>de</strong>sviar <strong>da</strong> escolha clássica <strong>de</strong> p Bertrand = c.<br />

Iremos mostrar que eles escolherão p = p(k 1 + k 2 ) como EN,<br />

on<strong>de</strong> k 1 = k 2 = 3 (= q*), <strong>de</strong>vido à restrição <strong>de</strong> capaci<strong>da</strong><strong>de</strong>.<br />

Se no 2º estágio é ótimo jogar um preço p(k 1 + k 2 ), então temos<br />

<strong>de</strong> verificar qual o ótimo no 1º estágio em que se escolhe a<br />

quanti<strong>da</strong><strong>de</strong>. Mas isso é exatamente o problema <strong>de</strong> Cournot já<br />

visto, i. é, <strong>de</strong> maximização <strong>de</strong> lucros escolhendo quanti<strong>da</strong><strong>de</strong>s!<br />

67


Cournot + Bertrand = Cournot<br />

Provaremos que a escolha ótima <strong>de</strong> preços no 2º estágio<br />

é p 1 = p 2 = p Cournot = $ 4 [pois p Cournot = 10 – (3 + 3)].<br />

Se a firma 1 aten<strong>de</strong> os 1 os três consumidores, então a curva <strong>de</strong><br />

<strong>de</strong>man<strong>da</strong> residual p/ a firma 2 (após a produção <strong>da</strong> firma 1) é:<br />

p = 10 – (q 1 + q 2 ) ⇒ p = 10 – (3 + q 2 ) ⇒ p = 7 – q 2 . Ou q 2 = 7 – p.<br />

Só será ótimo a firma 2 <strong>de</strong>sviar na escolha <strong>de</strong> preço se isso<br />

aumentar o lucro <strong>de</strong>la. Sua função lucro Π 2 (p 2 ) é <strong>da</strong><strong>da</strong> por:<br />

Π 2 (p 2 ) = p 2 q 2 –c 2 q 2 ⇒Π 2 (p 2 ) = p 2 (7 – p 2 ) –1.(7 –p 2 ) ⇒<br />

⇒Π 2 (p 2 ) = 7 p 2 –p 22 – 7 + p 2 ⇒Π 2 (p 2 ) = 8 p 2 –p 22 –7<br />

Usa-se a CPO p/ maximizar o lucro escolhendo p, ∂Π 2 / ∂p 2 = 0:<br />

∂Π 2 / ∂p 2 = 0 ⇒ 8 – 2 p 2 = 0 ⇒ p 2 = 4, que é exatamente o preço<br />

obtido quando se joga a quanti<strong>da</strong><strong>de</strong> <strong>de</strong> Cournot!<br />

Por simetria, o mesmo vale para a firma 1 (não é ótimo <strong>de</strong>sviar).<br />

Intuição: preços menores não aumenta as ven<strong>da</strong>s, só obtém<br />

menos receita p/ o mesmo q. Preços maiores diminui a <strong>de</strong>man<strong>da</strong> e<br />

mesmo com maior margem, o lucro por ven<strong>de</strong>r menos é menor.<br />

Notas sobre Cournot + Bertrand = Cournot<br />

A idéia do exemplo ilustrativo foi mostrar que p(k 1 + k 2 )<br />

para os jogadores é EN por não valer a pena <strong>de</strong>sviar.<br />

Foi coloca<strong>da</strong> a curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> residual para a firma 2<br />

apenas para analisar se tinha vantagem a firma 2 <strong>de</strong>sviar <strong>de</strong><br />

forma unilateral, i. é, mantendo fixa a estratégia <strong>da</strong> firma 1.<br />

Por <strong>de</strong>finição, <strong>de</strong>man<strong>da</strong> residual <strong>da</strong> firma 2 é quando fazemos a<br />

<strong>de</strong>man<strong>da</strong> <strong>da</strong> firma 1 fixa. Por isso po<strong>de</strong>-se ver <strong>de</strong>svio unilateral.<br />

A curva <strong>de</strong> <strong>de</strong>man<strong>da</strong> residual não assume que a firma 1 jogou<br />

primeiro (aten<strong>de</strong>ndo k 1 ) e <strong>de</strong>pois a firma 2 jogou aten<strong>de</strong>ndo a<br />

<strong>de</strong>man<strong>da</strong> restante. O jogo é simultâneo (não é sequencial).<br />

A análise do EN é: as firmas estão jogando um preço tal<br />

que está sendo <strong>de</strong>man<strong>da</strong>do k 1 + k 2 . Esse preço é p(k 1 +<br />

k 2 ). Vale a pena <strong>de</strong> forma unilateral cobrar outro preço?<br />

Preço menor só reduz a receita <strong>da</strong> firma 2 por estar no limite<br />

<strong>da</strong> capaci<strong>da</strong><strong>de</strong> (não consegue ven<strong>de</strong>r mais).<br />

Preço maior <strong>da</strong> firma 2 ven<strong>de</strong> menos que k 2 e usando <strong>de</strong>man<strong>da</strong><br />

residual vimos que ela maximiza o lucro com p preço p(k 1 +k 2 ).<br />

68


Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />

Existência <strong>de</strong> EN: todo jogo tem pelo menos um EN se:<br />

1) Pu<strong>de</strong>r jogar estratégias mistas e se há um número finito <strong>de</strong><br />

estratégias puras no conjunto <strong>de</strong> estratégias <strong>de</strong> ca<strong>da</strong> jogador<br />

Senão, o jogo do par ou ímpar e outros tais como o leilão que<br />

to<strong>dos</strong> pagam (“all-pay auction” a ser visto) não teriam equilíbrio.<br />

2) Caso o jogo só permita estratégias puras, a existência <strong>de</strong><br />

EN só é garanti<strong>da</strong> em certas condições.<br />

Por ex., com conjuntos S i , ∀i, tendo um contínuo <strong>de</strong> estratégias<br />

(infinitas estratégias, ex.: quanti<strong>da</strong><strong>de</strong>s no mo<strong>de</strong>lo <strong>de</strong> Cournot).<br />

<br />

Mais precisamente, EN em estratégias puras existe se para<br />

to<strong>dos</strong> os jogadores i, o conjunto <strong>de</strong> estratégias S i é nãovazio,<br />

convexo e compacto e a função payoff v i (s 1 , … s I ) é<br />

contínua em (s 1 , … s I ) e quase-concava em s i .<br />

São condições suficientes (garante EN), mas não necessárias.<br />

Ver apêndices matemáticos do livro MWG: M.C.3 (p. 933, função<br />

quase-concava); M.F (p.943, conjunto compacto = conjunto<br />

limitado e fechado); M.G (p.946, conjunto convexo).<br />

Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />

Para provar isso veremos uma <strong>de</strong>finição alternativa <strong>de</strong> EN<br />

usando o conceito <strong>de</strong> ponto fixo <strong>de</strong> uma correspondência.<br />

Correspondência: conceito generalizado <strong>de</strong> função. Associa a ca<strong>da</strong><br />

ponto x um conjunto <strong>de</strong> pontos e não um único ponto y. MWG: p. 949<br />

Ponto fixo: Da<strong>da</strong> uma função ou correspondência f: A → A<br />

(conjunto A nele mesmo), o vetor x ∈ A é ponto fixo <strong>de</strong> f(.) se:<br />

x = f(x) em caso <strong>de</strong> função e x ∈ f(x) em caso <strong>de</strong> correspondência.<br />

Ver apêndice matemático M.I, do livro MGW, p. 952.<br />

Teorema do ponto fixo <strong>de</strong> Brouwer:<br />

Seja f: S → S uma função contínua <strong>de</strong><br />

um conjunto não-vazio, compacto e<br />

convexo S ⊂ R n nele mesmo. Então<br />

existe um x* ∈ S tal que x* = f(x*), i.<br />

é, existe um ponto fixo x* <strong>da</strong> função f.<br />

Figura: S é o intervalo [0, 1], por ex.,<br />

probabili<strong>da</strong><strong>de</strong>s <strong>de</strong> estratégias mistas.<br />

Tem 3 pontos fixos (corta reta f(x) = x)<br />

Figura: Wikipedia<br />

69


Existência <strong>de</strong> Equilíbrio <strong>de</strong> Nash<br />

No caso mais geral temos correspondências e usa-se o<br />

teorema do ponto fixo <strong>de</strong> Kakutani:<br />

Seja ϕ : S → S uma correspondência superior hemi-contínua <strong>de</strong><br />

um conjunto não-vazio, compacto e convexo S ⊂ R n nele<br />

mesmo tal que para todo x ∈ S, o conjunto ϕ(x) é convexo e<br />

não-vazio. Então existe um x* tal que x* ∈ ϕ(x*), i. é, existe um<br />

ponto fixo x* pertencente à correspondência ϕ(.).<br />

Figura: cepa.newschool.edu<br />

EN como Ponto Fixo <strong>de</strong> Correspondência<br />

EN são matematicamente equivalentes aos chama<strong>dos</strong><br />

pontos fixos <strong>da</strong>s correspondências <strong>de</strong> melhor resposta.<br />

No caso do EN-Cournot, vimos que q 1 * = f(q 2 *) e q 2 * = g(q 1 *).<br />

Logo, temos um ponto fixo no EN: q 1 * = f(g(q 1 *)) = h(q 1 *).<br />

No caso mais geral usa-se correspondência, pois mais <strong>de</strong> uma<br />

estratégia po<strong>de</strong> ser melhor resposta a uma certa estratégia.<br />

Assim, po<strong>de</strong>mos <strong>de</strong>finir o EN também como ponto fixo:<br />

Seja R i (s 1<br />

, s 2<br />

, … s N<br />

) a correspondência <strong>de</strong> melhor resposta do<br />

jogador i contra s −i . O perfil <strong>de</strong> estratégias s = (s 1<br />

, s 2<br />

, … s N<br />

) é<br />

equilíbrio <strong>de</strong> Nash <strong>de</strong> um jogo se, p/ todo jogador i = 1, …, N:<br />

s i<br />

* = R i (s 1<br />

*, s 2<br />

*, … s N<br />

*)<br />

A equação acima <strong>de</strong>ixa claro que um EN é um ponto fixo <strong>de</strong>ssa<br />

correspondência <strong>de</strong> melhor resposta. Uma intuição:<br />

Se iniciarmos com um perfil <strong>de</strong> estratégias que seja um EN e<br />

aplicarmos na correspondência <strong>de</strong> melhor resposta para todo i,<br />

então permaneceremos fixos nesse ponto (obtém o mesmo perfil).<br />

70


EN como Ponto Fixo: Exemplo em Cournot<br />

Dizemos que se iniciarmos com um perfil <strong>de</strong> estratégias<br />

que seja um EN e aplicarmos na correspondência <strong>de</strong><br />

melhor resposta para todo i, então permaneceremos<br />

fixos nesse ponto (obtém o mesmo perfil). Exemplo:<br />

No caso do duopólio <strong>de</strong> Cournot com <strong>de</strong>man<strong>da</strong> linear e sem<br />

custo fixo, vimos que as curvas <strong>de</strong> melhor resposta são:<br />

Funções melhor<br />

a−c 1<br />

− b q2<br />

a−c 2<br />

− b q1<br />

q(q)<br />

1 2<br />

= q(q)<br />

2 1<br />

=<br />

resposta (reação):<br />

2b<br />

2b<br />

Se substituirmos q 2 (q 1 ) em q 1 (q 2 ) iremos obter q 1* = f(q 1* ):<br />

*<br />

⎛a−c 2<br />

− b q ⎞<br />

1<br />

a−c 1<br />

− b ⎜ ⎟<br />

*<br />

*<br />

2b 2a −2c 1− a + c<br />

2<br />

+ b q1<br />

q<br />

1<br />

=<br />

⎝<br />

⎠<br />

=<br />

2b<br />

4b<br />

Assim q 1 é uma função <strong>de</strong> q 1 , i. é, q 1 = f(q 1 ). Se na expressão<br />

acima chutarmos no lado direito um valor <strong>de</strong> q 1* que seja EN,<br />

então o valor <strong>de</strong> q 1 obtido do lado esquerdo é o mesmo q<br />

*<br />

1<br />

chutado. Logo, se chutarmos um EN, temos um ponto fixo.<br />

Exemplo <strong>de</strong> Ponto Fixo <strong>de</strong> Correspondência<br />

No jogo “batalha <strong>dos</strong> sexos” foi contruído um gráfico<br />

para <strong>de</strong>terminar o equilíbrio em estratégias mistas que<br />

ilustra o EN como ponto fixo <strong>de</strong> correspondências <strong>de</strong><br />

melhor resposta.<br />

π 2<br />

1<br />

Correspondência do jogador 2: π 2 *(π 1 )<br />

Correspondência do jogador 1: π 1 *(π 2 )<br />

1/3<br />

EN em estratégias<br />

mistas: um <strong>dos</strong> três<br />

pontos fixos π 1 *(π 2 *)<br />

2/3<br />

π 1<br />

71


Exercício <strong>de</strong> <strong>Jogos</strong> Repeti<strong>dos</strong>: Cournot<br />

Seja o estágio-jogo G uma competição em quanti<strong>da</strong><strong>de</strong>s <strong>de</strong><br />

Cournot, num mercado com <strong>de</strong>man<strong>da</strong> P(Q) = a − b Q e<br />

jogadores com os mesmos custos marginais c.<br />

Mostre que num jogo G repetido infinitamente, existe<br />

algum fator <strong>de</strong> <strong>de</strong>sconto δ ∗ , tal que se δ ≥ δ * então:<br />

Po<strong>de</strong> ser sustentado num ENPS o payoff <strong>de</strong> colusão obtido com<br />

ca<strong>da</strong> firma produzindo a meta<strong>de</strong> <strong>da</strong> quanti<strong>da</strong><strong>de</strong> <strong>de</strong> monopólio<br />

q M e ca<strong>da</strong> firma usando a seguinte estratégia “grim”:<br />

‣ Produzir q M / 2 no primeiro período. No período t continuar<br />

produzindo q M / 2 se ambas as firmas tiverem produzi<strong>dos</strong> q M / 2<br />

nos t − 1 perío<strong>dos</strong> anteriores. Caso contrário produzir a<br />

quanti<strong>da</strong><strong>de</strong> do EN-Cournot q C .<br />

Determine o valor <strong>de</strong> δ * (o que também prova que ele existe)<br />

Dicas: ver ex. do dilema <strong>dos</strong> prisioneiros; calcule o máximo lucro<br />

<strong>de</strong> <strong>de</strong>svio π D em um estágio (<strong>da</strong>do que o outro está jogando q M /2)<br />

que, somado aos lucros <strong>de</strong> Cournot π C nos estágios seguintes, <strong>de</strong>ve<br />

ser comparado com o lucro eterno <strong>de</strong> π M /2se não <strong>de</strong>sviar <strong>de</strong> q M /2<br />

Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Seja o jogo <strong>de</strong> quotas <strong>da</strong> OPEP, mas com repetição<br />

infinita. Consi<strong>de</strong>re dois países Arábia Saudita e Irã.<br />

Ver planilha <strong>Jogos</strong> <strong>da</strong> OPEP.xls (aba “quotas_repetido_estoc”)<br />

O jogo é apresentado no livro do Dutta (“Strategy and Games”,<br />

MIT Press, 1999), ver trecho do livro na Pasta 72.<br />

Consi<strong>de</strong>re que em qualquer período a <strong>de</strong>man<strong>da</strong> po<strong>de</strong> ser<br />

alta ou baixa. A função <strong>de</strong>man<strong>da</strong> é linear e <strong>da</strong><strong>da</strong> por:<br />

Deman<strong>da</strong> alta: p H = a H –b H (q A + q I ) = 44,5 – 1,5 (q A + q I ).<br />

Deman<strong>da</strong> baixa: p L = a L –b L (q A + q I ) = 22,5 – 0,5 (q A + q I ).<br />

Sejam os custos unitários marginais c A = c I = 5 US$/bbl e<br />

ca<strong>da</strong> país po<strong>de</strong> produzir o valor <strong>da</strong> quota OPEP ou nãocooperar<br />

produzindo dois milhões bbl/dia acima <strong>da</strong> cota.<br />

As quotas são <strong>de</strong> 8 milhões <strong>de</strong> bbl/dia para a Arábia Saudita e<br />

<strong>de</strong> 5 milhões <strong>de</strong> bbl/dia para o Irã. Assim, as produções totais<br />

possíveis são 13 ; 15 e 17 milhões bbl/dia.<br />

72


Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Consi<strong>de</strong>re que caso algum país não-coopere em um<br />

estágio, a seguir haverá punição com a estratégia “grim”.<br />

Se um <strong>dos</strong> países jogar “não-cooperar” (produção acima <strong>da</strong><br />

cota) num estágio, então será jogado sempre {não-cooperar;<br />

não-cooperar} nos estágios sub-sequentes do superjogo.<br />

Determine, p/ ca<strong>da</strong> país, os fatores <strong>de</strong> <strong>de</strong>sconto mínimos<br />

para sustentar a cooperação (jogar as cotas) nos esta<strong>dos</strong><br />

<strong>de</strong> <strong>de</strong>man<strong>da</strong> alta e fraca.<br />

Depois consi<strong>de</strong>re uma probabili<strong>da</strong><strong>de</strong> p <strong>da</strong> <strong>de</strong>man<strong>da</strong> ser alta<br />

em qualquer estágio (e, logo, 1 – p para a <strong>de</strong>man<strong>da</strong> ser fraca).<br />

Iremos consi<strong>de</strong>rar repetição infinita, como aproximação<br />

razoável. Mas alguns autores consi<strong>de</strong>ram que o jogo <strong>da</strong><br />

OPEP é <strong>de</strong> repetição finita, pois as reservas são finitas.<br />

Para resolver, teremos <strong>de</strong> montar as matrizes <strong>de</strong> payoffs<br />

para os dois casos <strong>de</strong> <strong>de</strong>man<strong>da</strong> (ver próximo sli<strong>de</strong>).<br />

Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

A matrizes <strong>de</strong> payoffs para os dois casos <strong>de</strong> <strong>de</strong>man<strong>da</strong> são<br />

(checar!):<br />

Deman<strong>da</strong> Alta:<br />

Deman<strong>da</strong> Baixa:<br />

73


Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Observando a matriz no caso <strong>de</strong> <strong>de</strong>man<strong>da</strong> alta, temos<br />

um caso típico <strong>de</strong> dilema <strong>dos</strong> prisioneiros, on<strong>de</strong> existe<br />

ganho para ambos cooperarem.<br />

O mesmo não ocorre para o caso <strong>de</strong> <strong>de</strong>man<strong>da</strong> fraca, on<strong>de</strong><br />

{cooperar ; cooperar} tem um payoff somado (143) menor que<br />

o caso do EN {não-cooperar ; não-cooperar} (payoff = 153).<br />

Isso ocorre <strong>de</strong>vido aos valores adota<strong>dos</strong> (não é regra geral), mas o<br />

livro usa isso p/ explicar a falta <strong>de</strong> cooperação nos anos 60, já que<br />

não-cooperar aten<strong>de</strong> as racionali<strong>da</strong><strong>de</strong>s individuais (EN) e coletiva.<br />

Vejamos o caso <strong>de</strong> interesse (<strong>de</strong>man<strong>da</strong> alta). Se a Arábia<br />

tem um fator <strong>de</strong> <strong>de</strong>sconto δ A e não <strong>de</strong>sviar o payoff será:<br />

Π A (coopera) = 160 + 160 δ A + 160 δ A2 + ... = 160 / (1 − δ A )<br />

Se ela <strong>de</strong>sviar no 1º estágio, terá um ganho <strong>de</strong> curto prazo, mas<br />

será punido com o EN nos <strong>de</strong>mais estágios e o payoff será:<br />

Π A (<strong>de</strong>svia) = 170 + 140 δ A + 140 δ A2 ... = 170 + [140 δ A /(1 − δ A )]<br />

A cooperação ocorre se Π A (coopera) ≥ Π A (<strong>de</strong>svia) ⇒ δ A ≥ 1/3<br />

Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Assim, para a Arábia Saudita não seria difícil cooperar<br />

com <strong>de</strong>man<strong>da</strong> alta, já que o fator <strong>de</strong> <strong>de</strong>sconto mínimo<br />

(taxa <strong>de</strong> <strong>de</strong>sconto máxima) é bem baixo.<br />

Para o Irã um raciocínio análogo resulta em:<br />

Π I (coopera) = 100 + 100 δ I + 100 δ I2 + ... = 100 / (1 − δ I )<br />

Se ele <strong>de</strong>sviar no 1º estágio e ser punido <strong>de</strong>pois, o payoff será:<br />

Π I (<strong>de</strong>svia) = 119 + 98 δ I + 98 δ I2 ... = 119 + [98 δ I /(1 − δ I )]<br />

A cooperação ocorre se Π I (coopera) ≥ Π I (<strong>de</strong>svia) ⇒ δ I ≥ 19/21<br />

Logo, o fator <strong>de</strong> <strong>de</strong>sconto mínimo do Irã é bem mais alto<br />

que o <strong>da</strong> Arábia. É bem mais difícil para o Irã cooperar.<br />

Note que o Irã ganha mais <strong>de</strong>sviando que a Arábia e a per<strong>da</strong><br />

com a punição grim é menor para o Irã do que para a Arábia.<br />

No caso estocástico ca<strong>da</strong> país tem 4 estratégias diferentes:<br />

Sempre cooperar [q C ; q C ]; cooperar só se a <strong>de</strong>man<strong>da</strong> for alta<br />

[q C ; q N ]; coop. só se for baixa [q N ; q C ]; nunca cooperar [q N ; q N ] .<br />

74


Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

On<strong>de</strong> o 1º termo em [. ; .] é relativo a <strong>de</strong>man<strong>da</strong> alta e o 2º<br />

em relação a <strong>de</strong>man<strong>da</strong> fraca. A matriz <strong>de</strong> payoffs para<br />

uma probabili<strong>da</strong><strong>de</strong> <strong>de</strong> <strong>de</strong>man<strong>da</strong> alta <strong>de</strong> p = 50% é:<br />

Note que a estratégia <strong>de</strong> cooperação <strong>de</strong> interesse, on<strong>de</strong> a soma<br />

<strong>de</strong> payoffs é máxima, é quando ambos jogam baixa produção se<br />

a <strong>de</strong>man<strong>da</strong> é alta e alta produção se a <strong>de</strong>man<strong>da</strong> é baixa.<br />

Mostre que esse resultado vale para qualquer probabili<strong>da</strong><strong>de</strong> p.<br />

Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Note que o único EN é produção alta para ambos os<br />

países. Esse par <strong>de</strong> estratégias é EN para qualquer p e é<br />

EN único para qualquer p não trivial, i. é, p ≠ 0 e p ≠ 1.<br />

A cooperação basea<strong>da</strong> na estratégia <strong>de</strong> punição grim é:<br />

Cooperar enquanto o ambos cooperam, sendo cooperar é<br />

quando ambos jogam baixa produção se a <strong>de</strong>man<strong>da</strong> é alta e<br />

alta produção se a <strong>de</strong>man<strong>da</strong> é baixa.<br />

Se algum país não cooperar, então será jogado o único EN<br />

(ambos produzindo o máximo) em to<strong>dos</strong> os estágios futuros.<br />

Imagine que a <strong>de</strong>man<strong>da</strong> é alta, <strong>de</strong> forma que existe um<br />

ganho <strong>de</strong> curto prazo <strong>de</strong>sviando <strong>da</strong> cooperação.<br />

Quais os fatores <strong>de</strong> <strong>de</strong>sconto mínimos p/ sustentar a cooperação?<br />

Consi<strong>de</strong>re primeiro o caso <strong>da</strong> Arábia. Se ela nunca trair:<br />

Π A (coop.) = 160 + [160 p + (1 – p) 90] δ A + [160 p + (1 – p) 90] δ A<br />

2<br />

+ ... ⇒ Π A (coop.) = 160 + {[160 p + (1 – p) 90] δ A / (1 − δ A )}<br />

75


Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

Caso a Arábia <strong>de</strong>svie no 1º período, seu payoff ficaria:<br />

Π A (não-coop.) = 170 + [140 p + (1 - p) 90] δ A + [140 p + (1 - p) 90] δ A<br />

2<br />

+ ... ⇒ Π A (não-coop.) = 170 + {[140 p + (1 – p) 90] δ A / (1 − δ A )}<br />

Não haverá incentivo para trair se Π A (não-coop.) ≥ Π A (coop.):<br />

160 + {[160 p + (1 – p) 90] δ A / (1 −δ A )} ≥ 170 + {[140 p + (1 – p) 90] δ A / (1 −δ A )}<br />

⇒ δ A ≥ 1 / (1 + 2 p) para a Arábia cooperar.<br />

Consi<strong>de</strong>re agora o caso do Irã. Se ele nunca trair:<br />

Π I (coop.) = 100 + [100 p + (1 – p) 63] δ I + [100 p + (1 – p) 63] δ I2 +<br />

... ⇒ Π I (coop.) = 100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )}<br />

Caso o Irã <strong>de</strong>svie no 1º período, seu payoff ficaria:<br />

Π I (não-coop.) = 119 + [98 p + (1 - p) 63] δ I + [98 p + (1 - p) 63] δ I2 +<br />

... ⇒ Π I (não-coop.) = 119 + {[98 p + (1 – p) 63] δ I / (1 − δ I )}<br />

Não haverá incentivo para trair se Π I (não-coop.) ≥ Π I (coop.):<br />

100 + {[100 p + (1 – p) 63] δ I / (1 −δ I )} ≥ 119 + {[98 p + (1 – p) 63] δ I / (1 −δ I )}<br />

⇒ δ I ≥ 19 / (19 + 2 p) para o Irã cooperar.<br />

Cotas <strong>da</strong> OPEP com Repetição Infinita<br />

A não ser no caso trivial <strong>de</strong> p = 0, o fator <strong>de</strong> <strong>de</strong>sconto<br />

mínimo requerido para o Irã é maior (ou bem maior)<br />

que o requerido para a Arábia.<br />

Logo, é relativamente fácil para a Arábia cooperar sempre,<br />

mas é geralmente difícil para o Irã cooperar.<br />

Essa é uma conclusão consistente com a reali<strong>da</strong><strong>de</strong> observa<strong>da</strong>,<br />

conforme o autor (Dutta) argumenta.<br />

Note que usamos os mesmo custos unitários, apenas as<br />

capaci<strong>da</strong><strong>de</strong>s <strong>de</strong> produção <strong>de</strong>sses países é que são diferentes.<br />

A tabela abaixo mostra a sensibili<strong>da</strong><strong>de</strong> com a probabili<strong>da</strong><strong>de</strong> p:<br />

76


Ex: Cournot com Informação Incompleta<br />

Seja a competição em quanti<strong>da</strong><strong>de</strong>s (Cournot) mas com<br />

informação incompleta e assimétrica sobre o custo:<br />

Firma 1 é uma firma estabeleci<strong>da</strong> no mercado e por isso tem<br />

custo marginal c conhecido pela firma 2.<br />

Firma 2 é uma firma nova, que está entrando no mercado e<br />

que tem custo conhecido por ela, mas que a firma 1 <strong>de</strong>sconhece.<br />

Assim, a informação incompleta é assimétrica: a firma 2 é a firma<br />

informa<strong>da</strong> e a firma 1 tem informação incompleta sobre a firma 2.<br />

Assuma só dois cenários: a firma 2 po<strong>de</strong> ser <strong>de</strong> alto custo c H , ou<br />

<strong>de</strong> baixo custo c L , por ex. <strong>de</strong>vido a diferenças <strong>de</strong> tecnologia.<br />

No contexto Bayesiano, diz-se que a firma 1 tem um só tipo<br />

(espaço <strong>de</strong> tipos Θ 1 = {c}) e a firma 2 tem dois tipos, Θ 2 = {c L , c H }.<br />

Porém, é conhecimento comum (firmas 1 e 2) a distribuição <strong>de</strong><br />

probabili<strong>da</strong><strong>de</strong>s a priori sobre os tipos <strong>dos</strong> jogadores:<br />

A firma 1 sabe que a firma 2 tem probabili<strong>da</strong><strong>de</strong> p <strong>de</strong> ser do<br />

tipo c H e probabili<strong>da</strong><strong>de</strong> 1 − p <strong>de</strong> ser do tipo c L .<br />

Aqui os tipos são in<strong>de</strong>pen<strong>de</strong>ntes ⇒ prob(θ 2 = c L | c) = prob(θ 2 = c L ).<br />

Cournot com Informação Incompleta<br />

Seja a função <strong>de</strong>man<strong>da</strong> inversa linear P(Q) = a − Q, com<br />

Q = q 1 + q 2 . As firmas maximizam o lucro escolhendo as<br />

quanti<strong>da</strong><strong>de</strong>s, mas agora a curva <strong>de</strong> reação <strong>da</strong> firma 2<br />

<strong>de</strong>pen<strong>de</strong> se ela é do tipo alto custo ou do tipo baixo custo.<br />

Denote q 2* (c L ) e q 2* (c H ) as curvas <strong>de</strong> reação <strong>da</strong> firma 2 a<br />

<strong>de</strong>pen<strong>de</strong>r <strong>de</strong> seu tipo e q 1* a curva <strong>de</strong> reação <strong>da</strong> firma 1.<br />

Se a firma 2 for do tipo baixo custo, ela escolhe q 2* (c L ) que<br />

resolve: max [(a − q − q ) − c ] q<br />

q2<br />

1 2 L 2<br />

Se a firma 2 for do tipo alto custo, ela escolhe q 2* (c H ) que<br />

resolve: max [(a − q<br />

1<br />

− q<br />

2) − c<br />

H] q<br />

2<br />

q2<br />

A firma 1 escolhe q 1* sabendo que existe uma probabili<strong>da</strong><strong>de</strong> p<br />

<strong>da</strong> firma 2 ter a curva <strong>de</strong> reação q 2* (c H ) e 1 − p <strong>de</strong>la ser q 2* (c L ):<br />

max p [(a −q −q (c )) −c ] q + (1 −p) [(a −q −q (c )) −c ] q<br />

q1<br />

1 2 H 1 1 2 L 1<br />

Usando as condições <strong>de</strong> primeira or<strong>de</strong>m para ca<strong>da</strong> um <strong>dos</strong> três<br />

problemas <strong>de</strong> maximização e como as quanti<strong>da</strong><strong>de</strong>s têm <strong>de</strong> ser ≥ 0:<br />

77


Cournot com Informação Incompleta<br />

Usando CPOs (<strong>de</strong>rivando e igualando a zero):<br />

* ⎧ a−q1 −cH<br />

⎫<br />

* ⎧ a−q1 −cL<br />

⎫<br />

q<br />

2(c H) = max ⎨0,<br />

⎬<br />

q<br />

2(c L) = max ⎨0,<br />

⎬<br />

⎩ 2 ⎭<br />

⎩ 2 ⎭<br />

* ⎧ p [a −q 2(c H) −c ] + (1 −p) [a −q 2(c L) −c ] ⎫<br />

q<br />

1<br />

= max⎨0,<br />

⎬<br />

⎩<br />

2<br />

⎭<br />

Substituindo a curva <strong>de</strong> reação duma firma na curva <strong>de</strong> reação <strong>da</strong><br />

outra firma se obtém os valores <strong>de</strong> quanti<strong>da</strong><strong>de</strong>s em equilíbrio:<br />

* ⎧ a 2 c<br />

H<br />

+ c (1 p) (cH c<br />

L)<br />

q<br />

2(c H) = max 0,<br />

− − − ⎫<br />

⎨<br />

+<br />

⎬<br />

⎩ 3 6 ⎭<br />

* ⎧ a−2 c<br />

L<br />

+ c p (cH −c L)<br />

⎫<br />

q<br />

2(c L) = max ⎨0,<br />

− ⎬<br />

⎩ 3 6 ⎭<br />

* ⎧ a − 2 c + p c<br />

H<br />

+ (1 −p) cL<br />

⎫<br />

No caso + geral ocorre<br />

q<br />

1<br />

= max ⎨0,<br />

⎬<br />

E[q<br />

2(c)]<br />

≠ q<br />

2(E[c])<br />

<br />

⎩<br />

3<br />

⎭<br />

Compare com o caso com informação completa, em que tínhamos<br />

q i* = (a − 2 c i + c j ) / 3 (se não-negativo). Firma 1: lineari<strong>da</strong><strong>de</strong> <strong>de</strong> π 1<br />

com q 2 e o custo a fez usar o valor esperado do custo <strong>da</strong> rival no q<br />

*<br />

1 .<br />

Firma 2: se ela for <strong>de</strong> alto custo ela produziria mais do que com<br />

inform. completa. Mas se for <strong>de</strong> baixo custo, ela produziria menos.<br />

Cournot com Informação Incompleta<br />

Assim, uma firma <strong>de</strong> alto custo irá querer escon<strong>de</strong>r o<br />

seu custo <strong>da</strong> outra firma, p/ produzir mais e lucrar mais.<br />

Já uma firma <strong>de</strong> baixo custo po<strong>de</strong>rá querer sinalizar que ela é<br />

<strong>de</strong> baixo custo, i. é, divulgar <strong>de</strong> forma crível o seu custo baixo.<br />

q 1 Curva <strong>de</strong> reação <strong>da</strong> firma 2<br />

se ela for <strong>de</strong> baixo custo: q 2 *(c L )<br />

q 2<br />

Curva <strong>de</strong> reação <strong>da</strong> firma 2<br />

se ela for <strong>de</strong> alto custo: q 2 *(c H )<br />

q 1<br />

*<br />

Curva <strong>de</strong> reação espera<strong>da</strong> <strong>da</strong> firma 2: E[q 2 ]. Coincidência: a firma 1<br />

maximiza E[π 1 (q 2 )], mas aqui π 1 é linear com q 2 ⇒ po<strong>de</strong> usar E[q 2 ].<br />

Com informação completa as quanti<strong>da</strong><strong>de</strong>s seriam<br />

diferentes: equilíbrio caso a firma 2 for <strong>de</strong> baixo custo<br />

Curva <strong>de</strong> Reação<br />

<strong>da</strong> firma 1: q 1 *(q 2 )<br />

q 2*<br />

(c H<br />

) q 2*<br />

(c L<br />

)<br />

ver também a planilha<br />

cournot_assimetrico.xls<br />

78


<strong>Teoria</strong> <strong>da</strong> Informação Assimétrica<br />

A teoria <strong>de</strong> merca<strong>dos</strong> sob informação assimétrica foi<br />

agracia<strong>da</strong> com três Prêmios Nobel em Economia (2001):<br />

Seleção Adversa: George Akerlof (“mercado <strong>de</strong> limões”).<br />

Sinalização: Michael Spence (mercado <strong>de</strong> trabalho).<br />

Screening: Joseph Stiglitz (mercado <strong>de</strong> seguros).<br />

A teoria <strong>de</strong> incentivos sob informação assimétrica obteve<br />

mais dois Prêmios Nobel (1996) [ver paper na Pasta 72]:<br />

James Mirrless (<strong>de</strong>senho <strong>da</strong> taxação ótima <strong>de</strong> ren<strong>da</strong>).<br />

William Vickrey (<strong>de</strong>senho <strong>de</strong> leilões).<br />

<strong>Teoria</strong> <strong>de</strong> Agência vs. Assimetria <strong>de</strong> Informação<br />

<strong>Teoria</strong> <strong>de</strong> Agência: analisa problemas <strong>de</strong>vido a conflitos <strong>de</strong><br />

agente e principal, com informação assimétrica ou não.<br />

“Common Agency”: vários principais. Ex.: firma é um agente<br />

informado com vários principais: fisco, agência reguladora, etc.<br />

Assimetria <strong>de</strong> Informação: o agente é a parte mais informa<strong>da</strong> e<br />

o principal é a parte menos informa<strong>da</strong>.<br />

Leilões na Internet<br />

Leilões online surgiram na web em 1995. O site virou<br />

uma empresa (AuctionWeb) que virou eBay em 1997.<br />

Ver http://en.wikipedia.org/wiki/Ebay<br />

Existem to<strong>dos</strong> os tipos <strong>de</strong> leilões na internet.<br />

O mais usado é o leilão inglês e suas variações (em ~ 85% <strong>dos</strong><br />

casos segundo Kambil & van Heck, “Making Markets”, 2002).<br />

O leilão inglês é o mais antigo <strong>de</strong> to<strong>dos</strong> (<strong>de</strong>s<strong>de</strong> ~500 A.C.) e<br />

muito usado para objetos <strong>de</strong> arte.<br />

O leilão <strong>de</strong> 2º lance é um <strong>dos</strong> formatos usa<strong>dos</strong> pelo eBay (proxy<br />

bidding system), mas com uma pequena variação: o vencedor<br />

paga o segundo maior bid mais um incremento <strong>de</strong> valor fixo.<br />

O leilão holandês <strong>da</strong>ta <strong>de</strong> ~1870, usado em mercado <strong>de</strong> flores e<br />

tem sido usado na internet com aju<strong>da</strong> <strong>de</strong> um “auction clock”.<br />

O “relógio” vai marcando preços <strong>de</strong>crescentes ao longo do tempo<br />

até que alguém para o relógio. No caso tradicional, oral, o<br />

leiloeiro vai reduzindo o preço até alguém dizer “é meu!”.<br />

79


Leilão <strong>de</strong> Telecomunicações (FCC)<br />

Um caso famoso foi o leilão <strong>de</strong> um espectro <strong>de</strong> telecom.<br />

<strong>da</strong> FCC (US Fe<strong>de</strong>ral Communication Commision) em<br />

1994/1995 que gerou uma receita <strong>de</strong> 7,7 bilhões <strong>de</strong> US$.<br />

Licenças para oferecer uma gama <strong>de</strong> serviços wireless tais<br />

como serviços p/ celulares, pagers, transmissão <strong>de</strong> <strong>da</strong><strong>dos</strong>, etc.<br />

O leilão foi <strong>de</strong>senhado por três especialistas em teoria<br />

<strong>dos</strong> jogos (Milgrom, Wilson e McAfee) para ven<strong>da</strong><br />

simultânea <strong>de</strong> várias licenças em várias áreas <strong>dos</strong> EUA.<br />

O formato foi <strong>de</strong> preços abertos ascen<strong>de</strong>ntes, mas p/ múltiplas<br />

licenças. Ca<strong>da</strong> participante podia <strong>da</strong>r lances nas áreas que<br />

quisessem, a ca<strong>da</strong> ro<strong>da</strong><strong>da</strong>. O leilão só terminava quando em<br />

uma ro<strong>da</strong><strong>da</strong> nenhuma área recebesse novos bids.<br />

Houveram 112 ro<strong>da</strong><strong>da</strong>s que levaram 4 meses. Resultado foi<br />

consi<strong>de</strong>rado um sucesso pelo governo.<br />

Esse formato previne o “winner´s curse” (que ocorreria se<br />

fosse leilão selado), que po<strong>de</strong>ria levar as firmas a <strong>da</strong>r lances<br />

muito conservadores, e <strong>da</strong>va flexibili<strong>da</strong><strong>de</strong> às firmas que<br />

queriam uma combinação <strong>de</strong> licenças p/ serem mais agressivas.<br />

Estratégias do Comprador: Winner’s Curse<br />

Maldição do vencedor (“winners’ curse”): firmas pagam<br />

mais do que vale o bem. Uma firma só ganha o leilão se<br />

sua avaliação for a mais alta <strong>de</strong>ntre to<strong>da</strong>s as jogadoras.<br />

Assim, mesmo que em média as suas avaliações (e seus lances)<br />

não superestimem os valores <strong>dos</strong> ativos, as firmas só ganham<br />

quando as suas avaliações são as mais otimistas do leilão.<br />

Condicional a ser o vencedor, paga-se mais que a avaliação<br />

média (ou melhor, do bid médio) <strong>dos</strong> participantes do leilão.<br />

Capen & Clapp & Campbell, 1971: isso ocorreu em leilões <strong>de</strong><br />

áreas exploratórias no Golfo do México americano nos anos 60.<br />

Com o tempo, as firmas apren<strong>de</strong>m a se comportar <strong>de</strong> forma<br />

estratégica, antecipando o “winner’s curse” e <strong>da</strong>ndo lances<br />

mais conservadores. Em equilíbrio esse problema é <strong>de</strong>scartado.<br />

De novo, a firma no leilão <strong>de</strong> 1º lance tem <strong>de</strong> raciocinar qual o<br />

lance ótimo, <strong>da</strong>do que ela tem a maior valoração do leilão.<br />

“Dinheiro <strong>de</strong>ixado sobre a mesa” no leilão <strong>de</strong> 1º lance:<br />

diferença entre o lance vencedor e o lance do 2º colocado.<br />

80


Leilão Ótimo para o Leiloeiro<br />

Com um número reduzido <strong>de</strong> preten<strong>de</strong>ntes ao bem em leilão, o<br />

leiloeiro po<strong>de</strong>ria obter um valor muito abaixo <strong>de</strong> V θ .<br />

Elepo<strong>de</strong>atéterum preço <strong>de</strong> reserva abaixo do qual ele não<br />

ven<strong>de</strong> o bem, pois teria utili<strong>da</strong><strong>de</strong> negativa.<br />

Qual o leilão ótimo, o <strong>de</strong> segundo lance ou o <strong>de</strong> primeiro lance?<br />

Surpresa: em geral ambos dão a mesma receita espera<strong>da</strong> ao leiloeiro!<br />

Isso é referido como sendo a equivalência <strong>de</strong> receita entre os dois leilões.<br />

Demonstração usa o princípio <strong>da</strong> revelação para restringir a busca.<br />

Ex.: Dutta (1999, cap.23) caso extremo com dois compradores.<br />

No leilão <strong>de</strong> primeiro lance ele obtém o seguinte ENB:<br />

O tipo <strong>de</strong> menor valoração µ oferta o seu próprio valor e o tipo <strong>de</strong><br />

maior valor θ joga uma estratégia mista atribuindo uma distribuição <strong>de</strong><br />

probabili<strong>da</strong><strong>de</strong>s a to<strong>dos</strong> os lances entre µ e (θ + µ)/2 (equilíbrio único).<br />

No caso analisado, ca<strong>da</strong> jogador tem 50% <strong>de</strong> chance <strong>de</strong> ser <strong>de</strong> ca<strong>da</strong> tipo,<br />

e logo po<strong>de</strong> ocorrer que ambos os dois jogadores sejam do tipo θ (ou µ).<br />

Ele chega a conclusão que ambos os leilões dão a mesma receita espera<strong>da</strong><br />

Definição: Estratégias simétricas <strong>de</strong> equilíbrio são quando to<strong>dos</strong><br />

os jogadores jogam a mesma função, b i (θ) = b j (θ) = b(θ), embora<br />

ca<strong>da</strong> um possa ter um tipo diferente (e <strong>da</strong>r lances diferentes).<br />

Receita e Número <strong>de</strong> Competidores: Exemplo<br />

O resultado clássico <strong>de</strong> que a receita espera<strong>da</strong> do leiloeiro<br />

aumenta com o n o <strong>de</strong> compradores nos 4 formatos vistos é<br />

ilustrado com o seguinte exemplo p/ leilão <strong>de</strong> 2º lance:<br />

Seja um leilão <strong>de</strong> 2º lance com só dois competidores, sendo que<br />

ca<strong>da</strong> um tem uma valoração priva<strong>da</strong> <strong>de</strong> que o bem vale $ 10 ou<br />

$ 20 com 50% <strong>de</strong> chances ca<strong>da</strong> um. Qual a receita espera<strong>da</strong>?<br />

Note que existem 4 possibili<strong>da</strong><strong>de</strong>s, ca<strong>da</strong> uma com 25% <strong>de</strong><br />

chances: [10; 10]; [10; 20]; [20; 10]; [20; 20].<br />

Como é ótimo para ca<strong>da</strong> um <strong>da</strong>r um lance igual a seu valor, a<br />

receita do leiloeiro é: R n = 2 = ¾ . 10 + ¼ . 20 = $ 12,5.<br />

Consi<strong>de</strong>re agora o caso <strong>de</strong> três competidores. Teremos 2 3 = 8<br />

possibili<strong>da</strong><strong>de</strong>s com probabili<strong>da</strong><strong>de</strong> 1/8 ca<strong>da</strong> uma: [10; 10; 10];<br />

[10; 10; 20]; [10; 20; 10]; [10; 20; 20]; [20; 10; 10]; [20; 10; 20];<br />

[20; 20; 10]; [20; 20; 20]. A receita do leiloeiro será nesse caso:<br />

R n = 3 = ½ . 10 + ½ . 20 = $ 15. Como R n = 3 > R n = 2 ⇒ a receita<br />

aumentou com o número <strong>de</strong> competidores. Note que o 3º<br />

competidor não tinha valoração maior que os dois anteriores.<br />

81


Equivalência <strong>de</strong> Receita<br />

Um resultado clássico <strong>da</strong> teoria <strong>de</strong> leilões é a equivalência<br />

<strong>de</strong> receita (revenue equivalence) entre diversos formatos<br />

se ca<strong>da</strong> “bid<strong>de</strong>r” segue a estratégia equilíbrio <strong>de</strong> Nash.<br />

Se os jogadores têm valores in<strong>de</strong>pen<strong>de</strong>ntes, são neutros ao<br />

risco, sem restrição orçamentária e usam estratég. simétricas,<br />

então to<strong>dos</strong> os formatos <strong>de</strong> leilão razoáveis (1 o lance, 2 o lance,<br />

inglês, holandês) levam a mesma receita espera<strong>da</strong> p/ o leiloeiro!<br />

Não significa que exista só um equilíbrio <strong>de</strong> Nash. No leilão<br />

selado <strong>de</strong> 1º lance, por ex., existem múltiplos equilíbrios, mas eles<br />

levam ao mesmo resultado esperado para o leiloeiro.<br />

No leilão <strong>de</strong> 1º lance o vencedor paga um preço menor do que sua<br />

avaliação, mas ganha o leilão quem atribui o maior valor ao bem.<br />

Esses resulta<strong>dos</strong> clássicos não valem em situações tais como o<br />

leilão <strong>de</strong> bem <strong>de</strong> valor comum; com jogadores avessos ao risco;<br />

em merca<strong>dos</strong> <strong>de</strong> múltiplos itens (exceto ven<strong>da</strong>s individuais), etc.<br />

Corolário: A receita espera<strong>da</strong> do ven<strong>de</strong>dor aumenta com o n o<br />

<strong>de</strong> compradores nos 4 formatos menciona<strong>dos</strong>.<br />

Equivalência <strong>de</strong> Receita: Exemplo<br />

Para ilustrar o conceito <strong>de</strong> equivalência <strong>de</strong> receita,<br />

seja um leilão <strong>de</strong> valor privado com apenas dois<br />

interessa<strong>dos</strong>, cujos valores priva<strong>dos</strong> são v 1<br />

e v 2<br />

.<br />

Os valores priva<strong>dos</strong> são conhecimento apenas <strong>de</strong> ca<strong>da</strong> um,<br />

mas é conhecimento comum que os valores priva<strong>dos</strong> têm<br />

distribuição <strong>de</strong> prob. uniforme entre os valores 0 e 1000.<br />

O objeto po<strong>de</strong> ser leiloado em leilão selado <strong>de</strong> 1º ou <strong>de</strong> 2º<br />

lance. Mostre que em equilíbrio (EBN), a receita espera<strong>da</strong><br />

do leiloeiro em ambos os leilões é <strong>de</strong> 1000/3.<br />

OBS: no caso do leilão <strong>de</strong> 1º lance consi<strong>de</strong>re apenas o EBN<br />

simétrico simples, i. é, bids com a mesma proporção do seu<br />

valor: b 1 = k v 1 e b 2 = k v 2 , on<strong>de</strong> a proporção k é a mesma.<br />

No leilão <strong>de</strong> 1º lance, o vencedor também é que <strong>de</strong>u o maior<br />

lance b i , mas paga o seu próprio lance (e não o 2º maior bid).<br />

Note que, para a distrib. uniforme entre 0 e 1000, a <strong>de</strong>nsi<strong>da</strong><strong>de</strong><br />

<strong>de</strong> probabili<strong>da</strong><strong>de</strong> é 1/1000 e a acumula<strong>da</strong> Prob[v < x] = x/1000.<br />

82


Equivalência <strong>de</strong> Receita: Leilão 2º Lance<br />

No caso do leilão <strong>de</strong> 2º lance, vimos que b i = v i éEBN.<br />

Nesse caso, a receita espera<strong>da</strong> do leiloeiro é o valor esperado<br />

do 2º maior lance. Provaremos que b i = v i é igual a 1000/3.<br />

Note que o valor esperado <strong>da</strong> segun<strong>da</strong> maior valoração,<br />

condicional a conhecer o valor v 1 é:<br />

Prob[v 2<br />

≥ v 1<br />

] v 1<br />

+ Prob[v 2<br />


Equivalência <strong>de</strong> Receita: Leilão 1º Lance<br />

Para calcular a receita do leiloeiro, proce<strong>de</strong>-se <strong>de</strong> forma<br />

similar a anterior. Temos duas distribuições (p/ v 1 e v 2 ):<br />

Primeiro se condiciona em relação a uma <strong>de</strong>las e <strong>de</strong>pois se<br />

consi<strong>de</strong>ra a outra. Antes iniciamos com valor esperado do bid,<br />

condicional a conhecer o valor v 1 (ficava uma função <strong>de</strong> v 1 ) e<br />

<strong>de</strong>pois integrava em relação aos possíveis valores <strong>de</strong> v 1 . Po<strong>de</strong>-se<br />

fazer <strong>da</strong> mesma forma ou invertendo a or<strong>de</strong>m. Vamos inverter<br />

essa or<strong>de</strong>m e iniciar por v 2 e <strong>de</strong>pois integrar em relação a v 2 :<br />

1000⎛<br />

v2<br />

⎞ 1<br />

∫0<br />

⎜Prob[v1 ≤ v<br />

2] + Prob[v1 > v<br />

2] E[b<br />

1<br />

| v1 > v<br />

2] dv<br />

2<br />

2<br />

⎟<br />

⎝<br />

⎠1000<br />

1000⎛<br />

v2 v2 ⎛ v2 ⎞⎛ v2<br />

+ 1000 ⎞⎞<br />

1 1000<br />

= ∫ ⎜ + 1 dv<br />

0<br />

2<br />

=<br />

1000 2<br />

⎜ −<br />

1000<br />

⎟⎜ ⎟<br />

2×<br />

2<br />

⎟<br />

<br />

⎝ ⎝ ⎠⎝ ⎠⎠1000 3<br />

A explicação é similar ao caso anterior (leilão <strong>de</strong> 2º lance), mas<br />

usando o fato <strong>de</strong> que já foi mostrado que o ENB é jogar a meta<strong>de</strong> <strong>da</strong><br />

sua valoração (por isso apareceu v 2 /2 quando o jog. 2 ganha). Note<br />

que se v 1 > v 2 , então v 1 é um número equiprovável entre v 2 e 1000,<br />

cuja média é (v 2 +1000)/2. Como o EBN é v 1 /2, então fica (v 2 +1000)/4.<br />

Leilão Selado <strong>de</strong> Primeiro Lance<br />

No leilão selado <strong>de</strong> primeiro lance, o maior bid b 1 éo<br />

vencedor do leilão, recebe o bem e paga seu bid b 1 .<br />

Para o jogador i, com valor privado x, seu payoff π i é:<br />

π i = x − b i se b i > max j ≠ i b j ; ou π i = 0 se b i < max j ≠ i b j<br />

As estratégias <strong>dos</strong> jogadores são os valores <strong>de</strong> bid que<br />

são funções <strong>dos</strong> tipos, b i (θ). Consi<strong>de</strong>re apenas estratégias<br />

simétricas <strong>de</strong> equilíbrio, i. é, to<strong>dos</strong> os jogadores jogam a<br />

mesma função <strong>de</strong> seu tipo, b i (θ) = b j (θ) = b(θ).<br />

Proposição: O único equilíbrio em estratégias simétricas<br />

(EBN) num leilão <strong>de</strong> primeiro lance é (p/ to<strong>dos</strong> jogad.):<br />

b(v) = E[v 2 | v 2 < v] = E[segundo maior tipo | maior tipo = v]<br />

On<strong>de</strong> v 2 é o maior valor <strong>dos</strong> outros N − 1 valores in<strong>de</strong>pen<strong>de</strong>ntes.<br />

Ex.: Valores v com distribuição uniforme [0, 1] tem a solução para o<br />

bid do EBN: b(v) = [(N − 1)/N] v. Demonstração a seguir.<br />

84


Leilão Selado <strong>de</strong> 1º Lance: Exemplo<br />

Para ver o último resultado, seguirei McMillan (1992).<br />

Seja o valor privado do jogador 1, v 1 . Então:<br />

b 1 = k v 1 e b j = k v j para j = 2, 3, ... N.<br />

O jogador 1 ganha o leilão se v j ≤ b 1 /k, para todo j = 2, 3, ... N.<br />

Como as valorações são in<strong>de</strong>pen<strong>de</strong>ntes, a probab. <strong>de</strong> vitória é:<br />

Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = Pr[v 2 ≤ b 1 /k] x Pr[v 3 ≤<br />

b 1 /k] ... x Pr[v N ≤ b 1 /k].<br />

Como as distribuições são uniformes [0, 1], Pr[v j ≤ b 1 /k] = b 1 /k.<br />

Assim, a expressão anterior fica:<br />

Pr[v 2 ≤ b 1 /k, v 3 ≤ b 1 /k, ..., v N ≤ b 1 /k] = (b 1 /k) N – 1 . O payoff<br />

esperado do jogador 1 é: (v 1 –b 1 )(b 1 /k) N – 1 .<br />

O jogador 1 quer maximizar o payoff esperado escolhendo b 1 .<br />

Logo, usaremos a CPO (<strong>de</strong>riva o payoff esperado e iguala a 0):<br />

0 = [v 1 (N – 1) (b 1 ) N – 2 /k N – 1 ] – [N (b 1 /k) N – 1 ] ⇒ b 1 = v 1 (N – 1)/N □<br />

Ou seja, o k ótimo para o equilíbrio simétrico é (N – 1)/N.<br />

Note que se N → ∞ ⇒ b 1 (v) → v. Maior competição, maior receita.<br />

85

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!