UMA INTRODUÇÃO ÀTEORIA ECONÔMICA DOS JOGOS

UMA INTRODUÇÃO ÀTEORIA 

ECONÔMICA DOS JOGOS 

Humberto José Bortolossi 

Universidade Federal Fluminense 

Gilmar Garbugio 

Universidade Federal Fluminense 

Brígida Sartini 

Universidade Federal Rural do Rio de Janeiro 

VERSÃO 1.1.2 

2 de fevereiro de 2017 

Por favor, envie suas sugestões, correções e críticas para 

hjbortol@vm.uff.br, gilmarg@id.uff.br e brigida.sartini@gmail.com.

À minha esposa Joselí eà minha filha Hillary Winry. 

H. J. B. 

À minha mãe Rita e aos meus irmãos Humberto e Reginaldo. 

B. A. S. 

Aos meus pais Orlando e Iraci e aos meus irmãos Roseli, Rosinei, 

Rosana, Carla, Andréia e Reginaldo. 

G. G.

Sumário 

Prefácio 3 

1 Alguns marcos históricos 5 

2 Jogos na forma estratégica 10 

2.1 O que é um jogo? . . . . . . . . . . . . . . . . . . . . . 10 

2.2 Soluções de um jogo em estratégias puras . . . . . . . 13 

2.2.1 Dominância em estratégiaspuras........ 14 

2.2.2 Equilíbrio de Nash em estratégias puras . . . . 20 

2.2.3 Relações entre dominância e equilíbrio de Nash 24 

2.3 Estratégias mistas . . . . . . . . . . . . . . . . . . . . 27 

2.4 Soluções de um jogo em estratégias mistas . . . . . . . 31 

2.4.1 Dominância em estratégias mistas . . . . . . . 32 

2.4.2 Equilíbrio de Nash em estratégias mistas . . . . 35 

2.4.3 Relações entre dominância e equilíbrio de Nash 45 

2.4.4 Como interpretar estratégias mistas? . . . . . . 45 

2.5 Jogos infinitos . . . . . . . . . . . . . . . . . . . . . . . 48 

2.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . 50 

3 O teorema de equilíbrio de Nash 60 

3.1 Usando o teorema de Brouwer . . . . . . . . . . . . . . 60 

3.2 Usando o teorema de Kakutani . . . . . . . . . . . . . 65 

3.3 Algumas propriedades dos equilíbrios de Nash . . . . . 69 

3.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . 70 

1

2 Sumário 

4 Calculando equilíbrios de Nash 71 

4.1 Equilíbrio de Nash via um problema de otimização . . 71 

4.2 Equilíbrio de Nash via equações polinomiais . . . . . . 74 

4.3 Jogos de soma zero . . . . . . . . . . . . . . . . . . . . 82 

4.3.1 Jogos de soma constante com dois jogadores . . 82 

4.3.2 Equilíbrio de Nash em estratégias puras . . . . 86 

4.3.3 Equilíbrio de Nash em estratégias mistas . . . . 91 

4.3.4 O teorema minimax de von Neumann . . . . . 93 

4.4 Equilíbrio de Nash via um problema de complementaridade 

. . . . . . . . . . . . . . . . . . . . . . . . . . . 101 

4.4.1 Jogos bimatriciais . . . . . . . . . . . . . . . . 101 

4.4.2 O algoritmo de Lemke-Howson . . . . . . . . . 104 

4.5 Gambit . . . . . . . . . . . . . . . . . . . . . . . . . . 104 

4.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . 106 

5 Jogos na forma extensa 108 

5.1 Definição . . . . . . . . . . . . . . . . . . . . . . . . . 108 

5.2 Equilíbrio de Nash . . . . . . . . . . . . . . . . . . . . 110 

5.3 Indução retroativa e equilíbrio perfeito em subjogos . . 114 

5.4 O teorema de Kuhn-Zermelo . . . . . . . . . . . . . . 118 

5.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . 119 

6 Exemplos 120 

6.1 O jogo Le Her simplificado . . . . . . . . . . . . . . . . 120 

6.2 O modelo de duopólio de Cournot . . . . . . . . . . . 126 

6.3 O modelo de duopólio de Bertrand . . . . . . . . . . . 129 

6.4 O modelo de duopólio de Stackelberg . . . . . . . . . . 131 

6.5 A tragédia dos comuns . . . . . . . . . . . . . . . . . . 133 

A Convexidade 137 

B Programação Linear 145 

C Respostas dos exercícios 155 

Bibliografia 173 

Índice 183

Prefácio 

A teoria dos jogos é uma teoria matemática criada para se modelar 

fenômenos que podem ser observados quando dois ou mais “agentes de 

decisão” interagem entre si. Ela fornece a linguagem para a descrição 

de processos de decisão conscientes e objetivos envolvendo mais de 

um indivíduo. 

Suas aplicações incluem eleições, leilões, balanço de poder, evolução 

genética, etc. Ela também é uma teoria matemática pura, que 

pode e tem sido estudada como tal, sem a necessidade de relacioná-la 

com problemas comportamentais ou jogos per se. 

Algumas pessoas acreditam que a teoria dos jogos formará, algum 

dia, o alicerce de um conhecimento técnico estrito de como decisões 

são feitas e de como a economia funciona. A teoria ainda não atingiu 

este patamar e, hoje, é mais estudada em seus aspectos matemáticos 

puros e, em aplicações, ela é usada como uma ferramenta ou alegoria 

que auxiliam no entendimento de sistemas mais complicados. 

Neste texto trataremos da teoria matemática dos jogos não-cooperativos 

estáticos de informação completa e dos jogos dinâmicos de 

informação perfeita. 

A Teoria Econômica dos Jogos não deve ser confundida com a 

Teoria Combinatória dos Jogos, iniciada por Sprague e Grundy na 

década de 30. Enquanto que a primeira tem motivações predominante 

econômicas e procura estabelecer métodos para se maximizar 

o ganho (payoff ), a segunda se concentra nos aspectos combinatórios 

de jogos de mesa (por exemplo, a estratégia do jogo de nim) enão 

permite “elementos imprevisíveis” como o lançamento de um dado 

ou o embaralhamento de cartas. 

Acreditamos que o assunto seja estimulante para o estudante de 

matemática: ele terá a oportunidade de ver como conceitos de análise, 

3

4 Prefácio 

topologia, otimização e probabilidade se integram em uma teoria aplicada. 

Agradecimentos 1 

Gostaríamos de agradecer a Hilmar Ilton Santana Ferreira, Polyane 

Alves Santos e Larissa Santana Barreto, que participaram ativamente 

dos seminários sobre teoria dos jogos realizados no período 

2003-2004, momento no qual uma versão preliminar deste texto foi 

escrita. Também gostaríamos de agradecer a Rita de Cássia Silva 

Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que 

leram o texto e fizeram várias sugestões. Finalmente, gostaríamos de 

agradecer a Seção de Referência (SRE) da Divisão de Bibliotecas e 

Documentação da PUC-Rio pela agilidade e eficiência na aquisição 

de alguns artigos difíceis de se encontrar. 

Agradecimentos 2 

Gostaríamos de agradecer às várias pessoas que, após a divulgação 

da versão Creative Commons deste livro, colaboraram com sugestões: 

Doherty Andrade, Carlos Frederico Palmeira. 

Humberto José Bortolossi 

Brígida Alexandre Sartini 

Gilmar Garbugio 

1 de fevereiro de 2017

Capítulo 1 

Alguns marcos 

históricos 

Neste capítulo apresentaremos alguns marcos históricos da teoria 

dos jogos relacionados principalmente com os tópicos que iremos explorar 

no texto. Para uma cronologia mais completa, recomendamos 

as referências [46, 50, 65, 86, 95, 96]. 

O conceito de solução de um jogo por estratégia mista 1 surgiu pela 

primeira vez no estudo do jogo Le Her, realizado por James Waldegrave 

e descrito por ele em uma carta a Pierre Rémond de Montmort, 

em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar 

uma estratégia que maximizasse a probabilidade de vitória do jogador, 

independentemente da escolha de estratégia de seu oponente. 

Este jogo foi discutido por Montmort e por Nicholas Bernoulli em 

1713 e os resultados foram publicados nesse ano por Montmort, que 

incluiu a solução de Waldegrave em um apêndice. 

Em 1838, Augustin Cournot publicou sua obra Recherches sur 

les Principes Mathematiques de la Theorie des Richesses, na qual 

analisou um caso especial de duopólio. As empresas decidiam as 

quantidades a produzir e Cournot definiu o conceito de equilíbrio de 

1 Uma estratégia pura é uma das escolhas que o jogador pode fazer. Uma 

estratégia mista é uma distribuição de probabilidades sobre o conjunto de estratégias 

puras. Definições formais serão apresentadas no próximo capítulo. 

5

6 [CAP. 1: ALGUNS MARCOS HISTÓRICOS 

Figura 1.1: Antoine Augustin Cournot (1801–1877). 

mercado como sendo a situação em que ambas as empresas reagem 

de forma ótima à decisão da empresa concorrente. Este conceito 

de solução éumaversão do equilíbriodeNashaplicadoaocasodo 

duopólio. 

No início do século XX, apareceram vários artigos sobre teoria dos 

jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo 

de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die 

Theorie des Schachspiels, afirmando que, em cada etapa do jogo, pelo 

menos um dos jogadores possui uma estratégia que o levará avitória 

ou ao empate. Contudo, Zermelo não demonstrou o teorema em seu 

artigo. A primeira demonstração foi dada por Laszlo Kalmar. Aparentemente, 

foi Zermelo quem primeiro destacou o uso da semântica 

de otimalidade em teoria dos jogos: “Whether one could calculate 

with mathematical objectivity, or even give a participant some idea 

of, the value of a possible position in the game, as well as of the best 

move in this position: information without which the player would 

have to eliminate both subjective and psychological guesses and the 

opinions of ‘the perfect player’, etc.?” ([95]). 

No período de 1921 a 1927, Émile Borel publicou uma série de 

notas sobre jogos simétricos de soma zero com dois jogadores com 

um número finito n de estratégias puras para cada jogador. Borel 

foi o primeiro a tentar formular matematicamente este jogo. Ele introduziu 

o conceito de “método de jogada” (o que hoje corresponde 

àestratégia pura) e procurou por uma solução em estratégias mistas 

(o que hoje é conhecido como solução minimax). Em 1921, ele 

provou a existência de tal solução para n = 3 ([07]) e, em 1924,

7 

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (1871–1953). 

para n = 5 ([08]). Borel acreditava que o resultado de existência 

não seria válido para um n qualquer, mas como não encontrou um 

contra-exemplo, deixou o problema em aberto. 

Figura 1.3: Félix Edouard Justin Émile Borel (1871-1956). 

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando 

topologia e cálculo funcional ([50]), John von Neumann demonstrou 

aexistência de solução em estratégias mistas de um jogo finito de 

soma zero com dois jogadores e um número arbitrário de estratégias 

puras. Este artigo também introduziu a forma extensa de um jogo. 

Até adécada de 40, os artigos publicados sobre teoria dos jogos 

não tinham despertado muito o interesse dos cientistas sociais e de 

outras áreas que pesquisavam sobre conflitos de interesses. Talvez 

isto se deva ao fato de que os artigos eram escritos por matemáticos 

e publicados em revistas matemáticas. Este panorama foi alterado 

com a publicação em 1944 do livro Theory of Games and Economic

8 [CAP. 1: ALGUNS MARCOS HISTÓRICOS 

Behavior, escrito por John von Neumann e pelo economista Oskar 

Morgenstern, um marco na teoria dos jogos. 

Oskar Morgenstern John von Neumann 

(1902-1977) (1903-1957) 

Figura 1.4: Oskar Morgenstern e John von Neumann. 

Eles detalharam a formulação de problemas econômicos e mostraram 

várias possibilidades de aplicação da teoria dos jogos em economia, 

procurando apresentar as motivações, os raciocínios e as conclusões 

da teoria de forma acessível, atraindo assim a atenção de pesquisa-

9 

dores de diversas áreas. Na reedição de 1947, tomada como padrão, 

os autores estabeleceram os axiomas da teoria da utilidade. O livro 

foi republicado em 1953 e sua mais recente edição é de 1980. 

Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua 

tese de doutorado em 1949, sob o título Non-Cooperative Games. Ele 

definiu o conceito de ponto de equilíbrio, atualmente conhecido como 

equilíbrio de Nash de um jogo e provou sua existência para jogos nãocooperativos. 

Os resultados mais importantes de sua tese estão no 

artigo Equilibrium Points in N-Person Games de 1950 ([66]) e, mais 

detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]). 

Ainda em 1950, Nash escreveu sobre o problema da barganha em 

The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos cooperativos 

em Two Person Cooperative Games ([70]). Nestes, Nash 

definiu o conceito de solução da barganha de Nash em um jogo cooperativo 

com dois jogadores, estabeleceu um sistema de axiomas que 

esta solução deveria satisfazer e provou a existência e unicidade desta 

solução. 

Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam 

oPrêmio Nobel de Economia em reconhecimento ao trabalho pioneiro 

sobre análise de equilíbrio na teoria de jogos não-cooperativos. 

(a) (b) (c) 

Figura 1.5: Ganhadores do prêmio Nobel de Economia em 1994: 

(a) John Harsanyi (1920-2000), (b) John Forbes Nash Jr. 

(1928-2015) e (c) Reinhard Selten (1930-2016).

Capítulo 2 

Jogos na forma 

estratégica 

2.1 O que é um jogo? 

A teoria dos jogos pode ser definida como a teoria dos modelos 

matemáticos que estuda a escolha de decisões ótimas sob condições 

de conflito. O elemento básico em um jogo é o conjunto de jogadores 

que dele participam. Cada jogador tem um conjunto de estratégias. 

Quando cada jogador escolhe sua estratégia, temos então uma situação 

ou perfil no espaço de todas as situações (perfis) possíveis. 

Cada jogador tem interesse ou preferências para cada situação no 

jogo. Em termos matemáticos, cada jogador tem uma função utilidade 

que atribui um número real (o ganho ou payoff do jogador) 

a cada situação do jogo. Mais especificamente, um jogo tem os seguintes 

elementos básicos: existe um conjunto finito de jogadores, 

representado por 

G = {g 1 ,g 2 ,...,g n }, 

e cada jogador g i ∈ G possui um conjunto finito 

S i = {s i1 ,s i2 ,...,s imi } 

10

[SEC. 2.1: O QUE É UM JOGO? 11 

de opções, denominadas estratégias puras do jogador g i (m i ≥ 2). 

Um vetor 

s =(s 1j1 ,s 2j2 ,...,s njn ), 

onde s iji éumaestratégia pura para o jogador g i ∈ G, édenominado 

um perfil de estratégias puras. O conjunto de todos os perfis de 

estratégias puras formam, portanto, o produto cartesiano 

S = 

n∏ 

S i = S 1 × S 2 ×···×S n , 

i=1 

Para cada joga- 

denominado espaço de estratégias puras do jogo. 

dor g i ∈ G, existeumafunção utilidade 

u i : S → R 

s ↦→ u i (s) 

que associa o ganho (payoff) u i (s) do jogador g i a cada perfil de 

estratégias puras s ∈ S. Esta função utilidade éumaformaderepresentar 

a preferência do jogador g i com relação aos vários perfis de 

estratégias do jogo ([13]). 

Jogos descritos nesta forma são denominados jogos estratégicos ou 

jogos na forma normal. Neles, cada jogador deve fazer a sua escolha 

de estratégia sem o conhecimento das escolhas dos demais jogadores. 

Admite-se, contudo, que cada jogador conhece toda a estrutura do 

jogo. Por este motivo, jogos deste tipo também são denominados 

jogos não-cooperativos de informação completa. 

Assume-se também que os jogadores sejam racionais, istoé, eles 

sempre escolherão ações que maximizem a sua função utilidade. Além 

de ser racional, cada jogador (1) sabe que seus adversários também 

são racionais, (2) sabe que eles sabem que o jogador sabe que eles são 

racionais, ad infinitum. 

Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exemplo 

mais conhecido na teoria dos jogos éodilema do prisioneiro. Ele 

foi formulado por Albert W. Tucker em 1950, em um seminário para 

psicólogos na Universidade de Stanford, para ilustrar a dificuldade de 

se analisar certos tipos de jogos. 

A situação é a seguinte: dois ladrões, Al e Bob, são capturados 

e acusados de um mesmo crime. Presos em selas separadas e sem

12 [CAP. 2: JOGOS NA FORMA ESTRATÉGICA 

poderem se comunicar entre si, o delegado de plantão faz a seguinte 

proposta: cada um pode escolher entre confessar ou negar o crime. 

Se nenhum deles confessar, ambos serão submetidos a uma pena de 

1ano. Seosdoisconfessarem,então ambos terão pena de 5 anos. Mas 

se um confessar e o outro negar, então o que confessou será libertado 

eooutroserá condenado a 10 anos de prisão. Neste contexto, temos 

G = {Al, Bob}, 

S Al = {confessar, negar}, S Bob = {confessar, negar}, 

S = S Al × S Bob = 

{(confessar, confessar), (confessar, negar), 

(negar, confessar), (negar, negar)}. 

As duas funções utilidade 

u Al : S → R e u Bob : S → R 

são dadas por 

u Al (confessar, confessar) = −5, u Al (confessar, negar) = 0, 

u Al (negar, confessar) = −10, u Al (negar, negar) = −1, 

(que representam os ganhos de Al) e 

u Bob (confessar, confessar) = −5, u Bob (confessar, negar) = −10, 

u Bob (negar, confessar) = 0, u Bob (negar, negar) = −1 

(que representam os ganhos de Bob). Éumaprática representar os 

payoffs dos jogadores através de uma matriz, denominada matriz de 

payoffs. 

Bob 

confessar 

negar 

confessar (−5, −5) (0, −10) 

Al 

negar (−10, 0) (−1, −1) 

Nesta matriz, os números de cada célula representam, respectivamente, 

os payoffs de Al e Bob para as escolhas de Al e Bob correspondentes 

a célula.

[SEC. 2.2: SOLUÇÕESDEUMJOGOEMESTRATÉGIAS PURAS 13 

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher 

desejam sair para passear. O homem prefere assistir a um jogo de 

futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem 

juntos para o futebol, então o homem tem satisfação maior do que a 

mulher. Por outro lado, se eles forem juntos ao cinema, entãoamulher 

tem satisfação maior do que o homem. Finalmente, se eles saírem 

sozinhos, então ambos ficam igualmente insatisfeitos. Esta situação 

também pode ser modelada como um jogo estratégico. Temos: 

G = {homem, mulher}, 

S homem = {futebol, cinema}, S mulher = {futebol, cinema}, 

S = S homem × S mulher = 

{(futebol, futebol), (futebol, cinema), 

(cinema, futebol), (cinema, cinema)}. 

As duas funções utilidade u homem : S → R e u mulher : S → R são 

descritas pela seguinte matriz de payoffs: 

futebol 

Mulher 

cinema 

Homem 

futebol (10, 5) (0, 0) 

cinema (0, 0) (5, 10) 

. 

2.2 Soluções de um jogo em estratégias 

puras 

Uma solução de um jogo é uma prescrição ou previsão sobre o resultado 

do jogo. Existem vários conceitos diferentes de solução. Nesta 

seção, investigaremos os dois conceitos mais comuns: dominância e 

equilíbrio de Nash. 

Considere o dilema do prisioneiro. Como encontrar uma solução 

para o dilema de Al e Bob, isto é, que estratégias são plausíveis


se os dois prisioneiros querem minimizar 1 o tempo de cadeia? Se 

analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da 

seguinte maneira: 

“Duas coisas podem acontecer: Bob pode confessar ou 

Bob pode negar. Se Bob confessar, então émelhorpara 

mim confessar também. Se Bob não confessar, então eu 

fico livre se eu confessar. Em qualquer um dos casos, é 

melhor para mim confessar. Então, eu confessarei.” 

Se analisarmos agora o jogo do ponto de vista de Bob, podemos 

aplicar a mesma linha de raciocínio e concluir que Bob também irá 

confessar. Assim, ambos confessarão e ficarão presos por 5 anos. 

Em termos da teoria dos jogos, dizemos que (1) os dois jogadores 

possuem uma estratégia dominante, istoé, todas menos uma 

estratégia é estritamente dominada, (2) que o jogo éresolúvel por dominância 

estrita iterada e (3) que o jogo termina em uma solução que 

éumequilíbrio de estratégia dominante, conceitos que definiremos a 

seguir. 

2.2.1 Dominância em estratégias puras 

Freqüentemente, iremos discutir perfis de estratégia na qual apenas 

a estratégia de um único jogador g i ∈ G irá variar, enquanto que 

as estratégias de seus oponentes permanecerão fixas. Denote por 

s −i =(s 1j1 ,...,s (i−1)ji−1 ,s (i+1)ji+1 ,...,s njn ) ∈ 

S −i = S 1 ×···×S i−1 × S i+1 ×···×S n 

uma escolha de estratégia para todos os jogadores, menos o jogador g i . 

Desta maneira, um perfil de estratégias pode ser convenientemente 

denotado por 

s =(s iji , s −i )=(s 1j1 ,...,s (i−1)ji−1 ,s iji ,s (i+1)ji+1 ,...,s njn ). 

1 No Exemplo 2.1, os payoffs foram definidos como números ≤ 0. Desta maneira, 

minimizar o tempo de cadeia é equivalente a maximizar o payoff.


Definição 2.1 (Estratégia Pura Estritamente Dominada) 

Dizemos que uma estratégia pura s ik ∈ S i do jogador 

g i ∈ G é estritamente dominada pela estratégia s ik ′ ∈ S i se, 

independentemente das escolhas dos demais jogadores, o jogador 

g i ganhar mais escolhendo s ik ′ do que s ik ,istoé, se 

para todo s −i ∈ S −i . 

u i (s ik ′, s −i ) >u i (s ik , s −i ), 

Definição 2.2 (em estratégias puras) 

(a) (Dominância Estrita Iterada) Dominância estrita iterada 

é o processo no qual, seqüencialmente, se eliminam as 

estratégias que são estritamente dominadas. 

(b) (Equilíbrio de Estratégia Estritamente Dominante) 

Quando o processo de dominância estrita iterada reduz 

o jogo para um único perfil de estratégias puras s ∗ , dizemos 

que s ∗ éumequilíbrio de estratégia estritamente dominante. 

Exemplo 2.3 Considere o jogo determinado pela matriz de payoffs 

abaixo. 

g 2 

s 21 s 22 s 23 s 24 

g 1 

s 12 (0, 0) (3, 2) (2, 1) (1, 1) 

s 11 (5, 2) (2, 6) (1, 4) (0, 4) 

s 13 (7, 0) (2, 2) (1, 1) (5, 1) 

s 14 (9, 5) (1, 3) (0, 2) (4, 8)


Neste jogo, para o jogador g 2 ,aestratégia s 21 éestritamentedominada 

pela estratégia s 24 e, assim, a primeira coluna da matriz pode 

ser eliminada. 

g 2 

s 22 s 23 s 24 

g 1 

s 12 (3, 2) (2, 1) (1, 1) 

s 11 (2, 6) (1, 4) (0, 4) 

s 13 (2, 2) (1, 1) (5, 1) 

s 14 (1, 3) (0, 2) (4, 8) 

Agora, nesta matriz reduzida, para o jogador g 1 ,asestratégias s 11 

e s 14 são estritamente dominadas pelas estratégias s 12 e s 13 , respectivamente. 

Portanto, as linhas 1 e 4 podem ser eliminadas. Além 

disso, a estratégia s 23 do jogador g 2 é estritamente dominada pela estratégia 

s 22 . Assim, a coluna 2 também pode ser eliminada. Obtemos 

então uma matriz reduzida 2 × 2. 

g 2 

s 22 s 24 

g 1 

s 12 (3, 2) (1, 1) 

s 13 (2, 2) (5, 1) 

Finalmente, a estratégia s 24 do jogador g 2 é estritamente dominada 

pela estratégia s 22 e, na matriz 2 × 1 resultante, a estratégia s 13 do 

jogador g 1 éestritamentedominadapelaestratégia s 12 . Vemos então 

que (s 12 ,s 22 )éoequilíbrio de estratégias estritamente dominantes do 

jogo: o jogador g 1 escolhe a estratégia s 12 (ganhando 3) e o jogador g 2 

escolhe a estratégia s 22 (ganhando 2). 

Note que, em cada passo do processo de eliminação das estratégias 

estritamente dominadas, o jogo é substituído por um outro jogo


mais simples, no sentido de que o conjunto de estratégias puras 

de um jogador (aquele que tem uma estratégia estritamente dominada) 

é substituído por um subconjunto com menos elementos (obtido 

removendo-se justamente as estratégias que são estritamente dominadas). 

No exemplo acima, os conjuntos de estratégias puras iniciais 

dos dois jogadores são dados, respectivamente, por 

S 1 = {s 11 ,s 12 ,s 13 ,s 14 } e S 2 = {s 21 ,s 22 ,s 23 ,s 24 }. 

Como a estratégia pura s 21 é estritamente dominada por s 24 ,oconjunto 

S 2 é substituído por {s 22 ,s 23 ,s 24 } = S 2 −{s 21 }. O conjunto S 1 

permanece o mesmo. Sendo assim, podemos substituir o jogo original 

por um mais simples, onde os conjuntos de estratégias puras dos dois 

jogadores são dados por 

S (1) 

1 = {s 11 ,s 12 ,s 13 ,s 14 } e S (1) 

2 = {s 22 ,s 23 ,s 24 }. 

As funções utilidade do novo jogo são as restrições das funções utilidade 

do jogo original aos novos conjuntos de estratégias puras: 

u 1 | S 

(1) 

1 

e u 2 | S 

(1) 

2 

. 

Para o novo jogo, vemos que as estratégias s 11 e s 14 são estritamente 

dominadas pelas estratégias s 12 e s 13 , respectivamente. Logo, podemos 

simplificar o jogo mais uma vez, considerando os conjuntos de 

estratégias puras 

S (2) 

1 = {s 12 ,s 13 } e S (2) 

2 = {s 22 ,s 23 ,s 24 }. 

Seguindo com as outras eliminações, terminamos com um jogo muito 

simples, onde cada conjunto de estratégias puras é unitário: 

S (5) 

1 = {s 12 } e S (5) 

2 = {s 22 }. 

Este processo de eliminação gerou, portanto, uma cadeia de espaços 

de estratégias puras: 

S = S 1 × S 2 S (1) = S (1) 

1 × S (1) 

2 S (2) = S (2) 

1 × S (2) 

2 ··· 

S (5) = S (5) 

1 × S (5) 

2 = {(s 12 ,s 22 )}.


Neste exemplo, a técnica de dominância estrita iterada forneceu um 

único perfil de estratégias como solução do jogo, no caso, o perfil 

(s 12 ,s 22 ) ∈ S (5) 

1 × S (5) 

2 . 

Contudo, pode acontecer da técnica fornecer vários perfis ou, até 

mesmo, fornecer todo o espaço de estratégias, como é o caso da batalha 

dos sexos, onde não existem estratégias estritamente dominadas. 

Um outro conceito importante éodeestratégia pura fracamente 

dominada. 

Definição 2.3 (Estratégia Pura Fracamente Dominada) 

Dizemos que uma estratégia pura s ik ∈ S i do jogador 

g i ∈ G é fracamente dominada pela estratégia s ik ′ ∈ S i 

se 

u i (s ik ′, s −i ) ≥ u i (s ik , s −i ), 

para todo s −i ∈ S −i e, pelo menos para algum s • −i ∈ S −i, 

u i (s ik ′, s • −i) >u i (s ik , s • −i). 

Em outras palavras, s ik ∈ S i é fracamente dominada por 

s ik ′ ∈ S i se, independentemente das escolhas dos demais jogadores, 

o jogador g i nada perde se trocar a estratégia s ik ∈ S i 

pela estratégia s ik ′ ∈ S i e, pelo menos para uma escolha dos 

demais jogadores, esta troca dá ao jogador g i um ganho maior. 

Definição 2.4 

(a) (Dominância Fraca Iterada) Dominância fraca iterada 

é o processo no qual, seqüencialmente, se eliminam as estratégias 

que são fracamente dominadas. 

(b) (Equilíbrio de Estratégia Fracamente Dominante) 

Quando o processo de dominância fraca iterada reduz o jogo 

para um único perfil de estratégias puras s ∗ , dizemos que 

s ∗ éumequilíbrio de estratégia fracamente dominante.


Exemplo 2.4 Considere o jogo cuja matriz de payoffs é dada por: 

g 2 

s 21 s 22 

g 1 

s 11 (1, 1) (1, 0) 

s 12 (1, 0) (0, 1) 

. 

Aestratégia s 12 do jogador g 1 éfracamentedominadapelaestratégia 

s 11 . Eliminando-a, obtemos a matriz reduzida: 

g 2 

s 21 s 22 

g 1 s 11 (1, 1) (1, 0) 

. 

Vemos agora que a estratégia s 22 do jogador 2 éestritamentedominada 

pela estratégia s 21 . Sendo assim, (s 11 ,s 21 )éoequilíbrio de 

estratégias fracamente dominadas do jogo. 

Uma pergunta natural é se o processo de eliminação das estratégias 

dominadas depende ou não da ordem em que são realizadas. Para 

ocasodeestratégias estritamente dominadas, pode-se mostrar que 

esta ordem é irrelevante, isto é, independentemente da ordem em 

que as estratégias (estritamente dominadas) são eliminadas, obtém-se 

sempre a mesma matriz reduzida no final do processo. Por outro lado, 

o processo de eliminação das estratégias fracamente dominadas pode 

conduzir a resultados diferentes, dependendo da ordem de eliminação. 

Considere, por exemplo, o jogo (conforme [32]): 

g 2 

s 21 s 22 s 23 

g 1 

s 11 (0, 2) (0, 0) (1, 0) 

s 12 (0, 3) (1, 0) (0, 0) 

.


Eliminando-se, em sequência, as estratégias s 23 (que éestritamente 

dominada por s 21 ), s 11 (que é fracamente dominada por s 12 )es 22 

(que é estritamente dominada por s 21 ), obtemos (s 12 ,s 21 )comoresposta. 

Agora, eliminando-se, em sequência, as estratégias s 22 (que 

é estritamente dominada por s 21 ), s 12 (que é fracamente dominada 

por s 11 )es 23 (que é estritamente dominada por s 21 ), obtemos outra 

resposta: (s 11 ,s 21 ). Para detalhes sobre este assunto, recomendamos 

as referências [01, 15, 26, 32, 47, 55]. 

Com relação à complexidade computacional, os resultados mostram 

que os problemas relacionados com estratégias estritamente dominadas 

tendem a ser mais fáceis (no sentido que eles podem ser 

resolvidos em tempo polinomial), enquanto que questões envolvendo 

estratégias fracamente dominadas são mais difíceis (no sentido que 

eles são NP-completos). Por exemplo, saber se uma dada submatriz 

de uma matriz de payoffs pode ser obtida através do processo de 

eliminação de estratégias dominadas é um problema polinomial para 

ocasodeestratégias estritamente dominadas e éumproblemaNP- 

Completoparaocasodeestratégias fracamente dominadas. Detalhes 

sobre o assunto podem ser encontrados nas referências [18, 33]. 

2.2.2 Equilíbrio de Nash em estratégias puras 

Uma solução estratégica ou equilíbrio de Nash de um jogo éum 

perfil de estratégias onde cada jogador não tem incentivo de mudar 

sua estratégia se os demais jogadores não o fizerem. 

Definição 2.5 (Equilíbrio de Nash) Dizemos que um perfil 

de estratégias 

s ∗ =(s ∗ 1,...,s ∗ (i−1) ,s∗ i ,s ∗ (i+1) ,...,s∗ n) ∈ S 

éumequilíbrio de Nash se 

u i (s ∗ i , s ∗ −i) ≥ u i (s iji , s ∗ −i) 

para todo i =1,...,neparatodoj i =1,...,m i ,comm i ≥ 2.


Exemplo 2.5 

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias 

(confessar, confessar) é um equilíbrio de Nash. De fato: 

e 

u Al (confessar, confessar) = −5 > −10 = u Al (negar, confessar) 

u Bob (confessar, confessar) = −5 > −10 = u Bob (confessar, negar). 

Estas desigualdades mostram que, para o perfil de estratégias 

(confessar, confessar), um prisioneiro não se sente motivado a 

mudar a sua estratégia se o outro nãoofizer(elenão vai ficar 

menos tempo na cadeia fazendo isto). 

Já o perfil (negar, confessar) não é um equilíbrio de Nash do 

jogo pois, neste caso, dado que Bob decide confessar, Al fica 

menos tempo na cadeia se mudar a sua estratégia de negar para 

confessar. Em outras palavras, para o perfil (negar, confessar), 

Al se sente motivado a mudar a sua estratégia se Bob nãoofizer. 

Os perfis (confessar, negar) e (negar, negar) também não são 

equilíbrios de Nash. Em (confessar, negar), Bob se sente motivado 

a mudar a sua estratégia se Al não o fizer e, em (negar, 

negar), cada um dos prisioneiros se sente motivado a mudar a 

sua estratégia se o outro não o fizer. Desta maneira, vemos que 

oúnico equilíbrio de Nash do jogo é (confessar, confessar). 

(b) Na batalha dos sexos (Exemplo 2.2), os perfis de estratégia (futebol, 

futebol) e (cinema, cinema) são os únicos equilíbrios de 

Nash do jogo. 

(c) No Exemplo 2.3, o único equilíbrio de Nash do jogo éoperfilde 

estratégias (s 12 ,s 22 ). 

Existem, contudo, jogos que não possuem equilíbrios de Nash em 

estratégias puras. Este é o caso, por exemplo, do jogo de comparar 

moedas (matching pennies).


Exemplo 2.6 (Comparar moedas) Nesse jogo, dois jogadores exibem, 

ao mesmo tempo, a moeda que cada um esconde em sua mão. 

Se ambas as moedas apresentam cara ou coroa, o segundo jogador 

dá sua moeda para o primeiro. Se uma das moedas apresenta cara, 

enquanto a outra apresenta coroa, é a vez do primeiro jogador dar 

sua moeda para o segundo. Esse jogo se encontra representado por 

sua matriz de payoffs dada abaixo. 

g 2 

s 21 s 22 

g 1 

s 11 (+1, −1) (−1, +1) 

s 12 (−1, +1) (+1, −1) 

Observe que o perfil de estratégias (s 11 ,s 21 )não é um equilíbrio de 

Nash em estratégias puras, pois se o jogador g 1 mantiver a sua estratégia 

s 11 , o jogador g 2 terá um ganho maior se mudar sua estratégia 

de s 21 para s 22 ,istoé, ele se sente motivado a mudar a sua 

estratégia se o jogador g 1 não mudar a sua escolha. O mesmo comportamento 

ocorre para o perfil de estratégias (s 12 ,s 22 ). Já, para os 

perfis (s 11 ,s 22 )e(s 12 ,s 21 ), é o jogador g 1 que se sente motivado a 

mudar de estratégia para ganhar mais, se o jogador g 2 mantiver a sua 

estratégia. Isto mostra que o jogo de comparar moedas não possui 

equilíbrios de Nash em estratégias puras. 

Existe uma maneira conveniente de se caracterizar equilíbrios de 

Nash através das funções de melhor resposta. De maneira informal, 

a melhor resposta de um jogador para uma determinada escolha de 

estratégias dos demais jogadores é o conjunto de estratégias do jogador 

que maximizam o seu ganho quando os demais jogadores não 

mudam as suas escolhas. Mais precisamente, temos a seguinte 

Definição 2.6 (Funções de melhor resposta) A função de 

melhor resposta do jogador g i é a aplicação 

MR i : S −i → 2 Si


definida por 

MR i (s −i ) = argmax si∈S i 

u i (s i , s −i ) 

= {s ∗ i ∈ S i |∀s i ∈ S i ,u i (s ∗ i , s −i) ≥ u i (s i , s −i )}, 

com s −i ∈ S −i (aqui 2 Si representa o conjunto das partes de S i ). 

A função de melhor resposta do jogo é a aplicação 

definida por 

MR: S → 2 S 

MR(s) =(MR 1 (s −1 ), MR 2 (s −2 ),...,MR n (s −n )), 

com s ∈ S. Observação: alguns autores usam as notações 

MR i : S −i ⇒ S i eMR i : S −i →→ S i para representar a função 

de melhor resposta MR i : S −i → 2 Si . 

Exemplo 2.7 

(a) No dilema do prisioneiro (Exemplo 2.1), temos 

MR Al : S Bob →→ S Al 

confessar ↦→ {confessar} 

negar ↦→ {confessar} 

MR Bob : S Al →→ S Bob 

confessar ↦→ {confessar} 

negar ↦→ {confessar}. 

(b) Na batalha dos sexos (Exemplo 2.2), temos 

MR Homem : S Mulher →→ S Homem 

futebol ↦→ {futebol} 

cinema ↦→ {cinema} 

MR Mulher : S Homem →→ S Mulher 

futebol ↦→ {futebol} 

cinema ↦→ {cinema}.


(c) No Exemplo 2.3, temos 

MR 1 (s 21 )={s 14 }, MR 1 (s 22 )={s 12 }, 

MR 1 (s 23 )={s 12 }, MR 1 (s 24 )={s 13 }, 

MR 2 (s 11 )={s 22 }, MR 2 (s 12 )={s 22 }, 

MR 2 (s 13 )={s 22 }, MR 2 (s 14 )={s 24 }. 

(d) No jogo de comparar moedas (Exemplo 2.6), temos 

MR 1 (s 21 )={s 11 }, MR 1 (s 22 )={s 12 }, 

MR 2 (s 11 )={s 22 }, MR 2 (s 12 )={s 21 }. 

Apróxima proposição é uma consequência direta das definições 

de equilíbrio de Nash e funções de melhor resposta. 

Proposição 2.1 s ∗ =(s ∗ 1 ,...,s∗ i ,...,s∗ n ) ∈ S é um equilíbrio 

de Nash em estratégias puras se, e somente se, s ∗ i ∈ MR i(s ∗ −i ) 

para todo i =1,...,n. 

Observação. Como vimos, nem sempre um jogo possui um equilíbrio 

de Nash em estratégias puras. Contudo, épossível garantir 

esta existência para certos tipos de jogos com estruturas especiais. 

O leitor interessado pode consultar os jogos descritos nos artigos [28, 

61, 80, 94]. Para resultados quantitativos, veja [60]. 

2.2.3 Relações entre dominância e equilíbrio de 

Nash 

Proposição 2.2 O processo de dominância estrita iterada não 

pode eliminar um equilíbrio de Nash ao simplificar um jogo. 

Demonstração: Lembramos que, em cada etapa do processo de eliminação 

de estratégias estritamente dominadas, o conjunto de estratégias 

puras de algum jogador é substituído por um subconjunto


com menos elementos, obtido removendo-se as estratégias do jogador 

que são estritamente dominadas. Cada eliminação gera um espaço de 

estratégias puras com menos elementos o que, sucessivamente, simplifica 

o jogo original: 

S = S 1 ×···×S n S (1) = S (1) 

1 ×···×S n 

(1) 

··· S (k) = S (k) 

1 ×···×S n (k) . 

Com esta notação, o enunciado da proposição pode ser colocado assim: 

se s ∗ ∈ S é um equilíbrio de Nash, então s ∗ ∈ S (k) . 

Ademonstração será feita por contradição: suponha, por absurdo, 

que exista s ∗ =(s ∗ 1 ,...,s∗ n ) ∈ S tal que s∗ é um equilíbrio de Nash, 

mas s ∗ ∉ S (k) . Isto significa que existe i tal que s ∗ i ∈ S (l) 

i mas 

s ∗ i ∉ S(l+1) i para algum l =0,...,k− 1(sel = 0, defina S (0) 

i = S i ). 

Sem perda de generalidade, vamos supor que esta propriedade ocorre 

pela primeira vez para o índice i, istoé, s ∗ i é a primeira estratégia do 

perfil de estratégias 

s ∗ =(s ∗ 1 ,...,s∗ (i−1) ,s∗ i ,s∗ (i+1) ,...,s∗ n ) 

que é eliminada por uma estratégia estritamente dominante. Sendo 

assim, existe s • i ∈ S(l) i tal que 

u i (s ∗ i , s −i )


Demonstração: Suponha que o processo de dominância estrita iterada 

gere uma cadeia de espaços de estratégias puras 

S = S 1 ×···×S n S (1) = S (1) 

1 ×···×S n 

(1) 

··· S (k) = S (k) 

1 ×···×S n (k) , 

onde o último conjunto da cadeia é unitário: 

S (k) = S (k) 

1 ×···×S n 

(k) = {s ∗ } = {(s ∗ 1,...,s ∗ i ,...,s ∗ n)}. 

Note que, em particular, s ∗ 1 ∈ S(l) 1 , s∗ 2 ∈ S(l) 2 , ..., s∗ n ∈ S n (l) ,para 

todo l =0,...,k. Vamos mostrar que, nesta situação, s ∗ éoúnico 

equilíbrio de Nash do jogo. De fato, basta mostrar que s ∗ éum 

equilíbrio de Nash, pois a unicidade é uma consequência direta da 

Proposição 2.2. Suponha então, por absurdo, que s ∗ não seja um 

equilíbrio de Nash. Neste caso, devem existir índice i eestratégia 

pura s [1] 

i ∈ S i ,coms [1] 

i ≠ s ∗ i ,taisque 

u i (s ∗ i , s∗ −i )

[SEC. 2.3: ESTRATÉGIAS MISTAS 27 

Mas isto é um absurdo, pois S i é um conjunto finito. 

Arecíproca da Proposição 2.3 é falsa, isto é,mesmoqueojogo 

tenha um único equilíbriodeNash,elenão é necessariamente obtido a 

partir do processo de dominância estrita iterada. O jogo cuja matriz 

de payoffs é 

g 2 

s 21 s 22 s 23 

g 1 s 12 (+1, −1) (−1, +1) (+1, −1) 

s 11 (−1, +1) (+1, −1) (−1, +1) 

s 13 (−1, +1) (+1, −1) (+5, +5) 

fornece um contra-exemplo: s ∗ =(s 13 ,s 23 )éoúnico equilíbrio de 

Nash do jogo, mas não existem estratégias estritamente dominadas. 

AProposição 2.2 é falsa se trocarmos dominância estrita por dominância 

fraca, istoé, o processo de dominância fraca iterada pode 

eliminar um equilíbrio de Nash (veja o exercício [10] na página 58 

para um contra-exemplo). Se o processo de dominância fraca iterada 

reduz o jogo para apenas um único perfil de estratégias (como na 

Proposição 2.3), então este perfil é obrigatoriamente um equilíbrio de 

Nash, contudo, ele não é necessariamente o único equilíbrio de Nash 

do jogo. 

2.3 Estratégias mistas 

Como vimos no jogo de comparar moedas do Exemplo 2.6, existem 

jogos que não possuem equilíbrios de Nash em estratégias puras. Uma 

alternativa para estes casos é a de considerar o jogo do ponto de vista 

probabilístico, isto é, ao invés de escolher um perfil de estratégias 

puras, o jogador deve escolher uma distribuição de probabilidade sobre 

suas estratégias puras. 

Uma estratégia mista p i para o jogador g i ∈ G é uma distribuição 

de probabilidades sobre o conjunto S i de estratégias puras do jogador,


isto é, p i éumelementodoconjunto 

{ 

Δ mi = (x 1 ,...,x mi ) ∈ R mi | x 1 ≥ 0,...,x mi ≥ 0e 

∑m i 

k=1 

x k =1 

} 

. 

Assim, se p i =(p i1 ,p i2 ,...,p imi ), então 

p i1 ≥ 0, p i2 ≥ 0, ..., p imi ≥ 0 e 

∑m i 

k=1 

p ik =1. 

Note que cada Δ mi é um conjunto compacto e convexo. Nas 

Figuras2.1e2.2temososdesenhosdeΔ 2 eΔ 3 , respectivamente. Os 

pontos extremos (vértices) de Δ mi ,istoé, os pontos da forma 

e 1 =(1, 0,...,0, 0), e 2 =(0, 1,...,0, 0), ..., e mi =(0, 0,...,0, 1) 

dão, respectivamente, probabilidade 1 às estratégias puras s i1 , s i2 , 

..., s imi . Desta maneira, podemos considerar a distribuição de probabilidade 

e k comoaestratégia mista que representa a estratégia 

pura s ik do jogador g i . 

x 2 

1 

0 

1 

x 1 

Figura 2.1: Δ 2 = { (x 1 ,x 2 ) ∈ R 2 | x 1 ≥ 0,x 2 ≥ 0ex 1 + x 2 =1 } .

[SEC. 2.3: ESTRATÉGIAS MISTAS 29 

x 3 

1 

0 

1 x 2 

1 

x 1 

Figura 2.2: Δ 3 = { (x 1 ,x 2 ,x 3 ) ∈ R 3 | x 1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0ex 1 + 

x 2 + x 3 =1}. 

Oespaço de todos os perfis de estratégia mista é o produto cartesiano 

Δ=Δ m1 × Δ m2 ×···×Δ mn , 

denominado espaço de estratégias mistas. Como o produto cartesiano 

de conjuntos compactos e convexos é compacto e convexo, vemos que 

Δé compacto e convexo. 

Um vetor p ∈ Δé denominado um perfil de estratégias mistas. 

Como no caso de estratégias puras, usaremos a notação p −i para 

representar as estratégias mistas de todos os jogadores, excluindo-se 

a do jogador g i . Desta maneira, escreveremos 

(p i , p −i ) 

para representar p =(p 1 ,...,p i ,...,p n ). Como a estratégia pura s ik 

pode ser identificada com a distribuição de probabilidades que dá 

peso1as ik epeso0às demais estratégias do jogador g i ,usaremos 

(s ik , p −i )


como uma notação alternativa para o perfil de estratégias mistas 

(e k , p −i ). Do mesmo modo, usaremos 

(p i , s −i ) 

para indicar o perfil de estratégias mistas onde o jogador g i escolhe 

a distribuição de probabilidades p i e os demais jogadores escolhem 

distribuições que dãopeso1às estratégias puras em s −i . 

Cada perfil de estratégias mistas p =(p 1 ,...,p n ) ∈ Δ determina 

um payoff esperado (utilidade esperada), uma média dos payoffs ponderada 

pelas distribuições de probabilidades p 1 , ..., p n . Mais precisamente, 

se 

p = (p 1 , p 2 ,...,p n ) 

= (p 11 ,p 12 ,...,p 1m1 ; p 21 ,p 22 ,...,p 2m2 ; ...; p n1 ,p n2 ,...,p nmn ), 

} {{ } } {{ } } {{ } 

p 1 

p 2 

p n 

então 

u i (p) = 

∑m 1 

∑m 2 

j 1=1 j 2=1 

··· 

∑m n 

j n=1 

p 1j1 · p 2j2 ···p njn · u i (s 1j1 ,s 2j2 ,...,s njn ). 

(2.1) 

Cuidado com o abuso de notação: estamos usando u i para representar 

a função utilidade tanto em estratégias puras quanto em estratégias 

mistas. 

Como exemplo, considere o jogo de comparar moedas na página 

22. Se g 1 escolhe a distribuição de probabilidade p 1 =(1/4, 3/4) 

e g 2 escolhe a distribuição de probabilidade p 2 =(1/3, 2/3), então 

os payoffs esperados associados ao perfil de estratégias mistas p = 

(p 1 , p 2 )=(1/4, 3/4; 1/3, 2/3) são dados por 

u 1 (p) = 

2∑ 

j 1=1 j 2=1 

2∑ 

p 1j1 · p 2j2 · u 1 (s 1j1 ,s 2j2 ) 

= p 11 · p 21 · u 1 (s 11 ,s 21 )+p 11 · p 22 · u 1 (s 11 ,s 22 )+ 

p 12 · p 21 · u 1 (s 12 ,s 21 )+p 12 · p 22 · u 1 (s 12 ,s 22 ) 

= 1 4 · 1 

3 · (+1) + 1 4 · 2 

3 · (−1) + 3 4 · 1 

3 · (−1) + 3 4 · 2 

3 · (+1) 

= + 1 6

[SEC. 2.4: SOLUÇÕESDEUMJOGOEMESTRATÉGIAS MISTAS 31 

e, analogamente, 

u 2 (p) = 

2∑ 

j 1=1 j 2=1 

2∑ 

p 1j1 · p 2j2 · u 2 (s 1j1 ,s 2j2 ) 

= p 11 · p 21 · u 2 (s 11 ,s 21 )+p 11 · p 22 · u 2 (s 11 ,s 22 )+ 

p 12 · p 21 · u 2 (s 12 ,s 21 )+p 12 · p 22 · u 2 (s 12 ,s 22 ) 

= 1 4 · 1 

3 · (−1) + 1 4 · 2 

3 · (+1) + 3 4 · 1 

3 · (+1) + 3 4 · 2 

3 · (−1) 

= − 1 6 . 

Observação. Se p ∗ =(p ∗ i , p∗ −i ) ∈ Δ, então a função x ↦→ u i(x, p ∗ −i ) 

preserva combinações convexas. Mais precisamente, se x 1 ,...,x r ∈ 

Δ mi e λ 1 ,...,λ r são escalares não-negativos com ∑ r 

k=1 λ k =1,então 

( r∑ 

) 

r∑ 

u i λ k · x k , p ∗ −i = λ k · u i (x k , p ∗ −i). (2.2) 

k=1 

Em particular, se 

∑m i 

p ∗ i =(p∗ i1 ,...,p∗ im i 

)= p ∗ ik · e k, (2.3) 

com e k o k-ésimo vetor da base canônica de R mi ,então 

( 

mi 

) 

u i (p ∗ )=u i (p ∗ i , p∗ −i )=u ∑ 

i p ∗ ik · e ∑m i 

k, p ∗ −i = p ∗ ik · u i(e k , p ∗ −i ). 

k=1 

k=1 

k=1 

k=1 

(2.4) 

2.4 Soluções de um jogo em estratégias 

mistas 

Todososcritérios básicos para soluções de jogos em estratégias 

puras podem ser estendidos para estratégias mistas.


2.4.1 Dominância em estratégias mistas 

Definição 2.7 (Estratégia Mista Estritamente Dominada) 

Dizemos que uma estratégia mista p i ∈ Δ mi do jogador 

g i ∈ G é estritamente dominada pela estratégia p ′ i ∈ Δ m i 

se, independentemente das escolhas de distribuições de probabilidade 

dos demais jogadores, o jogador g i ganha mais escolhendo 

p ′ i do que p i,istoé, se 

u i (p ′ i, p −i ) >u i (p i , p −i ), 

para todo p −i ∈ Δ −i =Δ m1 ×···×Δ mi−1 ×Δ mi+1 ×···×Δ mn . 

Como os payoffs u i (p ′ i , p −i )eu i(p i , p −i )são, respectivamente, 

combinações convexas dos payoffs u i (p ′ i , s −i) e u i (p i , s −i ), 

segue-se que a condição acima é equivalente a 

u i (p ′ i , s −i) >u i (p i , s −i ), 

para todos perfis de estratégias puras s −i ∈ S −i . 

Exemplo 2.8 ([30], página 21) Considere o jogo com a seguinte 

matriz de payoffs: 

g 2 

s 21 s 22 

g 1 s 12 (0, 0) (5, 3) 

s 11 (5, 3) (0, 0) 

. 

s 13 (2, 1) (2, 1) 

Aestratégia mista p 1 =(0, 0, 1) ∈ Δ 3 do jogador g 1 éestritamente


dominada pela estratégia mista p ′ 1 =(1/2, 1/2, 0) ∈ Δ 3,pois 

( 1 

u 1 (p ′ 1, p 2 )=u 1 

2 , 1 ) 

2 , 0; p 21,p 22 = 5 2 · p 21 + 5 2 · p 22 = 5 2 

> 

( 

) 

u 1 (p 1 , p 2 )=u 1 0 , 0, 1; p 21 ,p 22 =2· p 21 +2· p 22 =2 

para todo p 2 = (p 21 ,p 22 ) ∈ Δ 2 . Como p 1 = (0, 0, 1) representa 

aestratégia pura s 13 do jogador g 1 , este exemplo também mostra 

que uma estratégia pura pode não ser dominada por nenhuma outra 

estratégia puras mas, ainda sim, ser dominada por uma estratégia 

mista. 

Exemplo 2.9 ([31], página 7) Uma estratégia mista que atribui 

probabilidade positiva para uma estratégia pura estritamente dominada 

também é estritamente dominada (Exercício [13]). Contudo, 

uma estratégia mista pode ser estritamente dominada mesmo que ela 

atribua probabilidades positivas apenas para as estratégias puras que 

não são nem mesmo fracamente dominadas. Considere, por exemplo, 

o jogo com a seguinte matriz de payoffs: 

g 2 

s 21 s 22 

g 1 s 12 (2, 0) (5, 3) 

s 11 (5, 3) (2, 0) 

. 

s 13 (4, 1) (4, 1) 

As estratégias puras s 11 e s 12 não são fracamente dominadas, mas 

aestratégia mista p 1 =(1/2, 1/2, 0) é estritamente dominada pela 

estratégia mista p ′ 1 =(0, 0, 1) (que corresponde àestratégia pura s 13 ),


pois 

u 1 (p ′ 1, p 2 )=u 1 

( 

0 , 0, 1; p 21 ,p 22 

) 

=4· p 21 +4· p 22 =4 

> 

( 1 

u 1 (p 1 , p 2 )=u 1 

2 , 1 ) 

2 , 0; p 21,p 22 = 7 2 · p 21 + 7 2 · p 22 = 7 2 

para todo p 2 =(p 21 ,p 22 ) ∈ Δ 2 . 

A definição de dominância estrita iterada para estratégias mistas que 

daremos aqui segue a linha proposta pelas referências [26, 31, 74]. 

Abordagens alternativas podem ser encontradas em [01, 15]. 

Definição 2.8 (Dominância Estrita Iterada em Estratégias 

Mistas) Sejam S (0) 

i = S i eΔ (0) 

m i 

=Δ mi . Defina, recursivamente, 

e 

S (n) 

i 

= {s ∈ S (n−1) 

i 

| ∄p i ∈ Δ (n−1) 

m i 

tal que 

∀s −i ∈ S (n−1) 

−i ,u i (p i ,s −i ) >u i (s, s −i )} 

Δ (n) 

m i 

= {p i =(p i1 ,...,p imi ) ∈ Δ mi | 

∀k =1,...,m i ,p ik > 0somenteses ik ∈ S (n) 

i }. 

Ainterseção 

S ∞ i = 

∞⋂ 

n=0 

S (n) 

i 

é o conjunto de estratégias puras que sobrevivem a remoção 

iterada de estratégias estritamente dominadas e


Δ ∞ m i 

= {p i ∈ Δ mi | ∄p ′ i ∈ Δ mi 

tal que ∀s −i ∈ S (∞) 

−i ,u i (p ′ i,s −i ) >u i (p i ,s i )} 

é o conjunto de todas as estratégias mistas do jogador g i que 

sobreviveram a técnica de dominância estrita iterada. 

Note que S (n) 

i é o conjunto de estratégias puras em S (n−1) 

i que não são 

estritamente dominadas pelas estratégias mistas em Δ (n−1) 

m i 

equeΔ (n) 

m i 

é o conjunto de estratégias mistas que dá probabilidades positivas 

apenas para as estratégias puras em S (n) 

i . 

Definição 2.9 (Equilíbrio de Estratégia Estritamente 

Dominante) Se, no processo de dominância estrita iterada, o 

conjunto S ∞ = S1 ∞ ×···×S∞ n é unitário, isto é, se 

S ∞ = {s ∗ }, 

então dizemos que s ∗ éumequilíbrio de estratégia estritamente 

dominante. 

Como no caso de estratégias puras, épossível mostrar que os conjuntos 

S ∞ = S1 ∞ ×···×Sn ∞ eΔ ∞ =Δ ∞ m 1 

×···×Δ ∞ m n 

não dependem 

da ordem em que as estratégias estritamente dominadas são 

removidas. Não apresentaremos a demonstração deste fato aqui. 

O leitor interessado poderá encontrá-la (bem como as definições e 

resultados sobre estratégias mistas fracamente dominadas) nasreferências 

[01, 15, 26, 55]. 

2.4.2 Equilíbrio de Nash em estratégias mistas 

Definição 2.10 (Equilíbrio de Nash) Dizemos que um perfil 

de estratégias mistas


p ∗ =(p ∗ 1, p ∗ 2,...,p ∗ n) ∈ Δ=Δ m1 × Δ m2 ×···×Δ mn 


u i (p ∗ i , p ∗ −i) ≥ u i (p, p ∗ −i) 

para todo p ∈ Δ mi ,istoé, nenhum jogador sente motivação 

de trocar a sua estratégia mista se os demais jogadores não o 

fizerem. 

Exemplo 2.10 

(a) No dilema do prisioneiro (Exemplo 2.1), o perfil de estratégias 

mistas 

p ∗ =(p ∗ 1 , p∗ 2 )=(1, 0; 1, 0) 

é um equilíbrio de Nash, pois 

u 1 (p 1 , p ∗ 2)=u 1 (p 11 ,p 12 ;1, 0) = 5 · p 11 − 10 ≤ 

− 5=u 1 (1, 0; 1, 0) = u 1 (p ∗ 1 , p∗ 2 ) 

para todo p 1 =(p 11 ,p 12 ) ∈ Δ 2 e 

u 2 (p ∗ 1 , p 2 )=u 2(1, 0; p 21 ,p 22 )=5· p 21 − 10 ≤ 

− 5=u 2 (1, 0; 1, 0) = u 2 (p ∗ 1, p ∗ 2) 

para todo p 2 = (p 21 ,p 22 ) ∈ Δ 2 . Observe que este equilíbrio 

corresponde ao equilíbrio em estratégias puras 

s ∗ = (confessar, confessar). 

Mostraremos mais adiante que este éoúnico equilíbrio de Nash 

em estratégias mistas do jogo. 

(b) Na batalha dos sexos (Exemplo 2.2), os equilíbrios de Nash em 

estratégias mistas são 

(1, 0; 1, 0), (0, 1; 0, 1) e (2/3, 1/3; 1/3, 2/3).


Os dois primeiros perfis de estratégias mistas correspondem às 

estratégias puras (futebol, futebol) e (cinema, cinema), respectivamente. 

Mostraremos mais adiante que estes são os únicos 

equilíbrios de Nash em estratégias mistas do jogo. 

(c) No Exemplo 2.3, o único equilíbrio de Nash em estratégia mista 

éoponto 

(0, 1, 0, 0; 0, 1, 0, 0) 

que corresponde ao equilíbrio de Nash (s 12 ,s 22 )emestratégias 

puras. 

(d) No jogo de comparar moedas do Exemplo 2.6, o único equilíbrio 

de Nash em estratégias mistas éoponto 

(1/2, 1/2; 1/2, 1/2). 

Como no caso de estratégias puras, podemos caracterizar equilíbrios 

de Nash em estratégias mistas através das funções de melhor 

resposta. Considere um jogo com espaço de estratégias mistas Δ = 

Δ m1 ×···×Δ mi ×···×Δ mn . No que se segue, usaremos as seguintes 

notações: 

Δ(S i )=Δ mi e Δ(S −i )=Δ m1 ×···×Δ mi−1 × Δ mi+1 ×···Δ mn . 

Definição 2.11 (Funções de melhor resposta em estratégias 

mistas) A função de melhor resposta do jogador g i éa 

aplicação 

MR i :Δ(S −i ) → 2 Δ(Si) 

definida por MR i (p −i ) = argmax pi ∈Δ(S i) u i (p i , p −i ), isto é, 

MR i (p −i ) 

= 

{p ∗ i ∈ Δ(S i) |∀p i ∈ Δ(S i ),u i (p ∗ i , p −i) ≥ u i (p i , p −i )}, 

com p −i ∈ Δ(S −i ). A função de melhor resposta do jogo éa 

aplicação 

MR: Δ → 2 Δ


definida por 

com p ∈ Δ. 

MR(p) =(MR 1 (p −1 ), MR 2 (p −2 ),...,MR n (p −n )), 

Note que, como Δ(S i )é um conjunto compacto não-vazio e a 

função p i ↦→ u i (p i , p −i )écontínua, podemos usar o teorema de Weierstrass 

para garantir que MR i (p −i ) = argmax pi ∈Δ(S i) u i (p i , p −i )é 

um conjunto não-vazio para todo p −i ∈ Δ(S −i ). 

Apróxima proposição é uma consequência direta das definições 

de equilíbrio de Nash e funções de melhor resposta em estratégias 

mistas. 

Proposição 2.4 p ∗ =(p ∗ 1 ,...,p∗ i ,...,p∗ n ) ∈ Δé um equilíbrio 

de Nash em estratégias mistas se, e somente se, p ∗ i ∈ MR i(p ∗ −i ) 

para todo i =1,...,n,istoé, p ∗ ∈ MR(p ∗ ). 

Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2), 

a mulher escolha a estratégia mista p 2 =(1/2, 1/2). Qual éamelhor 

resposta do homem a esta estratégia da mulher? Para responder a 

esta pergunta, observe inicialmente que 

u Homem (p 1 , p 2 ) = u Homem (p 11 ,p 12 ; p 21 ,p 22 ) 

= p 11 · p 21 · u Homem (futebol, futebol) + 

p 11 · p 22 · u Homem (futebol, cinema) + 

p 12 · p 21 · u Homem (cinema, futebol) + 

p 12 · p 22 · u Homem (cinema, cinema) 

= 10· p 11 · p 21 +5· p 12 · p 22 

e, portanto, u Homem (p 11 ,p 12 ;1/2, 1/2) = 5 · p 11 +(5/2) · p 12 . Desta 

maneira, 

MR Homem (1/2, 1/2) = argmax (p11,p 12)∈Δ 2 

(5 · p 11 +(5/2) · p 12 ).


Segue-se que a melhor resposta do homem àestratégia mista p 2 = 

(1/2, 1/2) da mulher é obtida resolvendo-se o seguinte problema de 

otimização: 

maximizar 5 · p 11 +(5/2) · p 12 

sujeito a p 11 + p 12 =1, 

p 11 ≥ 0, 

p 12 ≥ 0, 

cuja solução é(p ∗ 11 ,p∗ 12 )=(1, 0). Sendo assim, MR Homem(1/2, 1/2) = 

{(1, 0)}. 

No caso de jogos com apenas dois jogadores, cada um com apenas 

duas estratégias puras, épossível escrever as estratégias mistas de 

uma maneira mais simplificada: 

Δ 2 = {(p, 1 − p) ∈ R 2 | 0 ≤ p ≤ 1}, 

isto é, cada elemento de Δ 2 pode ser identificado com um número real 

no intervalo [0, 1]. Com isto, as funções de melhor resposta podem 

ser reescritas de forma a depender de apenas de um número real. Por 

exemplo, se o homem escolhe uma estratégia mista (p, 1 − p) ∈ Δ 2 , 

qual é a melhor resposta da mulher a esta estratégia do homem? 

Escrevendo as estratégias mistas da mulher na forma (q, 1 − q) ∈ Δ 2 , 

vemos que 

u Mulher (p, 1 − p; q, 1 − q) = 15pq +10− 10 q − 10 p 

= 5 (3p − 2) q +10(1− p). 

Sendo assim, 

MR Mulher (p) = argmax (q,1−q)∈Δ2 (5 (3 p − 2) q +10(1− p)) 

= argmax q∈[0,1] (5 (3 p − 2) q +10(1− p)), 

onde, por simplicidade, estamos escrevendo MR Mulher (p) no lugar 

de MR Mulher (p, 1 − p). Assim, dada a escolha de p ∈ [0, 1] do homem, 

a mulher quer encontrar os valores de q ∈ [0, 1] que maximizam o valor 

de sua utilidade u Mulher =5(3p − 2) q +10(1− p). Se p ∈ [0, 2/3), 

então 3 p − 2 < 0 e, para maximizar a sua utilidade, a mulher deverá


escolher q =0. Sep =2/3, então 3 p − 2 = 0 e, portanto, a utilidade 

u Mulher =10(1− p) da mulher não dependerá deq. Neste caso, a 

mulher poderá escolher qualquer valor de q em [0, 1]. Se p ∈ (2/3, 1], 

então 3 p − 2 > 0 e, para maximizar a sua utilidade, a mulher deverá 

escolher q = 1. Mostramos então que 

⎧ 

⎨ {0}, se p ∈ [0, 2/3), 

MR Mulher (p) = [0, 1], se p =2/3, 

⎩ 

{1}, se p ∈ (2/3, 1]. 

Esta função de melhor resposta pode ser representada graficamente, 

como mostra a Figura 2.3. 

(Mulher) 

q 

(Futebol) 

1 

(Cinema) 

0 

2/3 

1 p (Homem) 

(Cinema) 

(Futebol) 

Figura 2.3: Representação gráfica da função de melhor resposta da 

mulher no jogo da batalha dos sexos. 

Do mesmo modo, se a mulher escolhe uma estratégia mista (q, 1−q) ∈ 

Δ 2 ,então 

u Homem (p, 1 − p; q, 1 − q) = 15pq +5− 5 q − 5 p 

= 5 (3q − 1) p +5(1− q), 

de modo que 

MR Homem (q) = argmax (p,1−p)∈Δ2 (5 (3 q − 1) p +5(1− q)) 

= argmax p∈[0,1] (5 (3 q − 1) p +5(1− q)).


Assim, dada a escolha de q ∈ [0, 1] da mulher, o homem quer encontrar 

os valores de p ∈ [0, 1] que maximizam o valor de sua utilidade 

u Homem =5(3q − 1) p +5(1− q). Se q ∈ [0, 1/3), então 3 q − 

1 < 0 e, para maximizar a sua utilidade, o homem deverá escolher 

p =0. Seq =1/3, então 3 q − 1=0e,portanto,autilidade 

u Homem =5(1− q) dohomemnão dependerá dep. Neste caso, o 

homem poderá escolher qualquer valor de p em [0, 1]. Se q ∈ (1/3, 1], 

então 3 q − 1 > 0 e, para maximizar a sua utilidade, o homem deverá 

escolher p = 1. Mostramos então que 

⎧ 

⎨ {0}, se q ∈ [0, 1/3), 

MR Homem (q) = [0, 1], se q =1/3, 

⎩ 

{1}, se q ∈ (1/3, 1]. 

Esta função de melhor resposta pode ser representada graficamente, 

como mostra a Figura 2.4. 

(Homem) 

p 

(Futebol) 

1 

(Cinema) 

0 

1/3 

1 q (Mulher) 

(Cinema) 

(Futebol) 

Figura 2.4: Representação gráfica da função de melhor resposta do 

homem no jogo da batalha dos sexos. 

Agora, pela Proposição 2.4, segue-se que um perfil de estratégias 

mistas (p ∗ , 1 − p ∗ ; q ∗ , 1 − q ∗ )é um equilíbrio de Nash se, e somente se, 

q ∗ ∈ MR Mulher (p ∗ )ep ∗ ∈ MR Homem (q ∗ ). Desta maneira, os valores 

de p ∗ e q ∗ que geram equilíbrios de Nash correspondem aos pontos 

de interseção entre as representações gráficas das funções de melhor


resposta da mulher e do homem, quando representadas em um mesmo 

sistema de eixos, como ilustra a Figura 2.5. 

(Mulher) 

q 

(Futebol) 

1 

1/3 

(Cinema) 

0 

2/3 

1 p (Homem) 

(Cinema) 

(Futebol) 

Figura 2.5: Calculando os equilíbrios de Nash usando as representações 

gráficas das duas funções de melhor resposta. 

Vemos, portanto, que a batalha dos sexos possui apenas 3 equilíbrios 

de Nash em estratégias mistas: 

(0, 1; 0, 1), (2/3, 1/3; 1/3, 2/3) e (1, 0; 1, 0), 

que correspondem, respectivamente, aos três únicos pontos de interseção 

(p ∗ ,q ∗ )=(0, 0), (p ∗ ,q ∗ )=(2/3, 1/3) e (p ∗ ,q ∗ )=(1, 1) das 

duas representações gráficas. 

Exemplo 2.12 ([31], página 17) (O jogo da inspeção) Ochefe 

de uma empresa de computação desconfia que seu operador de 

computadores está usando o tempo de serviço para “bater papo” 

na internet. Se o operador trabalha corretamente, ele gasta g em 

esforço e produz um lucro bruto de v unidades para a empresa. O 

chefe, por sua vez, pode fiscalizar ou não o trabalho do operador. 

Fiscalizar custa h unidades para a empresa. Se o operador for pego 

“batendo papo” na internet, ele perde o seu salário de w unidades 

(o chefe não pode condicionar o valor do salário w ao valor do lucro 

bruto v). Para limitar o número de casos a considerar, vamos assumir


que g > h > 0equew > g. Os dois jogadores escolhem suas 

estratégias simultaneamente (em particular, ao decidir se vai fiscalizar 

ou não, o chefe não sabe se o empregado decidiu trabalhar ou decidiu 

“bater papo” na internet). Neste contexto, o jogo da inspeção tem a 

matriz de payoffs indicada abaixo. 

empregado 

não trabalhar 

trabalhar 

chefe 

fiscalizar (−h, 0) (v − w − h, w − g) 

não fiscalizar (−w, w) (v − w, w − g) 

Observe que este jogo não possui equilíbrio de Nash em estratégias 

puras e, como ele deve se repetir em cada dia útil de trabalho, não é 

sensato escolher sempre a mesma estratégia pura para todos os dias. 

Asolução, neste caso, é escolher entre as estratégias puras a cada dia 

seguindo uma distribuição de probabilidades, isto é, através de estratégias 

mistas. Como as funções de melhor resposta do empregado 

edochefesão dadas, respectivamente, por 

MR Empregado (p) = argmax q∈[0,1] ((−wp + g) q + w − g) 

⎧ 

⎨ {1}, se p ∈ [0,g/w), 

= [0, 1], se p = g/w, 

⎩ 

{0}, se p ∈ (g/w, 1], 

MR Chefe (q) = argmax p∈[0,1] ((+wq − h) p + v (1 − q) − w) 

⎧ 

⎨ {0}, se q ∈ [0,h/w), 

= [0, 1], se q = h/w, 

⎩ 

{1}, se q ∈ (h/w, 1], 

segue-se que o (único) equilíbrio de Nash em estratégias mistas é 

obtido tomando-se p ∗ = g/w e q ∗ = h/w. Se, por exemplo, v =5, 

w =4,g =3eh =2,então 

(p ∗ , 1 − p ∗ ; q ∗ , 1 − q ∗ )=(3/4, 1/4; 1/2, 1/2). 

Isto significa que o chefe deve escolher sua estratégia de acordo com 

um gerador de números aleatórios com distribuição de probabilidade 

(3/4, 1/4) e o operador deve escolher sua estratégia de acordo


com um gerador de números aleatórios com distribuição de probabilidade 

(1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas 

da fortuna” da Figura 2.6. 

Fiscalizar 

Trabalhar 

Não fiscalizar 

Não trabalhar 

chefe 

empregado 

Figura 2.6: Distribuições de probabilidade que constituem um equilíbrio 

de Nash para o jogo do Exemplo 2.12. 

A partir deste resultado, podemos calcular o valor ótimo de contrato 

do empregado, isto é, o valor de w que maximiza o payoff esperado 

do chefe: 

( 

u Chefe (w) =(+wq ∗ − h) p ∗ + v (1 − q ∗ ) − w) =v 1 − h ) 

− w. 

w 

Se, por exemplo, √ √ vh > g, então este valor ótimo é dado por w ∗ = 

vh (note que u 

′ 

Chefe (w ∗ )=0eu ′′ Chefe (w) ≤ 0paraw>0). 

Jogos deste tipo têm sido usados para se estudar temas como controle 

de armas ([03, 10, 83]), prevenção de crimes ([04]) e incentivos no 

trabalho ([53]). 

Como vimos no jogo de comparar moedas no Exemplo 2.6, existem 

jogos que não possuem equilíbrios de Nash em estratégias puras e, até 

agora, todos os jogos apresentados em nossos exemplos possuem pelo 

menos um equilíbrio de Nash em estratégias mistas. Uma pergunta 

natural éseaexistência de equilíbrios de Nash em estratégias mistas 

é um resultado geral ou não. A resposta ésim!Nopróximo capítulo 

apresentaremos e demonstraremos o teorema de equilíbrio de Nash,


que garante a existência de equilíbrios em estratégias mistas para 

jogos finitos. 

2.4.3 Relações entre dominância e equilíbrio de 

Nash 

As Proposições 2.2 e 2.3 para estratégias puras continuam válidas 

para estratégias mistas: (1) o processo de dominância estrita iterada 

em estratégias mistas não pode eliminar um equilíbrio de Nash 

e (2) se o processo de dominância estrita iterada em estratégias mistas 

deixa apenas um único perfil de estratégias, então este perfil éum 

equilíbrio de Nash do jogo. Não apresentaremos as demonstrações 

destes resultados aqui. O leitor interessado poderá encontrá-las nas 

referências [15, 26]. 

2.4.4 Como interpretar estratégias mistas? 

Existe muita controvérsia sobre as interpretações e usos de estratégias 

mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann, 

por exemplo, em [02], afirma que 

“Mixed strategy equilibria have always been intuitively 

problematic because they are not ‘strict’: a player will not 

lose if he abandons the randomization and uses instead 

any arbitrary one of the pure strategy components of the 

randomization.” 

(veja as Equações 4.1 na página 81) e, segundo Rardner e Roshental 

([76]), 

“One of the reasons why game-theoretic ideas have not 

found more widespread application is that randomization, 

which plays a major role in game theory, seems to have 

limited appeal in many practical situations.” 

Ainda, segundo Rubinstein ([81]), 

“The reason for the criticism is that the naive interpretation 

of a mixed strategy as an action which is conditional 

on the outcome of a lottery executed by the player before


the game, goes against our intuition. We are reluctant to 

believe that our decisions are made at random. We prefer 

to be able to point to a reason for each action we take. 

Outside of Las Vegas we do not spin roulettes.” 

De fato, testes experimentais recentes mostraram que jogadores não 

seguem a estratégiamistaprevistapelateoria,mesmoquandoojogo 

possui um único equilíbrio de Nash em estratégias mistas ([57]). 

Existem também certas análises feitas com estratégias mistas que 

produzem resultados não-intuitivos. Considere, por exemplo, a seguinte 

situação. Um contribuinte C deve decidir se vai ou não sonegar 

imposto, sabendo que existe um fiscal F quepodeounão fiscalizá-lo. 

Na matriz de payoffs abaixo, vamos assumir que valem as seguintes 

desigualdades 

(1) c 21 >c 11 : o contribuinte C prefere não sonegar se souber que 

ofiscalF irá fiscalizar, 

(2) c 12 >c 22 : o contribuinte C prefere sonegar se souber que o fiscal 

F não irá fiscalizar, 

(3) f 11 >f 12 :ofiscalF prefere fiscalizar se souber que o contribuinte 

C irá sonegar e 

(4) f 22 >f 21 :ofiscalF prefere não fiscalizar se souber que o contribuinte 

C não irá sonegar. 

Vocêpodepensarqueosc ij são números negativos que representam 

oquantoserá debitado de C pelo pagamento de imposto e que os f ij 

são números positivos que representam bônus salariais de F . 

F 

fiscalizar não fiscalizar 

C 

sonegar (c 11 ,f 11 ) (c 12 ,f 12 ) 

não sonegar (c 21 ,f 21 ) (c 22 ,f 22 ) 

Usandoatécnica descrita no Exemplo 2.11, vemos que o único equilíbrio 

de Nash do jogo é dado por (p ∗ C , 1 − p∗ C ; p∗ F , 1 − p∗ F ), onde 

( 

) 

(p ∗ C ,p∗ F )= f 22 − f 21 

c 22 − c 12 

, 

. 

f 22 − f 21 − f 12 + f 11 c 22 − c 12 − c 21 + c 11 

.


Aqui, p ∗ C representa a probabilidade com que C decide sonegar e p∗ F 

representa a probabilidade com que F decide fiscalizar. Dois resultados 

não-intuitivos advêm destas expressões para p ∗ C e p∗ F : 

(a) Se a receita federal decide aumentar a multa de sonegação, isto 

é, se ela resolve diminuir o valor de c 11 ,entãoafreqüência p ∗ C de 

sonegações não muda e a freqüência de fiscalizações p ∗ F diminui. 

(b) Se a receita federal decide aumentar o bônus salarial para os fiscais 

que identificam contribuintes sonegadores, isto é, se ela resolveraumentarovalordef 

11 ,entãoafreqüência de fiscalizações p ∗ F 

não muda e a freqüência de sonegações p ∗ C diminui. 

Isto acontece porque alterações introduzidas nos payoffs de um jogador 

afeta apenas a expressão para o perfil de estratégias mistas 

do equilíbrio de Nash do outro jogador (Proposição da Irrelevância 

do Payoff [43]). 

Existem, contudo, interpretações que são mais robustas. Uma delas 

é imaginar o jogo como uma interação entre n populações numerosas: 

cada partida ocorre depois que n jogadores são selecionados 

de maneira aleatória nestas populações. As probabilidades p iji no 

perfil de estratégias mistas p i do jogador g i são interpretadas como 

as freqüências dos jogadores que escolheram a estratégia pura s iji na 

i-ésima população. Outra interpretação é devida a Harsanyi. Apresentamos 

aqui o abstract de seu artigo [39]: 

“Equilibrium points in mixed strategies seem to be unstable, 

because any player can deviate without penalty from 

his equilibrium strategy even if he expects all other players 

to stick to theirs. This paper proposes a model under 

which most mixed-strategy equilibrium points have full 

stability. It is argued that for any game Γ the players’ 

uncertainty about the other players’ exact payoffs can be 

modeled as a disturbed game Γ ∗ , i.e., as a game with small 

random fluctuations in the payoffs. Any equilibrium point 

in Γ, whether it is in pure or in mixed strategies, can ‘almost 

always’ be obtained as a limit of a pure-strategy 

equilibrium point in the corresponding disturbed game 

Γ ∗ when all disturbances go to zero. Accordingly, mixedstrategy 

equilibrium points are stable – even though the


players may make no deliberate effort to use their pure 

strategies with the probability weights prescribed by their 

mixed equilibrium strategies – because the random fluctuations 

in their payoffs will make them use their pure 

strategies approximately with the prescribed probabilities.” 

Não nos aprofundaremos neste tema polêmico. O leitor interessado 

pode consultar as referências citadas no início desta subseção e, em 

especial, [81] e a Seção 3.2 de [74]. 

2.5 Jogos infinitos 

Os jogos que estudamos até agora são finitos, istoé, eles possuem 

um número finito de jogadores, cada um com um número finito de estratégias 

puras. Contudo, existem situações que, para serem modeladas, 

necessitam de um número infinito de jogadores ou de um número 

infinito de estratégias ([06, 44, 62]). Jogos em estratégias mistas, por 

exemplo, podem ser pensados como jogos com um número finito de 

jogadores e com um número infinito de estratégias (as infinitas distribuições 

de probabilidade que cada jogador pode escolher). Vamos 

nos concentrar no caso de jogos com um número finito de jogadores e 

um número infinito de estratégias puras (o caso de estratégias mistas 

requer como pré-requisito teoria da medida e não será tratado aqui). 

As definições de estratégias estritamente dominadas, estratégias fracamente 

dominadas e equilíbrios de Nash são análogas ao caso finito, 

com a diferença de que, agora, os conjuntos S i podem ser infinitos. 

Definição 2.12 (Estratégia Pura Estritamente Dominada) 

Dizemos que uma estratégia pura s i ∈ S i do jogador g i ∈ 

G é estritamente dominada pela estratégia s ′ i ∈ S i se 

para todo s −i ∈ S −i . 

u i (s ′ i , s −i) >u i (s i , s −i ),

[SEC. 2.5: JOGOS INFINITOS 49 

Definição 2.13 (Estratégia Pura Fracamente Dominada) 

Dizemos que uma estratégia pura s i ∈ S i do jogador 

g i ∈ G é fracamente dominada pela estratégia s ′ i ∈ S i se 

u i (s ′ i, s −i ) ≥ u i (s i , s −i ), 

para todo s −i ∈ S −i e, pelo menos para algum s • −i ∈ S −i, 

u i (s iκ ′, s • −i ) >u i(s iκ , s • −i ). 

Definição 2.14 (Equilíbrio de Nash)Dizemos que um perfil 

de estratégias 

s ∗ =(s ∗ 1 ,...,s∗ (i−1) ,s∗ i ,s∗ (i+1) ,...,s∗ n ) ∈ S 


u i (s ∗ i , s∗ −i ) ≥ u i(s i , s ∗ −i ) 

para todo i =1,...,n eparatodos i ∈ S i . 

Exemplo 2.13 ([26], página 2009) Considere o seguinte jogo infinito: 

G = {g 1 ,g 2 }, S 1 = S 2 =[0, 1] e u 1 ,u 2 : S = S 1 × S 2 → R 

definidas por 

⎧ 

⎨ 

u 1 (x, y) = 

⎩ 

x, se x


Do mesmo modo, toda estratégia pura y ∈ [0, 1) do jogador g 2 é 

estritamente dominada por (1 + y)/2 ∈ (y, 1). Como 

u 1 (1, 1) = 1 ≥ u 1 (x, 1) e u 2 (1, 1) = 1 ≥ u 2 (1,y), ∀x, y, ∈ [0, 1], 

segue-se que (x ∗ ,y ∗ )=(1, 1) éoúnico equilíbrio de Nash em estratégias 

puras do jogo. Eliminando-se todas as estratégias em S 1 − 

{1,t} e S 2 −{1,t}, paraalgumt

[SEC. 2.6: EXERCÍCIOS 51 

g 2 

s 21 s 22 s 23 s 24 

g 1 

s 11 (3, 0) (1, 1) (5, 4) (0, 2) 

s 12 (1, 1) (3, 2) (6, 0) (2, −1) 

s 13 (0, 2) (4, 4) (7, 2) (3, 0) 

[02] Considere a matriz de payoffs para os jogadores L (linhas) e C 

(colunas), a seguir: 

C 

c 1 c 2 

L 

l 1 (3, 3) (0, 1) 

l 2 (1, 1) (2, 3) 

Pede-se: 

(a) Determinar se existe alguma estratégia estritamente dominante 

para algum jogador. 

(b) Determinar se existe algum equilíbrio de Nash (em estratégias 

puras). Caso exista mais do que um equilíbrio, quantos 

equaissão. 

[03] A partir da matriz de payoffs a seguir para os jogadores L (linhas) 

e C colunas, 

C 

c 1 c 2 

L 

l 1 (3, 2) (4, 4) 

l 2 (1, 1) (9, 2) 

determine:


(a) Se algum jogador possui alguma estratégia dominante. 

(b) Quantos equilíbrios de Nash em estratégias puras existem. 

[04] (Jogo do covarde) Neste jogo, dois adolescentes pilotam 

carros roubados em direçãoaumabismoemumtestedecoragem: 

aquele que desviar o carro primeiro será chamado de 

covarde (chicken). 

Este tipo de jogo ficou popular depois do filme Juventude Transviada 

(Rebel Without a Cause) de 1955, estrelado por James 

Dean, que morreu em decorrência de um acidente de automóvel. 

Bertrand Russell, em [82], compara uma variação deste jogo 

com a tática de brinkmanship 2 na corrida nuclear: 

“Since the nuclear stalemate became apparent, the 

Governments of East and West have adopted the 

policy which Mr. Dulles calls ‘brinkmanship’. This 

is a policy adapted from a sport which, I am told, is 

practised by some youthful degenerates. This sport 

is called ‘Chicken!’. It is played by choosing a long 

straight road with a white line down the middle and 

starting two very fast cars towards each other from 

opposite ends. Each car is expected to keep the wheels 

of one side on the white line. As they approach each 

other, mutual destruction becomes more and more 

imminent. If one of them swerves from the white 

2 Arte ou prática de se levar uma situação perigosa ou confrontação além do 

limite do que pode ser considerado seguro, para conseguir determinado desfecho.


line before the other, the other, as he passes, shouts 

‘Chicken!’, and the one who has swerved becomes 

an object of contempt. As played by irresponsible 

boys, this game is considered decadent and immoral, 

though only the lives of the players are risked. But 

when the game is played by eminent statesmen, who 

risk not only their own lives but those of many hundreds 

of millions of human beings, it is thought on 

both sides that the statesmen on one side are displaying 

a high degree of wisdom and courage, and 

only the statesmen on the other side are reprehensible. 

This, of course, is absurd. Both are to blame 

for playing such an incredibly dangerous game. The 

game may be played without misfortune a few times, 

but sooner or later it will come to be felt that loss 

of face is more dreadful than nuclear annihilation. 

The moment will come when neither side can face 

the derisive cry of ‘Chicken!’ from the other side. 

When that moment is come, the statesmen of both 

sides will plunge the world into destruction.” 

O jogo do covarde pode ser modelado com a seguinte matriz 

de payoffs: 

desviar 

g 2 

não desviar 

g 1 

desviar (2, 2) (1, 3) 

não desviar (3, 1) (0, 0) 

. 

Pede-se: 





equaissão.


[05] (Jogo Hawk-Dove) Dois animais disputam um recurso (uma 

presa, por exemplo). Cada animal tem duas opções: (1) brigar 

pelo recurso (estratégia hawk) ou (2) ameaçar o seu oponente 

(estratégia dove). Se os dois animais resolverem brigar pelo 

recurso, o conflito continuará até que um deles fique ferido e 

o vencedor será o outro. Se somente um animal decide atacar, 

então ele vencerá o animal que decidiu apenas ameaçar. 

Se os dois escolherem fazer ameaças, então existe um empate 

e cada animal recebe um ganho menor do que ganharia na situação 

onde um escolhe brigar e o outro ameaçar. Este jogo 

foi apresentado pela primeira vez por John Maynard Smith e 

George Price no artigo The Logic of Animal Conflict na revista 

Nature [56]. A forma tradicional da matriz de payoffs éa 

seguinte: 

g 1 

brigar 

ameaçar 

brigar 

( V − C 

, V − C ) 

2 2 

(0,V) 

g 2 

ameaçar 

(V,0) 

( V 

2 , V 2 

) 

. 

Aqui, V é o valor do recurso sendo disputado e C éocustoda 

briga. Em geral, assume-se que o valor do recurso émenordo 

que o custo da briga, isto é, C>V >0. Pede-se: 





equaissão. 

[06] No artigo “Nornmandy: Game and Reality”, deW.Drakerna 

revista “Moves”, no. 6 (1972), é feita uma análise da invasão da 

Europa na Normandia na Segunda Guerra Mundial. Seis configurações 

possíveis de ataque (1 a 6) pelos Aliados e seis possíveis


estratégias defensivas (A a F ) pelo Eixo foram simuladas e calculadas, 

num total de 36 simulações. A matriz da Tabela 2.1 

foi estimada pelos Aliados para cada batalha hipotética. Use o 

processo de dominância fraca iterada para reduzir ao máximo 

possível o tamanho da matriz. 

[07] Considere um jogo com três jogadores: A, B e C. Asestratégias 

do jogador A são {x 1 ,x 2 ,x 3 },asestratégias do jogador B são 

{y 1 ,y 2 } easestratégias do jogador C são {z 1 ,z 2 ,z 3 ,z 4 }. Se 

o jogador B escolhe a estratégia y 1 ,ospayoffs são dados pela 

matriz 

C 

z 1 z 2 z 3 z 4 

x 1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1) 

A 

x 2 (3, 2, 2) (9, 1, 8) (2, 0, 5) (2, 0, 2) 

x 3 (1, 0, 0) (1, 0, 9) (4, 0, 8) (3, 0, 3) 

Por outro lado, se o jogador B escolhe a estratégia y 2 ,então os 

payoffs são dados por 

C 

z 1 z 2 z 3 z 4 

x 1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9) 

A 

x 2 (0, 3, 2) (1, 2, 3) (2, 1, 8) (2, 1, 0) 

x 3 (1, 1, 0) (2, 1, 1) (3, 2, 2) (3, 1, 3) 

Use a técnica de dominância estrita iterada para reduzir a matriz 

deste jogo.


Tabela 2.1: Análise da invasão da Europa na Normandia na Segunda Guerra Mundial. 

6 (+23, −23) (+22, −22) (+19, −19) (+23, −23) (+30, −30) (+34, −34) 

Aliados 

3 (+18, −18) (+22, −22) (+31, −31) (+31, −31) (+27, −27) (+37, −37) 

4 (+11, −11) (+22, −22) (+12, −12) (+21, −21) (+21, −21) (+26, −26) 

5 (+18, −18) (+16, −16) (+19, −19) (+14, −14) (+19, −19) (+28, −28) 

2 (+18, −18) (+22, −22) (+21, −21) (+22, −22) (+29, −29) (+31, −31) 

1 (+13, −13) (+29, −29) (+ 8, − 8) (+12, −12) (+16, −16) (+23, −23) 

Eixo 

A B C D E F


[08] Repita o exercício anterior com a matriz de payoffs 

C 

z 1 z 2 z 3 z 4 

x 1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9) 

A 

x 2 (3, 8, 3) (4, 5, 4) (4, 1, 3) (3, 9, 3) 

x 3 (2, 9, 9) (3, 9, 9) (3, 9, 9) (2, 9, 9) 

caso o jogador B escolha a estratégia y 1 eamatrizdepayoffs 

C 

z 1 z 2 z 3 z 4 

x 1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9) 

A 

x 2 (4, 9, 1) (4, 2, 2) (3, 2, 1) (2, 2, 1) 

x 3 (1, 9, 9) (2, 9, 9) (2, 9, 9) (1, 9, 9) 

caso ele escolha a estratégia y 2 . 

[09] Considere um jogo com três jogadores: A, B e C. Asestratégias 

do jogador A são {x 1 ,x 2 ,x 3 },asestratégias do jogador B são 

{y 1 ,y 2 } easestratégias do jogador C são {z 1 ,z 2 ,z 3 ,z 4 }. Se 

o jogador B escolhe a estratégia y 1 ,ospayoffs são dados pela 

matriz 

C 

z 1 z 2 z 3 z 4 

x 1 (1, 2, 1) (2, 3, 1) (1, 0, 2) (1, 4, 1) 

A 

x 2 (2, 0, 1) (1, 2, 1) (3, 1, 3) (3, 2, 1) 

x 3 (1, 0, 1) (1, 1, 1) (2, 5, 1) (1, 3, 1)


Por outro lado, se o jogador B escolhe a estratégia y 2 ,então os 

payoffs são dados por 

C 

z 1 z 2 z 3 z 4 

x 1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1) 

A 

x 2 (2, 1, 0) (1, 5, 1) (2, 2, 3) (1, 5, 2) 

x 3 (2, 1, 1) (1, 0, 1) (1, 0, 4) (1, 5, 3) 

Calcule os equilíbrios de Nash em estratégias puras deste jogo. 

[10] Considere o jogo cuja matriz de payoffs é dada por: 

Jogador 2 

L C R 

Jogador 1 

T (1, 0) (3, 1) (1, 1) 

M (1, 1) (3, 0) (0, 1) 

B (2, 2) (3, 3) (0, 2) 

. 

(a) Identifique, para cada jogador, todos os pares de estratégias 

onde uma estratégia é fracamente dominada pela outra. 

(b) Usando o processo de eliminação das estratégias fracamente 

dominadas, encontre todas as possíveis de maneiras de reduzir 

o jogo para uma matriz 1 × 1. 

(c) Quais são os equilíbrios de Nash em estratégias puras do 

jogo? 

[11] Suponha que o processo de dominância fraca iterada em estratégias 

puras reduza um jogo finito para apenas um único 

perfil de estratégias s ∗ .Mostreques ∗ é um equilíbrio de Nash 

em estratégias puras do jogo.


[12] Demonstre a propriedade 2.2 da página 31 da função utilidade 

esperada definida em 2.1. 

[13] Mostre que uma estratégia mista que atribui probabilidade positiva 

para uma estratégia pura estritamente dominada também 

é estritamente dominada. 

[14] Use a técnica descrita no Exemplo 2.11 para calcular as funções 

de melhor resposta dos jogadores dos Exemplos 2.1 (o dilema 

dos prisioneiros) e 2.6 (comparar moedas). Em seguida, use as 

representações gráficas destas funções para calcular os equilíbrios 

de Nash em estratégias mistas de cada jogo. 

[15] Um equilíbrio de Nash em estratégias mista pode dar probabilidade 

positiva a uma estratégia pura que éestritamentedominada? 

E em uma estratégia pura que é fracamente dominada? 

[16] (Eficiência de Pareto) Um perfil de estratégias puras é Pareto 

eficiente (também denominado ponto ótimo de Pareto) se 

nenhum outro perfil de estratégias puras oferece a todos os jogadores 

um ganho maior, isto é, nenhum jogador pode aumentar o 

seu ganho sem que algum outro jogador tenha uma perda. Mais 

precisamente, s ∗ ∈ S é Pareto eficiente se, não existe s • ∈ S 

tal que 

u i (s • ) >u i (s ∗ ), 

para todo i =1,...,n. 

O equilíbrio de Nash s ∗ = (confessar, confessar) do jogo do 

dilema dos prisioneiros é Pareto eficiente?

Capítulo 3 

O teorema de equilíbrio 

de Nash 

O teorema de equilíbrio de Nash estabelece que todo jogo finito 

possui pelo menos um equilíbrio de Nash em estratégias mistas. Este 

resultado foi provado por John Forbes Nash Jr. em sua tese de doutorado 

em 1949 na Universidade de Princeton. Neste capítulo apresentaremos 

duas demonstrações do teorema, obtidas através de dois 

teoremas de ponto fixo: o de Brouwer e o de Kakutani. 

3.1 Usando o teorema de Brouwer 

Teorema 3.1 (do ponto fixo de Brouwer) Se Δ éum 

subconjunto compacto, convexo e não-vazio de um espaço euclidiano 

de dimensão finita e se F: Δ→ Δé uma função contínua, 

então F possui um ponto fixo em Δ, isto é, existe p ∗ ∈ Δtal 

que 

F(p ∗ )=p ∗ . 

Ademonstração deste teorema pode ser encontrada, por exemplo, 

em [63, 79]. A dissertação de mestrado [89] oferece um excelente 

60

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 61 

survey sobre o assunto: ela inclui dados históricos, generalizações e 

aplicaçõesdoteoremadopontofixodeBrouwer. 

Com as notações dadas na Seção 2.3, estabeleceremos uma seqüência 

de teoremas que fornecem caracterizações alternativas para 

um equilíbrio de Nash. 

Teorema 3.2 Para cada i =1,...,n e j =1,...,m i , defina as 

funções 

z ij : Δ → R 

p ↦→ z ij (p) =u i (s ij , p −i ) − u i (p i , p −i ) 

(isto é, z ij mede o ganho ou perda do jogador g i quando ele troca 

a distribuição de probabilidade p i pela estratégia pura s ij ). Temos 

que p ∗ é um equilíbrio de Nash se, e somente se, 

z ij (p ∗ ) ≤ 0 

para cada i =1,...,n e j =1,...,m i . 

Demonstração: 

(⇒) Sep ∗ =(p ∗ i , p∗ −i )é um equilíbrio de Nash, então u i(p ∗ i , p∗ −i ) 

≥ u i (s ij , p ∗ −i ) para cada i =1,...,n e j =1,...,m i. Conseqüentemente, 

z ij (p ∗ )=u i (s ij , p ∗ −i) − u i (p ∗ i , p ∗ −i) ≤ 0 


(⇐) Se 

z ij (p ∗ )=u i (s ij , p ∗ −i ) − u i(p ∗ i , p∗ −i ) ≤ 0 

para cada i =1,...,n e j =1,...,m i ,então 

u i (s ij , p ∗ −i) =u i (e j , p ∗ −i) ≤ u i (p ∗ i , p ∗ −i) 

para cada i =1,...,n e j =1,...,m i , onde e j éovetoremR mi que 

tem 1 na j-ésima coordenada e zero nas demais. Devemos mostrar 

que para todo p i =(p i1 ,...,p imi ) ∈ Δ mi 

u i (p i , p ∗ −i) ≤ u i (p ∗ i , p ∗ −i).

62 [CAP. 3: O TEOREMA DE EQUILÍBRIO DE NASH 

Mas, como x ↦→ u i (x, p ∗ i ) preserva combinações convexas, temos que 

( 

mi 

) 

∑ 

∑m i 

u i (p i , p ∗ −i) =u i p ik · e k , p ∗ ( 

−i = p ik · u i ek , p ∗ ) 

−i 

∑m i 

k=1 

k=1 

≤ 

k=1 

( 

p ik · u i p 

∗ 

i , p ∗ ( ∑m i 

−i) 

= ui p 

∗ 

i , p ∗ ( 

−i) 

· p ik = u i p 

∗ 

i , p ∗ −i) 

, 

onde, na última igualdade, usamos o fato de que ∑ m i 

k=1 p ik =1,dado 

que p i ∈ Δ mi . 

k=1 

Teorema 3.3 Para cada i =1,...,n e j =1,...,m i , defina as 

funções 

g ij : Δ → R 

p ↦→ g ij (p) =max{0,z ij (p)} . 

Temos que p é um equilíbrio de Nash se, e somente se, 

g ij (p) =0 


Demonstração: A prova segue imediatamente do teorema anterior. 

Teorema 3.4 Defina a aplicação 

F: Δ = Δ m1 ×···×Δ mn → Δ=Δ m1 ×···×Δ mn 

p =(p 1 ,...,p n ) ↦→ F(p) =(y 1 (p),...,y n (p)) , 

onde 

e 

y i (p) =(y i1 (p),...,y imi (p)), p i =(p i1 ,...,p imi )

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 63 

y ij (p) = 

p ij + g ij (p) 

m i 

. 

∑ 

1+ g ik (p) 

k=1 

Temos que p ∗ é um equilíbrio de Nash se, e somente se, 

F(p ∗ )=p ∗ , 

isto é, se, e somente se, p ∗ éumpontofixodaaplicação F. 

Demonstração: Observe que, de fato, F(Δ) ⊆ Δ, pois claramente 

y ij ≥ 0e 

∑m i 

k=1 

⎛ 

⎞ 

∑m i 

∑m i 

∑m i 

p ik + g ik (p) 

y ik (p) = 

p ik + g ik (p) 

⎜ m i 

k=1 ⎝ ∑ ⎟ 

⎠ = k=1 k=1 

∑m i 

1+ g ik (p) 1+ g ik (p) 

k=1 

∑m i 

1+ g ik (p) 

k=1 

m i 

= 

=1, 

∑ 

1+ g ik (p) 

k=1 

isto é, cada y i (p) ∈ Δ mi . 

(⇒) Sep ∗ é um equilíbrio de Nash, então g ij (p ∗ ) = 0 para cada 

i =1,...,n e j =1,...,m i .Destamaneira,y ij (p ∗ )=p ∗ ij para cada 

i =1,...,ne j =1,...,m i ,istoé, y i (p ∗ )=p ∗ i para cada i =1,...,n 

ou, ainda, F(p ∗ )=p ∗ . 

(⇐) Suponha que p ∗ =(p ∗ 1, p ∗ 2,...,p ∗ n) ∈ Δ=Δ m1 ×···×Δ mn 

seja um ponto fixo da aplicação F: Δ→ Δ, isto é, suponha que 

p ∗ ij = p∗ ij + g ij(p ∗ ) 

∑m i 

1+ g ik (p ∗ ) 

k=1 

k=1


para todo j =1,...,m i e i =1,...,n.Segue-seentão que 

m i 

p ∗ ij · 

∑ 

g ik (p ∗ )=g ij (p ∗ ), 

k=1 

∑ 

para todo j =1,...,m i e i =1,...,n. Afirmamos agora que α = 

mi 

k=1 g ik(p ∗ ) = 0, de modo que g ik (p ∗ )=0paratodok =1,...,m i 

e i =1,...,n. De fato: se, por absurdo, α>0, vemos a partir da 

relação acima que 

g ij (p ∗ ) > 0 se, e somente se, p ∗ ij > 0. 

Sem perda de generalidade, suponha que p ∗ i1 > 0, p∗ i2 > 0,...,p∗ il > 0 

e p ∗ i(l+1) = p∗ i(l+2) = ···= p∗ im i 

=0. Observeque 

∑m i 

p ∗ i = p ∗ ike k , 

k=1 

onde e i é o i-ésimo vetor da base canônica de R mi . Dado que 

g ik (p ∗ ) > 0paratodok =1,...,l,temosque 

u i (e k , p ∗ −i) >u i (p ∗ i , p ∗ −i), 

para todo k =1,...,l.Destamaneira, 

( 

mi 

) 

∑ 

∑m i 

u i (p ∗ i , p ∗ −i) =u i p ∗ ike k , p ∗ −i = p ∗ ( 

ik · u i ek , p ∗ ) 

−i 

k=1 

k=1 

= 

l∑ 

k=1 

p ∗ ik · u ( 

i ek , p ∗ ) 

−i 

> 

l∑ 

p ∗ ik · u ( 

i p 

∗ 

i , p ∗ ( 

−i) 

= ui p 

∗ 

i , p ∗ −i) 

· 

k=1 

l∑ 

p ∗ ik = u ( 

i p 

∗ 

i , p ∗ −i) 

, 

um absurdo. Isto demonstra que g ij (p ∗ )=0paratodoj =1,...,m i 

e j =1,...,m e, assim, p ∗ é um equilíbrio de Nash em estratégias 

mistas. 

k=1

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 65 

Teorema 3.5 (do equilíbrio de Nash) Todo jogo definido 

por matrizes de payoffs possui um equilíbrio de Nash. 

Demonstração: A aplicação F: Δ→ Δ definida no teorema anterior 

écontínua e Δ é um conjunto compacto e convexo. Pelo teorema 

do ponto fixo de Brouwer, F possui um ponto fixo p ∗ . Pelo teorema 

anterior, p ∗ é um equilíbrio de Nash. 

3.2 Usando o teorema de Kakutani 

Seja X um subconjunto de R n . Dizemos que p ∗ ∈ X éumponto 

fixo de uma função φ: X → 2 X se p ∗ ∈ φ(p ∗ ). O teorema do ponto 

fixo de Kakutani estabelece condições suficientes para que φ possua 

pelo menos um ponto fixo. 

Teorema 3.6 (do ponto fixo de Kakutani) Seja X um 

subconjunto compacto, convexo e não-vazio de R n .Se 

φ: X → 2 X 

ésemicontínua superiormente e φ(x)énão-vazio e convexo para 

todo x ∈ X, então φ possui pelo menos um ponto fixo, isto é, 

existe p ∗ ∈ X tal que 

p ∗ ∈ φ(p ∗ ). 

Suponha que exista um subconjunto compacto K de R n tal que 

φ(x) ⊆ K para todo x ∈ X e suponha que φ(x) é um subconjunto 

fechado de R n para todo x ∈ X. Dizemos que φ: X → 2 X é contínua 

superiormente se, e somente se, y 0 ∈ φ(x 0 ) sempre que (a) x 0 ∈ X, 

(b) x k ∈ X para k =1, 2,..., (c) lim k→+∞ x k = x 0 ,(d)y k ∈ φ(x k ) 

e (e) lim k→+∞ y k = y 0 . Neste contexto, φ écontínua superiormente 

se, e somente se, o gráfico de φ, 

Gr(φ) ={(x, y) ∈ X × X | y ∈ φ(x)},


é um subconjunto fechado de X × X. Por exemplo, se X =[0, 1], 

então 

{ {1/2}, se 0 ≤ x

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 67 

y 

1 

3/4 

1/2 

1/4 

0 1/2 

1 

x 

Figura 3.2: Gráfico de uma função que não é semicontínua superiormente. 

Teorema 3.7 (do equilíbrio de Nash) Todo jogo definido 

por matrizes de payoffs possui um equilíbrio de Nash. 

Demonstração: Basta verificarmos que a função de melhor resposta 

satisfaz as hipóteses do teorema do ponto fixo de Kakutani. 

(1) O conjunto X =Δ=Δ(S 1 ) × ···× Δ(S n )énão-vazio, compacto 

(como produto cartesiano de conjuntos compactos) e convexo 

(como produto cartesiano de conjuntos convexos). 

(2) Para todo p ∈ Δ, o conjunto MR(p) está contido no compacto 

K =Δ. 

(3) Para todo p ∈ Δ, o conjunto MR(p) é convexo. De fato: suponha, 

por absurdo, MR(p) não seja um conjunto convexo. Então 

existem q (•) , q (◦) ∈ MR(p) eλ ∈ (0, 1) tais que 

(1 − λ) · q (•) + λ · q (◦) ∉ MR(p).


Mas, para todo índice i, valeque 

u i ((1 − λ) · q (•) 

i 

Agora, 

+ λ · q (◦) 

i , p −i )= 

(1 − λ) · u i (q (•) 

i 

, p −i )+λ · u i (q (◦) 

i , p −i ). 

u i (q (•) 

i , p −i )=u i (q (◦) 

i , p −i )=constante= max u i(p i , p −i ). 

p i ∈Δ(S i) 

Conseqüentemente, u i ((1 − λ) · q (•) 

i + λ · q (◦) 

i , p −i )=constante, 

isto é, (1 − λ) · q (•) 

i + λ · q (◦) 

i ∈ MR i (p −i ), para todo i =1,...,n, 

oqueéumacontradição. 

(4) Para todo p ∈ Δ,oconjuntoMR(p) é fechado. Para ver isto, 

basta mostrar que MR i (p −i ) = argmax pi ∈Δ(S i) u i (p i , p −i )éfechado. 

Seja então p (k) 

i uma sequência de pontos em MR i (p −i )que 

converge para p (0) 

i . Desta maneira, u i (p (k) 

i , p −i )=constante= 

max pi ∈Δ(S i) u i (p i , p −i )e,comox ↦→ u i (x, p −i )é uma função 

contínua, concluímos que 

u i (p (0) 

i , p −i )=constante= max 

p i ∈Δ(S i) u i(p i , p −i ). 

Sendo assim, p (0) 

i ∈ MR i (p −i ). 

(5) MR: Δ → 2 Δ ésemicontínua superiormente. Com efeito, mostraremos 

que se (a) p (0) ∈ Δ, (b) p (k) éumasequência de pontos 

em Δ, (c) lim k→+∞ p (k) = p (0) ,(d)q (k) ∈ MR(p (k) )e(e)q (k) 

converge para q (0) , então q (0) ∈ MR(p (0) ). Se, por absurdo, 

q (0) ∉ MR(p (0) ), então existe índice i tal que q (0) 

i 

∉ MR(p (0) 

Portanto, existem ɛ>0eq (•) 

i 

∈ Δ(S i )taisque 

u i (q (•) 

i , p (0) 

−i ) >u i(q (0) 

i , p (0) 

−i )+3· ɛ. 

−i ). 

Mas, desde que u i é uma função contínua e (q (k) 

i , p (k) 

−i )converge 

para (q (0) 

i , p (0) 

−i ), então para todo k suficientemente grande, 

u i (q (•) 

i , p (k) 

−i ) >u i(q (•) 

i , p (0) 

−i ) − ɛ> 

u i (q (0) 

i , p (0) 

−i )+2· ɛ>u i(q (k) 

i 

, p (k) 

−i )+ɛ.

[SEC. 3.3: ALGUMAS PROPRIEDADES DOS EQUILÍBRIOS DE NASH 69 

Sendo assim, q (k) 

i ∉ MR i (p (k) 

−i ), pois u i(q (•) 

i , p (k) 

−i ) >u i(q (k) 

i , p (k) 

−i ), 

o que contradiz (d). 

Shizuo Kakutani demonstrou o seu teorema no artigo [45]. Debreu 

lista mais de 300 aplicações do teorema do ponto fixo de Kakutani 

ao provar a existência de um equilíbrio econômico em [24]. 

3.3 Algumas propriedades dos equilíbrios 

de Nash 

Wilson ([97]) mostrou que, a menos de um conjunto fechado e 

de medida zero, todo jogo finito possui um número finito e ímpar 

de equilíbrios de Nash em estratégias mistas. Pelo menos para jogos 

com dois jogadores, cada um com duas estratégias, este resultado 

pode ser antecipado através da análise das funções de melhor resposta 

que fizemos na Subseção 2.4.2 (veja, por exemplo, a Figura 2.5 na 

página 42). Harsanyi, em [40], apresentou uma prova alternativa para 

este resultado. Também tratam do assunto as referências [35, 36, 59]. 

Por outro lado, os casos degenerados podem ter topologias diversificadas. 

De fato, Datta provou que toda variedade algébrica real 

(soluções reais de um sistema de equações polinomiais) éisomorfa 

ao conjunto de equilíbrios de Nash em estratégias totalmente mistas 

de algum jogo com 3 jogadores e, também, de algum jogo com n 

jogadores, cada um com apenas 2 estratégias puras ([20]). Um perfil 

de estratégias totalmente mistas éumperfilquedá probabilidade 

positiva a cada estratégia pura. 

Existem jogos cujos payoffs são todos números racionais, mas todos 

os equilíbrios de Nash em estratégias mistas possuem coordenadas 

irracionais ([69]). Contudo, Markakis mostrou que, neste contexto, 

existe sempre pelo menos um equilíbrio de Nash em estratégias mistas 

com coordenadas algébricas ([51, 54]). 

Torres-Martínez ([91]) e Zhao ([99]) demonstram que épossível 

deduzir os teoremas de ponto fixo de Brouwer e Kakutani a partir de 

um teorema de existência de equilíbrios de Nash.


3.4 Exercícios 

[01] O objetivo deste exercício é mostrar que as hipóteses do teorema 

do ponto fixo de Brouwer não podem ser removidas. 

(a) Exiba uma função F: Δ→ Δ descontínua, definida em um 

subconjunto Δ compacto, convexo e não-vazio de R n ,que 

não possui ponto fixo. 

(b) Exiba uma função F: Δ→ Δcontínua, definida em um 

subconjunto Δ não-compacto, convexoenão-vazio de R n , 

que não possui ponto fixo. 

(c) Exiba uma função F: Δ→ Δcontínua, definida em um 

subconjunto Δ compacto, não-convexo enão-vazio de R n , 

que não possui ponto fixo. 

[02] Exiba um exemplo de função φ: X → 2 X definida em um 

subconjunto X compacto, convexo e não-vazio de R n , que é 

semicontínua superiormente, mas não possui ponto fixo. Isto 

mostra que a hipótese de φ(x) ser um conjunto convexo para 

todo x ∈ X não pode ser removida do enunciado do teorema 

do ponto fixo de Kakutani. 

[03] Dê um exemplo de jogo com um número par de equilíbrios de 

Nash em estratégias mistas.

Capítulo 4 

Calculando equilíbrios 

de Nash 

4.1 Equilíbrio de Nash via um problema 

de otimização 

O Teorema 3.3 sugere uma maneira de se calcular os equilíbrios 

de Nash de um jogo. Eles são soluções do seguinte problema de 

otimização não-linear: 

minimizar 

n∑ ∑m i 

(g ij (p)) 2 

i=1 j=1 

sujeito a p ∈ Δ. 

Com efeito: a soma de quadrados é zero se, e somente se, cada parcela 

é igual a zero. McKelvey demonstrou em [58] que a função objetivo 

p ↦→ 

n∑ ∑m i 

(g ij (p)) 2 

i=1 j=1 

é uma função de classe C 1 . Assim, algoritmos numéricos de otimização 

que usam derivadas (Newton, Davidon-Fletcher-Powell) podem 

ser usados. 

71

72 [CAP. 4: CALCULANDO EQUILÍBRIOS DE NASH 

Exemplo 4.1 Para o dilema do prisioneiro (Exemplo 2.1, página 11), 

(p, q) =(p, 1 − p; q, 1 − q) ∈ Δ 2 × Δ 2 

é um equilíbrio de Nash se, e somente se, (p, q) ésolução do seguinte 

problema de otimização 

minimizar G(p, q) = (max{0, − (−1+p)(4q +1)}) 2 + 

(max {0, −p (4 q +1)}) 2 + 

(max {0, − (4 p +1)(−1+q)}) 2 + 

(max {0, −q (4 p +1)}) 2 

sujeito a 0 ≤ p ≤ 1, 

0 ≤ q ≤ 1. 

Como vemos pela Figura 4.1, que mostra o gráfico e o mapa de contorno 

de G, oponto 

(p ∗ , q ∗ )=(1, 0; 1, 0) 

éoúnico equilíbrio de Nash do jogo. 

Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, página 13), 

(p, q) =(p, 1 − p; q, 1 − q) ∈ Δ 2 × Δ 2 



minimizar G(p, q) = (max{0, −5 (−1+p)(3q − 1)}) 2 + 

(max {0, −5 p (3 q − 1)}) 2 + 

(max {0, −5 (3p − 2) (−1+q))) 2 + 

(max {0, −5 q (3 p − 2)}) 2 


0 ≤ q ≤ 1. 


de G, ospontos 

(p ∗ , q ∗ )=(1, 0; 1, 0), (p ∗ , q ∗ )=(0, 1; 0, 1) e 

(p ∗ , q ∗ )=(2/3, 1/3; 1/3, 2/3)

[SEC. 4.1: EQUILÍBRIO DE NASH VIA UM PROBLEMA DE OTIMIZAÇÃO 73 

são os únicos equilíbrios de Nash do jogo. 

Exemplo 4.3 Para o jogo do Exemplo 2.6 da página 22, 

(p, q) =(p, 1 − p; q, 1 − q) ∈ Δ 2 × Δ 2 




(max {0, −2 p (2 q − 1)}) 2 + 

(max {0, 2(2p − 1) (−1+q)}) 2 + 

(max {0, 2(2p − 1) q}) 2 


0 ≤ q ≤ 1. 


de G, oponto 

(p ∗ , q ∗ )=(1/2, 1/2; 1/2, 1/2) 


Exemplo 4.4 Para o jogo do exemplo 2.12 da página 42, 

(p, q) =(p, 1 − p; q, 1 − q) ∈ Δ 2 × Δ 2 




(max {0, −2 p (2 q − 1)}) 2 + 

(max {0, (−3+4p)(−1+q)}) 2 + 

(max {0,q(−3+4p)}) 2 


0 ≤ q ≤ 1.



de G, oponto 

(p ∗ , q ∗ )=(3/4, 1/4; 1/2, 1/2) 


4.2 Equilíbrio de Nash via equações polinomiais 

Apróxima proposição estabelece que a maior utilidade esperada 

que o jogador g i pode obter contra qualquer escolha de estratégias 

mistas dos demais jogadores não depende se o jogador g i está usando 

estratégias mistas ou somente estratégias puras. Mais ainda, as estratégias 

mistas ótimas para o jogador g i são justamente aquelas que 

atribuem probabilidade positiva somente para as estratégias puras 

ótimas. 

Proposição 4.1 Para todo i = 1,...,n e para todo p = 

(p 1 ,...,p i ,...,p n ) ∈ Δ=Δ(S 1 ) ×···×Δ(S i ) ×···Δ(S n ), 

Mais ainda, 

max u i (s iji , p −i )= max u i(˜p i , p −i ). 

s iji ∈S i ˜p i ∈Δ(S i) 

p ∗ i =(p ∗ i1,...,p ∗ ik,...,p ∗ im i 

) ∈ argmax˜pi ∈Δ(S i) u i (˜p i , p −i ) 

⇕ 

p ∗ ik = 0 para todo k tal que s ik ∉ argmax siji ∈S i 

u i (s iji , p −i ). 

Demonstração: Pela Propriedade 2.4, sabemos que 

u i (˜p i , p −i )= 

∑m i 

j i=1 

˜p iji · u i (s iji , p −i ).

[SEC. 4.2: EQUILÍBRIO DE NASH VIA EQUAÇÕES POLINOMIAIS 75 

25 

20 

15 

10 

5 

1 

0 

0 0.2 0.4 0.6 0.8 1 

p 

0 

0.5 q 

p 

0 0.2 0.4 0.6 0.8 1 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

Figura 4.1: Encontrando os equilíbrios de Nash para o dilema do prisioneiro 

via um problema de otimização.


3 

2.5 

2 

1.5 

1 

1 

0.5 

0.8 

0.6 

0.4 q 

0 

0.2 

0 0.2 0.4 0.6 0.8 

0 

1 

p 

p 

0 0.2 0.4 0.6 0.8 1 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

Figura 4.2: Encontrando os equilíbrios de Nash para a batalha dos 

sexos via um problema de otimização.


4 

3 

2 

1 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

0 

0.2 

0.4 

p 

0.6 

0.8 

1 

p 

0 0.2 0.4 0.6 0.8 1 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

Figura 4.3: Encontrando os equilíbrios de Nash do jogo de comparar 

moedas via um problema de otimização.


8 

6 

4 

2 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

0 

0.2 

0.4 

p 

0.6 

0.8 

1 

p 

0 0.2 0.4 0.6 0.8 1 

1 

0.8 

0.6 

q 

0.4 

0.2 

0 

Figura 4.4: Encontrando os equilíbrios de Nash do jogo do Exemplo 

2.12 via um problema de otimização.


Assim, u i (˜p i , p −i )éamédia ponderada dos valores u i (s iji , p −i ), onde 

os pesos ˜p iji são não-negativos e somam 1. Esta média ponderada 

não pode ser maior do que o maior dos valores que participam no 

cálculo da média. Assim, 

para todo ˜p i ∈ Δ(S i ) e, portanto, 

u i (˜p i , p −i ) ≤ max 

s iji ∈S i 

u i (s iji , p −i ) 

max 

˜p i ∈Δ(S i) u i(˜p i , p −i ) ≤ max 

s iji ∈S i 

u i (s iji , p −i ). 

Por outro lado, u i (s iji , p −i )=u i (e ji , p −i ), onde e ji é a distribuição 

de probabilidades em Δ(S i ) que dá peso1àestratégia pura s iji . 

Assim, 

u i (s iji , p −i )=u i (e ji , p −i ) ≤ 

para todo s iji ∈ S i e, portanto, 

max u i(˜p i , p −i ) 

˜p i ∈Δ(S i) 

max u i (s iji , p −i ) ≤ max u i(˜p i , p −i ). 

s iji ∈S i ˜p i ∈Δ(S i) 

Para a segunda parte da proposição, suponha por absurdo que exista 

p ∗ i =(p ∗ i1,...,p ∗ ik,...,p ∗ im i 

) ∈ argmax˜pi ∈Δ(S i) u i (˜p i , p −i ) 

onde, para algum índice k, ocorre que 

p ∗ ik > 0 e s ik ∉ argmax siji ∈S i 

u i (s iji , p −i ). 

Isto implica que u i (s ik , p −i ) < max siji ∈S i 

u i (s iji , p −i ). Uma vez que 

u i (s iji , p −i ) ≤ max siji ∈S i 

u i (s iji , p −i )paratodoj i ≠ k, segue-se que 

u i (p ∗ i , p −i ) = 

< 

∑m i 

j i=1 

∑m i 

j i=1 

p ∗ ij i · u i (s iji , p −i ) 

p ∗ ij i · max 

s iji ∈S i 

u i (s iji , p −i )= 

maxu i (s iji , p −i ) 

s iji ∈S i 

= max 

˜p i ∈Δ(S i) u i(˜p i , p −i ).


Masisto contradiz o fato de p ∗ i pertencer a argmax˜p i ∈Δ(S i) u i (˜p i , p −i ). 

Reciprocamente, se p ∗ i satisfaz a condição p∗ ik = 0 para todo k tal que 

s ik ∉ argmax siji ∈S i 

u i (s iji , p −i ), então 

sempre que p ∗ ik > 0. Assim 

u i (s ik , p −i )= max 

s iji ∈S i 

u i (s iji , p −i ) 

m i 

u i (p ∗ i , p −i ) = ∑ 

p ∗ ik · u i(s ik , p −i ) = ∑ 

k=1 

= ∑ 

p ∗ ik >0 p ∗ ik · max 

s iji ∈S i 

u i (s iji , p −i )= 

= max 

˜p i ∈Δ(S i) u i(˜p i , p −i ). 

p ∗ ik >0 p ∗ ik · u i(s ik , p −i ) 

maxu i (s iji , p −i ) 

s iji ∈S i 

Isto mostra que p ∗ i pertence a a argmax˜p i ∈Δ(S i) u i(˜p i , p −i ). 

Corolário 4.1 p ∗ =(p ∗ 1 ,...,p∗ i ,...,p∗ n) ∈ Δé um equilíbrio 

de Nash em estratégias mistas se, e somente se, para todo i = 

1,...,n, 

p ∗ ik > 0 ⇒ s ik ∈ argmax siji ∈S i 

u i (s iji , p ∗ −i), 

onde p ∗ i =(p∗ i1 ,...,p∗ ik ,...,p∗ im i 

). 

O suporte de um perfil p ∗ i =(p∗ i1 ,...,p∗ ik ,...,p∗ im i 

)deestratégias 

mistas é o conjunto de estratégias puras do jogador g i que recebe 

probabilidade positiva por p ∗ i . Mais precisamente, 

supp(p ∗ i )={s ik ∈ S i | p ∗ ik > 0}. 

Assim, o Corolário 4.1 diz que p ∗ =(p ∗ 1 ,...,p∗ i ,...,p∗ n )é um equilíbrio 

de Nash se, e somente se, para todo i =1,...,n, 

supp(p ∗ i ) ⊆ argmax s iji ∈S i 

u i (s iji , p ∗ −i ).


AProposição 4.1 pode ser usada para calcular equilíbrios de Nash 

em estratégias mistas. O ponto chave é observar que, pela Proposição 

4.1, se p ∗ ∈ Δé um equilíbrio de Nash em estratégias mistas, 

então, para todo i =1,...,n, 

u i (s ik , p ∗ −i) =constante= max 

s iji ∈S i 

u i (s iji , p ∗ −i) (4.1) 

sempre que p ∗ ik > 0, isto é, em um equilíbrio de Nash, o jogador g i 

tem o mesmo ganho se trocar sua estratégia p ∗ i por qualquer outra 

estratégia pura que recebeu probabilidade positiva de p ∗ i . 

Exemplo 4.5 No Exemplo 2.11, vimos que as funções utilidade dois 

jogadores da batalha dos sexos são dadas por 

u Homem (p 11 ,p 12 ; p 21 ,p 22 ) = 10· p 11 · p 21 + 5· p 12 · p 22 , 

u Mulher (p 11 ,p 12 ; p 21 ,p 22 ) = 5· p 11 · p 21 +10· p 12 · p 22 . 

Vamosusarasrelações 4.1 para calcular o equilíbrio de Nash em 

estratégias mistas que não é um equilíbrio em estratégias puras, 

isto é, o equilíbrio de Nash cujas estratégias mistas tem suporte 

nas duas estratégias puras de cada jogador. Para isto, considere 

p ∗ =(p ∗ 11,p ∗ 12; p ∗ 21,p ∗ 22) ∈ Δ 2 × Δ 2 ,com0


mais do que dois jogadores e com mais do que duas estratégias puras 

por jogador. Neste caso, é preciso (1) considerar os vários casos que 

resultam das diferentes escolhas das estratégias puras que farão parte 

do suporte de cada perfil em estratégias mistas e (2) resolver o sistema 

não-linear resultante. Mais precisamente, para cada jogador g i epara 

cada subconjunto não-vazio T i = {s ik1 ,...,s ikti } de S i (que especifica 

quais estratégias puras farão parte do suporte), devemos resolver o 

sistema descrito na Figura 4.5 (neste sistema, w i representa o ganho 

constante que o jogador g i obtém escolhendo qualquer uma de suas 

estratégias puras que recebeu probabilidade positiva de p ∗ i ). 

Para jogos com muitos jogadores e muitas estratégias, o sistema 

da Figura 4.5 não éprático para o cálculo a mão dos equilíbrios de 

Nash. Contudo, métodos numéricos para a solução de um sistema 

de equações polinomiais podem ser aplicados: o método de Newton 

com uma estratégia de subdivisão espacial, bases de Gröbner e continuação 

homotópica poliedral. O leitor interessado pode consultar as 

referências [21, 22, 51] 

4.3 Jogos de soma zero 

Nesta seção estudaremos os jogos de soma zero com dois jogadores, 

uma classe especial de jogos onde a soma dos payoffs dos dois 

jogadores é sempre zero: o que um jogador ganha, o outro perde 1 . 

Veremos que, para este tipo de jogo, os equilíbrios de Nash em estratégias 

mistas podem ser facilmente calculados resolvendo-se um 

problema de otimização linear. 

4.3.1 Jogos de soma constante com dois jogadores 

Definição 4.1 (Jogos de soma constante com dois jogadores) 

Um jogo de soma constante com dois jogadores éum 

jogo com dois jogadores, comumente denominados jogador linha 

e jogador coluna, com estratégias 

1 Por este motivo, jogos de soma zero também são denominados jogos estritamente 

competitivos.

[SEC. 4.3: JOGOS DE SOMA ZERO 83 

∑ 

m1 

j1=1 

··· 

mi−1 

∑ 

ji−1=1 

mi+1 

∑ 

ji+1=1 

··· 

∑ 

mn 

jn=1 

p ∗ 1j1 ···p∗ (i−1)ji−1 · p∗ (i+1)ji+1 ···p∗ njn · u i(s1j1,...,sij−i,sikτ 

,siji+1,snjn) =wi, 

∀i =1,...,n,∀sikτ ∈ Ti, 

p ∗ ikτ =0, ∀i =1,...,n,∀τ =1,...,t i, 

∑ 

ti 

τ =1 

p ∗ ikτ 

=1, ∀i =1,...,n. 

Figura 4.5: Calculando equilíbrios de Nash através de um sistema não-linear.


S jogador linha = {1, 2,...,m} 

e 

S jogador coluna = {1, 2,...,n} 

ematrizdepayoffs 

jogador coluna 

1 2 ··· n 

jogador linha 

1 (a 11 ,b 11 ) (a 12 ,b 12 ) ··· (a 1n ,b 1n ) 

2 (a 21 ,b 21 ) (a 22 ,b 22 ) ··· (a 2n ,b 2n ) 

. 

. 

. 

. 

. 

. 

. .. 

. 

. 

m (a m1 ,b m1 ) (a m2 ,b m2 ) ··· (a mn ,b mn ) 

satisfazendo a ij + b ij = c = constante, para todo i =1,...,m 

e j =1,...,n. No caso particular em que a constante c é zero, 

dizemos que o jogo tem soma zero. 

Em termos de estratégias mistas, se p =(p 1 ,...,p m ) ∈ Δ m éuma 

distribuição de probabilidades para as estratégias puras do jogador 

linha e q =(q 1 ,...,q n ) ∈ Δ n é uma distribuição de probabilidades 

para as estratégias puras do jogador coluna, então o payoff esperado 

para o jogador linha é 

m∑ n∑ 

u l (p, q) = p i q j a ij 

i=1 j=1 

⎡ 

= [ ] 

p 1 p 2 ··· p m ⎢ 

⎣ 

⎤ ⎡ 

a 11 a 12 ··· a 1n 

a 21 a 22 ··· a 2n 

. 

. 

. .. . 

⎥ ⎢ 

⎦ ⎣ 

a m1 a m2 ··· a mn 

q 1 

q 2 

. . 

q n 

⎤ 

⎥ 

⎦ ,


isto é, 

⎡ 

u l (p, q) =p T Aq, com A = ⎢ 

⎣ 

⎤ 

a 11 a 12 ··· a 1n 

a 21 a 22 ··· a 2n 

. . . 

. . .. 

. ⎥ 

. ⎦ . 

a m1 a m2 ··· a mn 

Analogamente, o payoff esperado para o jogador coluna é dado por 

⎡ 

⎤ 

b 11 b 12 ··· b 1n 

u c (p, q) =p T b 21 b 22 ··· b 2n 

Bq, com B = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ . 

b m1 b m2 ··· b mn 

Uma vez que o jogo tem soma constante, vemos que 

⎡ 

⎤ ⎡ 

⎤ 

a 11 a 12 ··· a 1n b 11 b 12 ··· b 1n 

a 21 a 22 ··· a 2n 

A + B = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ + b 21 b 22 ··· b 2n 

⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ 

a m1 a m2 ··· a mn b m1 b m2 ··· b mn 

⎡ 

⎤ 

c c ··· c 

c c ··· c 

= ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ , 

c c ··· c 

isto é, 

⎡ 

A + B = C = ⎢ 

⎣ 

c c ··· c 

c c ··· c 

. 

. 

. .. . c c ··· c 

⎤ ⎡ 

⎥ 

⎦ = c ⎢ 

⎣ 

1 1 ··· 1 

1 1 ··· 1 

. 

. 

. .. . 1 1 ··· 1 

⎤ 

⎥ ⎥⎥⎦ 

= c 1 , 

onde 1 denota a matriz m × n formada com 1 em todas as suas 

entradas. Sendo assim, éfácil de ver que 

u c (p, q) =p T Bq = p T (c 1 − A)q = cp T 1 q − p T Aq = c − u l (p, q)


onde, na última igualdade, usamos que p T 1 q =1,poisp e q são 

distribuições de probabilidades e, por isto, 

m∑ 

n∑ 

p i =1 e q j =1. 

i=1 

j=1 

Em particular, vale a seguinte propriedade importante: 

u l (p ∗ , q ∗ ) ≥ u l (p, q ∗ ) ⇔ u c (p ∗ , q ∗ ) ≤ u c (p, q ∗ ). (4.2) 

4.3.2 Equilíbrio de Nash em estratégias puras 

Definição 4.2 (Ponto de sela) Dizemos que um elemento 

a ij de uma matriz A éumponto de sela da matriz A se ele for 

simultaneamente um mínimo em sua linha e um máximo em sua 

coluna, isto é, se 

a ij ≤ a il para todo l =1,...,n e 

a ij ≥ a kj para todo k =1,...,m. 

Otermoponto de sela vem do fato que se desenharmos o gráfico 

dos payoffs do jogador linha, a vizinhança do ponto de sela lembra o 

formato de uma sela de cavalo (Figura 4.6). 

Teorema 4.1 O elemento a ij é um ponto de sela da matriz A 

se, e somente se, o par (i, j) é um equilíbrio de Nash em estratégias 

puras para o jogo. 


(⇒) Sejaa ij um ponto de sela da matriz A. Comoa ij émáximo 

em sua coluna, vale que 

u l (i, j) =a ij ≥ a kj = u l (k, j)


payoff 

Colunas 

Linhas 

Figura 4.6: Ponto de sela. 

para todo k =1,...,m,istoé, o jogador linha não pode aumentar o 

seu payoff se o jogador coluna mantiver a escolha da coluna j. Por 

outro lado, como a ij émínimo em sua linha, vale que 

u c (i, j) =b ij = c − a ij ≥ c − a il = b il = u c (i, l) 

para todo l =1,...,n,istoé, o jogador coluna não pode aumentar 

oseupayoff se o jogador linha mantiver a escolha da linha i. Isto 

mostra que o perfil de estratégias puras (i, j) é um equilíbrio de Nash 

do jogo. 

(⇐) Seja(i, j) é um equilíbrio de Nash do jogo. A partir das 

considerações acima, éfácil de ver que a ij émáximo em sua coluna 

emínimo em sua linha e que, portanto, a ij é um ponto de sela da 

matriz A.


Teorema 4.2 Se a ij e a rs são dois pontos de sela da matriz A, 

então a is e a rj também são pontos de sela da matriz A e 

a ij = a rs = a is = a rj . 

Demonstração: Considere a matriz 

⎡ 

. . 

··· a ij ··· a is ··· 

A = 

. 

. . .. 

. 

. 

⎢ 

⎣ ··· a rj ··· a rs ··· 

. . 

⎤ 

. 

⎥ 

⎦ 

Como a ij e a rs são pontos de sela, sabemos que eles são mínimos 

em suas respectivas linhas e máximos em suas respectivas colunas. 

Assim, 

a ij ≤ a is ≤ a rs e a ij ≥ a rj ≥ a rs , 

e, portanto, 

a ij = a is = a rj = a rs . 

Observe que a is émínimo em sua linha, pois a ij = a is émínimo 

da mesma linha e que a is émáximo em sua coluna, pois a rs = a is 

émáximo da mesma coluna. Analogamente, a rj émínimo em sua 

linha, pois a rs = a rj émínimo da mesma linha e a rj émáximo em 

sua coluna, pois a rj = a ij émáximo da mesma coluna. Concluímos 

então que a is e a rj também são pontos de sela da matriz A. 

O payoff mínimo do jogador linha, se ele escolher a linha k, édado 

por 

a k = min a kl. 

1≤l≤n 

Analogamente, o payoff mínimo do jogador coluna, se ele escolher a 

coluna l, é dado por c − a l , onde 

a l = max 

1≤k≤m a kl.


Defina 

e 

v l (A) = 

max a k = 

1≤k≤m 

max 

v c (A) = min a l = min 

1≤l≤n 1≤l≤n 

min 

a kl 

1≤k≤m 1≤l≤n 

max 

1≤k≤m a kl. 

Teorema 4.3 Para toda matriz A, tem-sev c (A) ≥ v l (A). 

Demonstração: Temos que para todo k =1,...,m e j =1,...,n, 

a kj ≥ min a kl. 

1≤l≤n 

Assim, 

max a kj ≥ max min a kl = v l (A), 

1≤k≤m 1≤k≤m 1≤l≤n 

para todo j =1,...,n.Conseqüentemente, 

v c (A) = min 

1≤j≤n 

max a kj ≥ max 

1≤k≤m 

1≤k≤m 

min a kl = v l (A). 

1≤l≤n 

Opróximo teorema caracteriza a existência de pontos de sela e, 

portanto, a existência de equilíbrios de Nash em estratégias puras, 

em termos das funções v l e v c . 

Teorema 4.4 Uma matriz A tem um ponto de sela se, e somente 

se, v l (A) =v c (A). 


(⇒) Se a ij é um ponto de sela da matriz A, então vale que 

a ij =min 1≤l≤n a il = a i . Como v l (A) =max 1≤k≤m a k ,é claro que 

v l (A) ≥ a i = a ij . Por outro lado, a ij =max 1≤k≤m a kj = a j . Como 

v c (A) =min 1≤l≤n a l , segue-se que v c (A) ≤ a j = a ij . Combinando 

estas duas desigualdades, concluímos que v c (A) ≤ a ij ≤ v l (A). Mas, 

pelo teorema anterior, v c (A) ≥ v l (A) e, sendo assim, v c (A) =v l (A). 

(⇐) Como v l (A) = max 1≤r≤m a r , existe uma linha i tal que 

v l (A) =a i . Como, por sua vez, a i =min 1≤s≤n a is ,existeumacoluna 

l tal que a i = a il . Assim, v l (A) =a i = a il . Analogamente, como


v c (A) =min 1≤s≤n a s , existe uma coluna j tal que v c (A) =a j . Como, 

por sua vez, a j =max 1≤r≤m a rj , existe uma linha k tal que a j = a kj . 

Assim, v c (A) =a j = a kj . Uma vez que, por hipótese, v l (A) =v c (A), 

temos que 

a il = a i = v l (A) =v c (A) =a j = a kj . 

Afirmamos que a ij é um ponto de sela da matriz A. Com efeito, a ij ≤ 

a j = a i ≤ a is ,paratodos =1,...,n,istoé, a ij éomínimo de sua 

linha. Por outro lado, a ij ≥ a i = a j ≥ a rj ,paratodor =1,...,m, 

isto é, a ij éomáximo de sua coluna. Portanto, a ij éumpontode 

sela da matriz A. 

Corolário 4.2 Um jogo de dois jogadores com soma constante 

definido pela matriz de payoffs A do jogador linha tem um 

equilíbrio de Nash em estratégias puras se, e somente se, 

v l (A) =v c (A). 

Exemplo 4.6 Considere o jogo de soma zero cujos payoffs do jogador 

linha são dados pela matriz A abaixo. 

mínimo das linhas 

⎡ 

3 1 1 

⎤ 

0 0 

0 1 2 0 0 

A = ⎢ 

⎥ 

⎣1 0 2 1⎦ 

0 

3 1 2 2 1 

máximo das colunas 3 1 2 2 

Como v l (A) =máximo dos mínimos das linhas = 1 = v c (A) =mínimo 

dos máximos das colunas, segue-se que o jogo possui um equilíbrio 

de Nash em estratégias puras. De fato, a 42 é um ponto de sela da 

matriz A.


Exemplo 4.7 Considere o jogo de soma zero cujos payoffs do jogador 

linha são dados pela matriz A abaixo. 

mínimo das linhas 

⎡ 

3 2 1 

⎤ 

0 0 

0 1 2 0 0 

A = ⎢ 

⎥ 

⎣1 0 2 1⎦ 

0 

3 1 2 2 1 

máximo das colunas 3 2 2 2 

Como v l (A) =máximo dos mínimos das linhas = 1 < 2=v c (A) = 

mínimo dos máximos das colunas, segue-se que o jogo não possui um 

equilíbrio de Nash em estratégias puras. 

4.3.3 Equilíbrio de Nash em estratégias mistas 

Defina 

v l (A) = max min p T Aq e v c (A) = min max p T Aq. 

q∈Δ n p∈Δ m 

p∈Δ m 

q∈Δ n 

Teorema 4.5 Para toda matriz A, tem-sev c (A) ≥ v l (A). 

Demonstração: Temos que para todo p ∈ Δ m , 

p T Aq ≥ min 

y∈Δ n 

p T Ay. 

Assim, 

max p T Aq ≥ max min p T Ay = v l (A). 

p∈Δ m p∈Δ m y∈Δ n 

Conseqüentemente, 

v c (A) = min max p T Aq ≥ max min p T Ay = v l (A). 

p∈Δ m y∈Δ n 

q∈Δ n 

p∈Δ m 

Opróximo teorema caracteriza a existência de equilíbrios de Nash 

em estratégias mistas em termos das funções v l e v c .


Teorema 4.6 Um perfil de estratégias mistas (p ∗ , q ∗ )éum 

equilíbrio de Nash de um jogo de dois jogadores com soma constante 

definido pela matriz de payoffs A do jogador linha se, e 

somente se, 

v l (A) =v c (A) =p ∗T Aq ∗ . 


(⇒) Se(p ∗ , q ∗ )é um equilíbrio de Nash, então 

p ∗T Aq ∗ = u l (p ∗ , q ∗ ) ≥ u l (p, q ∗ )=p T Aq ∗ , 

para todo p ∈ Δ m .Emparticular, 

p ∗T Aq ∗ =max 

p∈Δ m 

p T Aq ∗ ≥ min 

Vale também que 

y∈Δ n 

max p T Ay = v c (A). 

p∈Δ m 

p ∗T Aq ∗ = c − u c (p ∗ , q ∗ ) ≤ c − u c (p ∗ , q) =p ∗T Aq, 

para todo q ∈ Δ n .Emparticular, 

p ∗T Aq ∗ =min 

q∈Δ n 

p ∗T Aq ≤ max 

x∈Δ m 

min x T Aq = v l (A). 

q∈Δ n 

Desta maneira, v l (A) ≥ v c (A). Como, pelo teorema anterior, v l (A) ≤ 

v c (A), concluímos que v l (A) =v c (A). 

(⇐) Comov l (A) =max p∈Δm min q∈Δn p T Aq, existep ∗ ∈ Δ m tal 

que 

v l (A) = minp ∗T Aq. 

q∈Δ n 

Analogamente, como v c (A) =min q∈Δn max p∈Δm p T Aq, existeq ∗ ∈ 

Δ m tal 

v c (A) = maxp T Aq ∗ . 

p∈Δ m 

Uma vez que, por hipótese, v l (A) =v c (A), temos que 

min 

q∈Δ n 

p ∗T Aq = v l (A) =v c (A) = max 

p∈Δ m 

p T Aq ∗ .


Afirmamos que (p ∗ , q ∗ )é um equilíbrio de Nash do jogo. Com efeito, 

u l (p ∗ , q ∗ )=p ∗T Aq ∗ ≥ min 

q∈Δ n 

p ∗T Aq = 

para todo x ∈ Δ m . Por outro lado, 

max 

p∈Δ m 

p T Aq ∗ ≥ x T Aq ∗ = u l (x, q ∗ ), 

u c (p ∗ , q ∗ )=c − p ∗T Aq ∗ ≥ c − max p T Aq ∗ = 

p∈Δ m 

c − min p ∗T Aq ≥ c − p ∗T Ay = u c (p ∗ , y), 

q∈Δ n 

para todo y ∈ Δ n . Desta maneira, (p ∗ , q ∗ )é um equilíbrio de Nash 

do jogo. 

4.3.4 O teorema minimax de von Neumann 

Opróximo teorema estabelece que, para jogos de dois jogadores 

com soma zero, v l (A) =v c (A) sempre. Sendo assim, pelo teorema 4.6, 

segue-se que, para esta classe de jogos, sempre existe pelo menos um 

equilíbrio de Nash em estratégias mistas. 

Teorema 4.7 (minimax de von Neumann) Para todo jogo 

de soma zero com dois jogadores, representado pela matriz 

de payoffs A do jogador linha, sempre existe um perfil de estratégias 

mistas (p ∗ , q ∗ ) ∈ Δ m × Δ n satisfazendo 

v l (A) = max min p T Aq 

q∈Δ n 

p∈Δ m 

= 

p ∗T Aq ∗ 

= 

min max p T Aq = v c (A). 

p∈Δ m 

q∈Δ n 

Em particular, (p ∗ , q ∗ )é um equilíbrio de Nash do jogo.


Daremos uma demonstração deste teorema minimax de von Neumann 

usando o teorema de dualidade da teoria de programação linear. 

Lembramos que um problema de programação linear éumproblema 

de otimização com função objetivo e restrições lineares: 

(problema primal) 

maximizar b T y 

sujeito a Ay ≤ c, 

y ≥ 0, 

onde as desigualdades devem ser interpretadas componente a componente. 

A cada problema de programação linear (problema primal) 

podemos associar um outro problema de otimização (problema dual): 

(problema dual) 

minimizar c T x 

sujeito a x T A ≥ b T , 

x ≥ 0. 

Teorema 4.8 (da dualidade em programação linear) 

(a) O problema primal possui uma solução se, e somente se, o 

problema dual possui uma solução. 

(b) Se y ∗ ésolução do problema primal e x ∗ ésolução do problema 

dual, então c T x ∗ = b T y ∗ . 

Uma demonstração do teorema de dualidade pode ser encontrada 

em [14, 52]. 

Demonstração do teorema minimax: sem perda de generalidade, 

podemos assumir que todas as entradas da matriz de payoffs A do jogador 

linha são positivas. Caso contrário, basta substituir A por Ã = 

A + D e B = −A por ˜B = −D + B, onde D = d 1 ,comd> 

max 1≤i≤m,1≤j≤n |a ij |.ObservequeÃ + ˜B = 0 (isto é, o jogo definido 

pelas matrizes Ã e ˜B tem soma zero) e que (p ∗ , q ∗ )é um equilíbrio


de Nash para o jogo definido pela matriz A se, e somente se, (p ∗ , q ∗ ) 

é um equilíbrio de Nash para o jogo definido pela matriz Ã. 

Sejam c =(1, 1,...,1) T e b =(1, 1,...,1) T . Considere os problemas 

de programação linear: 




y ≥ 0, 



sujeito a x T A ≥ b T , 

x ≥ 0. 

Passo 1: o problema dual possui uma solução. 

Como A>0, o conjunto admissível 

X = {x ∈ R m | x T A ≥ b T e x ≥ 0} 

énão vazio. Por outro lado, como c =(1, 1,...,1) T , a função objetivo 

do problema éescritacomox =(x 1 ,x 2 ,...,x m ) ↦→ c T x = 

x 1 + x 2 + ···+ x m . Assim, o problema dual consiste em encontrar o 

pontodoconjuntoX mais próximo da origem segundo a norma da 

soma || · || 1 , um problema que certamente possui uma solução pois, 

se p ∈ X, então podemos “compactificar” o conjunto admissível incluindo 

a restrição ||x|| 1 ≤||p|| 1 e, com isso, podemos usar o teorema 

de Weierstrass para garantir a existência de um mínimo. 

Passo 2: construção do equilíbrio de Nash. 

Dado que o problema dual possui uma solução, pelo teorema de 

dualidade, o problema primal também possui. Mais ainda: se x ∗ é 

solução do problema dual e y ∗ ésolução do problema primal, então 

c T x ∗ =(x ∗ ) T Ay ∗ = b T y ∗ . 

Seja θ = c T x ∗ = b T y ∗ (que é > 0pois(0, 0,...,0) não éadmissível) 

e defina 

p ∗ = x∗ 

θ 

e 

q ∗ = y∗ 

θ .


Afirmamos que (p ∗ , q ∗ )é um equilíbrio de Nash do jogo. Com efeito: 

claramente p ∗ ∈ Δ m e q ∗ ∈ Δ n ,poisp ∗ ≥ 0 (já quex ∗ ≥ 0 e θ>0), 

q ∗ ≥ 0 (já quey ∗ ≥ 0 e θ>0), 

e 

m∑ m∑ 

p i = 

i=1 

m∑ 

q j = 

j=1 

i=1 

n∑ 

j=1 

x ∗ i 

θ = cT x ∗ 

= θ θ θ =1 

yj 

∗ 

θ = bT y ∗ 

= θ θ θ =1. 

Agora, como x ∗T A ≥ b T , temos que para todo q ∈ Δ n , x ∗T Aq ≥ 

b T q = ∑ n 

j=1 q j =1. Masp ∗ = x ∗ /θ. Desta maneira, p ∗T Aq ≥ θ = 

p ∗T Aq ∗ ,paratodoq ∈ Δ n .Conseqüentemente, 

u c (p ∗ , q ∗ )=−p ∗T Aq ∗ ≥−p ∗T Aq = u c (p ∗ , q) 

para todo q ∈ Δ n . Mostramos então que o jogador coluna não pode 

aumentar o seu payoff esperado trocando q ∗ por q, se o jogador linha 

mantiver a escolha p ∗ . Analogamente, como Ay ≤ c, temos que 

para todo p ∈ Δ m , p T Ay ∗ ≤ p T c = ∑ m 

i=1 p i = 1. Mas y ∗ = 

q ∗ /θ. Desta maneira, p ∗ Aq ∗ ≤ θ = p ∗T Aq ∗ ,paratodop ∈ Δ m . 


u l (p ∗ , q ∗ )=p ∗T Aq ∗ ≥ p T Aq ∗ = u l (p, q ∗ ), 

para todo p ∈ Δ m . Mostramos então que o jogador linha não pode 

aumentar o seu payoff esperado trocando p ∗ por p, se o jogador coluna 

mantiver a escolha q ∗ .Concluímos, portanto, que (p ∗ , q ∗ )éum 

equilíbrio de Nash do jogo. 

Além de estabelecer a existência de equilíbrios de Nash, a demonstração 

que demos sugere uma maneira de calculá-los: resolvendo-se 

dois problemas de programação linear. 

Exemplo 4.8 O governo deseja vacinar seus cidadãos contra um 

certo vírus da gripe. Este vírus possui dois sorotipos, sendo que é 

desconhecida a proporção na qual os dois sorotipos ocorrem na população 

do vírus. Foram desenvolvidas duas vacinas onde a eficácia


da vacina 1 é de 85% contra o sorotipo 1 e de 70% contra o sorotipo 

2. A eficácia da vacina 2 é de 60% contra o sorotipo 1 e de 90% 

contra o sorotipo 2. Qual política de vacinação deveria ser tomada 

pelo governo? 

Esta situação pode ser modelada como um jogo de soma zero 

com dois jogadores, onde o jogador linha L (o governo) deseja obter 

a maior compensação (a fração dos cidadãos resistentes ao vírus) o 

maior possível e o jogador coluna C (o vírus) deseja obter a maior 

compensação a menor possível. A matriz de payoffs é a seguinte: 

vírus 

sorotipo 1 sorotipo 2 

governo 

vacina 1 (85/100, −85/100) (70/100, −70/100) 

vacina 2 (60/100, −60/100) (90/100, −90/100) 

Para encontrar um equilíbrio de Nash, devemos resolver os seguintes 

problemas de programação linear 


maximizar [ y 1 + ][ y 2 ] [ 85/100 70/100 y1 1 

sujeito a 

≤ 

60/100 90/100 [ y 2 ] [ 1 

y1 0 

≥ 

y 2 0 

] 

, 

] 

, 


minimizar x 1 + x 2 

[ ] [ ] 

85/100 70/100 

sujeito a x1 x 2 ≥ [ 1 1 ] , 

60/100 90/100 [ ] [ ] 

x1 0 

≥ , 

x 2 0 

isto é,



maximizar y 1 + y 2 

sujeito a 17y 1 +14y 2 ≤ 20, 

6y 1 + 9y 2 ≤ 10, 

y 1 ≥ 0, 

y 2 ≥ 0, 



sujeito a 7x 1 +12x 2 ≥ 20, 

7x 1 + 9x 2 ≥ 10, 

x 1 ≥ 0, 

x 2 ≥ 0. 

Asolução do problema dual é x ∗ =(20/23, 10/23) (Figura 4.7) e a 

solução do problema primal é y ∗ =(40/69, 50/69), com 

θ = x ∗ 1 + x ∗ 2 = y1 ∗ + y2 ∗ = 30 

23 . 

Desta maneira, o único equilíbrio de Nash para o problema édado 

pelo ponto (p ∗ , q ∗ ), onde 

( 

p ∗ = x∗ 2 

θ = 3 , 1 ) 

3 

e 

( 

q ∗ = y∗ 4 

θ = 9 , 5 ) 

. 

9 

O teorema minimax de von Neumann garante que, para jogos de 

soma zero, existem estratégias mistas p ∗ e q ∗ tais que: 

(a) Se o jogador linha jogar com p ∗ , então o seu ganho esperado 

nunca émenordoquev ∗ = p ∗T Aq ∗ , independentemente da escolha 

do jogador coluna. 

(b) Se o jogador coluna jogar com q ∗ ,entãoasuaperda esperada 

nunca é maior do que v ∗ = p ∗T Aq ∗ , independentemente da escolha 

do jogador linha. 

Como efeito: como (p ∗ , q ∗ )é um equilíbrio de Nash em estratégias 

mistas, segue-se que v ∗ = u c (p ∗ , q ∗ ) ≥ u c (p ∗ , q), ∀q ∈ Δ n ,ev ∗ =


x 2 

0 20/23 30/23 

30/23 

10/23 

x 1 

Figura 4.7: Solução do problema dual. 

y 1 

30/23 

50/69 

0 40/69 30/23 

y 1 

Figura 4.8: Solução do problema primal.


u l (p ∗ , q ∗ ) ≥ u c (p, q), ∀p ∈ Δ m .Masu c (p, q) =−p T Aq e u l (p, q) = 

+p T Aq. Assim, 

∀q ∈ Δ n ,v ∗ = u c (p ∗ , q ∗ ) ≥ u c (p ∗ , q) 

⇓ 

∀q ∈ Δ n , p ∗T Aq ≥ p ∗T Aq ∗ = v ∗ (4.3) 

⇓ 

O ganho esperado do jogador linha nunca émenor 

do que v ∗ se ele jogar com p ∗ , independentemente 

da escolha q do jogador coluna. 

e, analogamente, 

∀p ∈ Δ m ,v ∗ = u l (p ∗ , q ∗ ) ≥ u l (p, q ∗ ) 

⇓ 

∀p ∈ Δ m , pAq ∗ ≤ p ∗T Aq ∗ = v ∗ (4.4) 

⇓ 

A perda esperada do jogador coluna nunca é maior 

do que v ∗ se ele jogar com q ∗ , independentemente 

da escolha p do jogador linha. 

Mais ainda: se (p ∗ ,q ∗ )é um equilíbrio de Nash do jogo, então 

n∑ 

a ij · qj ∗ = v∗ , para todo i tal que p ∗ i > 0 e (4.5) 

j=1 

m∑ 

p ∗ i · a ij = v ∗ , para todo j tal que qj ∗ > 0. (4.6) 

i=1 

De fato: suponha, por absurdo, que exista algum índice k tal que 

p ∗ k > 0e∑ n 

j=1 a kj · qj ∗ ≠ v ∗ . Usando as desigualdades 4.4 com 

p = e i , sabemos que ∑ n 

j=1 a ij ·qj ∗ ≤ v∗ para todo i =1,...,m. Logo, 

se ∑ n 

j=1 a kj · qj ∗ ≠ v∗ ,então ∑ n 

j=1 a kj · qj ∗

[SEC. 4.4: 

EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE101 

oqueéumacontradição. Um argumento análogo pode ser usado 

para provar 4.6. Note que 4.5 e 4.6 nada mais são do que as condições 

estabelecidas no Corolário 4.1 na página 80 para o caso particular de 

jogos de soma zero. 

4.4 Equilíbrio de Nash via um problema 

de complementaridade 

4.4.1 Jogos bimatriciais 

Sejam u 1 (p, q) =p T Aq e u 2 (p, q) =p T Bq são, respectivamente, 

as funções utilidade dos jogadores 1 e 2. Sem perda de generalidade, 

podemos assumir que A>0 e B > 0 pois, caso contrário, basta 

substituir A por A + c 1 e B por B + c 1 para alguma constante 

c>0 suficientemente grande. Observe agora que (p ∗ , q ∗ ) ∈ Δ= 

Δ m × Δ n é um equilíbrio de Nash em estratégias mistas do jogo se, 

esomentese,p ∗ e q ∗ satisfazem os seguintes programas lineares, um 

dependendo do outro: 

maximizar (Aq ∗ ) T p 

sujeito a ½ T mp =1, 

p ≥ 0, 

maximizar (B T p ∗ ) T q 

sujeito a ½ T n q =1, 

q ≥ 0, 

onde ½ m e ½ n são, respectivamente, matrizes de tamanho m×1en×1 

com todas as entradas iguais a 1. Os problemas duais destes dois PLs 

são dados por: 

minimizar λ 

sujeito a ½ m λ ≥ Aq ∗ , 

minimizar μ 

sujeito a ½ n μ ≥ B T p ∗ . 

Se λ ∗ é a solução ótima do primeiro problema dual, então pelo teorema 

forte da dualidade, vale que (Aq ∗ ) T p ∗ = λ ∗ .Mas(Aq ∗ ) T p ∗ = 

q ∗T A T p ∗ = p ∗T Aq ∗ e λ ∗ =(p ∗ ½ m )λ ∗ . Assim, p ∗T Aq ∗ =(p ∗ ½ m )λ ∗ 

ou, equivalentemente, 

p ∗T (½ m λ ∗ − Aq ∗ )=0. (4.7)


Esta condição diz que p ∗ e ½ m λ ∗ −Aq ∗ são ortogonais. Dado que estes 

vetores são não-negativos, eles têm que ser complementares, no sentido 

que eles não podem ter componentes positivas na mesma posição. 

Esta caracterização de um par primal-dual ótimo é conhecida como 

folgas complementares em programação linear. Dado que p ∗ éuma 

distribuição de probabilidades, pelo menos uma de suas componentes 

é positiva, de modo que a respectiva componente de ½ m λ ∗ − Aq ∗ 

é zero e λ ∗ é a maior das entradas de Aq ∗ . Qualquer estratégia 

pura i do jogador 1 é uma melhor resposta a q ∗ se, e somente se, 

a i-ésima componente de ½ m λ ∗ − Aq ∗ é igual a zero. Desta forma, 

aEquação 4.7 obtém o Corolário 4.1 na página 80: uma estratégia 

mista p ∗ é uma melhor resposta para q ∗ se, e somente se, ela dá probabilidade 

positiva apenas para as estratégias puras que são melhores 

respostas para q ∗ . Analogamente, se μ ∗ é a solução ótima do segundo 

problema dual, então 

q ∗T (½ n μ ∗ − B T p ∗ )=0. (4.8) 

Teorema 4.9 O perfil de estratégias mistas (p ∗ , q ∗ ) é um 

equilíbrio de Nash se, e somente se, existem números reais λ ∗ 

e μ ∗ tais que 

½ T mp ∗ = 1, 

½ T n q∗ = 1, 

½ m λ ∗ − Aq ∗ ≥ 0, 

½ n μ ∗ − B T p ∗ ≥ 0, 

p ∗ , q ∗ ≥ 0, 

(4.9) 

easEquações 4.7 e 4.7 sejam satisfeitas. 

Dado um vetor t ∈ R n e uma matriz M de tamanho n × n, o 

problema de complementaridade linear (PCL)associadoaopar(t,M) 

consiste em encontrar z, w ∈ R n tais que 

w + Mz = t, w ≥ 0, z ≥ 0 e z T w = 0. 

Veremos agora como caracterizar os equilíbrios de Nash em estratégias 

mistas de jogos bimatriciais (jogos finitos com apenas dois

[SEC. 4.4: 

EQUILÍBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE103 

jogadores) através de um problema de complementaridade linear. 

Se (p ∗ , q ∗ )é um equilíbrio de Nash do jogo, então 

u 1 (p ∗ , q ∗ )=p ∗T Aq ∗ ≥ p T Aq ∗ = u 1 (p, q ∗ ), ∀p ∈ Δ m . 

Mas, por linearidade, p ∗T Aq ∗ ≥ p T Aq ∗ para todo p ∈ Δ m se, e 

somente se, p ∗T Aq ∗ ≥ e T i Aq∗ , ∀i = 1,...,m, onde e i representa 

o i-ésimo vetor da base canônica. Mas, então, 

(p ∗T Aq ∗ )½ m ≥ (e T i Aq ∗ )½ m = ½ m (e T i Aq ∗ )=(½ m e T i )(Aq ∗ )=Aq ∗ . 

Analogamente, como 

u 2 (p ∗ , q ∗ )=p ∗T Bq ∗ ≥ p ∗T Bq = u 2 (p ∗ , q), ∀q ∈ Δ n , 

= e T j BT p ∗ , ∀j =1,...,n e, por- 

segue-se que p ∗T Bq ∗ ≥ p ∗T Be j 

tanto, 

(p ∗T Bq ∗ )½ n ≥ (e T j BT p ∗ )½ m = 

½ m (e T j BT p ∗ )=(½ m e T j )(BT p ∗ )=B T p ∗ . 

Desta maneira, (p ∗ , q ∗ )é um equilíbrio de Nash se, e somente se, 

(p ∗T Aq ∗ )½ m ≥ Aq ∗ e (p ∗T Bq ∗ )½ n ≥ B T p ∗ . (4.10) 

Como A e B possuem todas as entradas positivas, segue-se que os 

números p ∗T Aq ∗ e p ∗T Bq ∗ são positivos. Sejam então 

x ∗ = 

p ∗ 

p ∗T Bq ∗ e y ∗ q ∗ 

= 

p ∗T Aq ∗ . 

Introduzindoas variáveis de folga w ∗ =(u ∗ , v ∗ ), vemos que se (p ∗ , q ∗ ) 

é um equilíbrio de Nash, então z ∗ =(x ∗ , y ∗ )ew ∗ constituem uma 

solução do problema de complementaridade linear 

w + Mz = t, w ≥ 0, z ≥ 0 e z T w = 0, 

onde 

t = 

[ 

½m 

½ n 

] 

e M = 

[ 0 A 

B T 0 

] 

.


Reciprocamente, se z ∗ =(x ∗ , y ∗ )ew ∗ =(u ∗ , v ∗ )constituemuma 

solução do problema de complementaridade linear acima, então 

p ∗ = 

x∗ 

½ T e q ∗ = y∗ 

m x∗ ½ T n y∗ 

constituem um equilíbrio de Nash do jogo bimatricial. 

Além de programação linear, programação quadrática e teoria dos 

jogos, aplicações do problema de complementaridade linear incluem 

o estudo de modelos financeiros, a análise não-linear de certas estruturas 

elasto-plásticas e muitas outras áreas ([64]). 

4.4.2 O algoritmo de Lemke-Howson 

Um dos métodos mais importantes para se encontrar uma solução 

de um PCL é o algoritmo de Lemke-Howson. Ele foi apresentado no 

artigo [49] em 1964. Muito mais do que um método de cálculo de 

equilíbrios de jogos bimatriciais, o algoritmo de Lemke-Howson dá 

uma prova algébrica construtiva para a existência de equilíbrios, além 

de estabelecer que, genericamente, o número de equilíbrios de Nash é 

finito e ímpar. Sendo similar ao algoritmo Simplex para programação 

linear, sua complexidade é exponencial ([84]). Além do artigo original, 

o leitor interessado em mais detalhes do algoritmo pode consultar 

a referência [87]. 

4.5 Gambit 

Desenvolvido por Richard D. McKelvey (California Institute of 

Technology), Andrew M. McLennan (University of Minnesota) e Theodore 

L. Turocy (Texas A&M University), Gambit é um programa de 

computador, gratuito e multiplataforma, orientado para a construção 

eanálise de jogos finitos. Ele oferece uma interface gráfica intuitiva 

para o cálculo de equilíbrios de Nash e a análise das estruturas de 

dominância das estratégias do jogo. Para baixá-lo, acesse o endereço: 

http://econweb.tamu.edu/gambit.

[SEC. 4.5: GAMBIT 105 

Figura 4.9: Gambit eliminando as estratégias fracamente dominadas 

do Jogo da Segunda Gerra Mundial descrito no 

Exercício 6 na página 54.


Observação. A equipe do Gambit recentemente desenvolveu uma 

versão on-line do software que está disponível no endereço: http: 

//gte.csc.liv.ac.uk/gte/builder/ (é preciso habilitar o uso de 

janelas pop-up). 


[01] Calcule os pontos de sela da matriz 

⎡ 

A = 

⎢ 

⎣ 

24 23 22 25 

10 22 20 19 

27 25 22 23 

20 28 16 15 

⎤ 

⎥ 

⎦ . 

[02] Como no Exemplo 4.8, escreva os problemas primal e dual do 

jogo de comparar moedas (Exemplo 2.6, página 22). Resolva 

estes problemas de otimização para encontrar o equilíbrio de 

Nash em estratégias mistas do jogo. 

[03] Mostre como encontrar pelo menos um equilíbrio de Nash de 

um jogo de soma zero 2 × 2geral. 

[04] Encontre pelo menos um equilíbrio de Nash em estratégias mistas 

do jogo de soma zero definido pela matriz 

[ ] 

−1 +5 +1 −2 

A = 

. 

+1 −3 −2 +5 

[05] Sejam p ∗ ∈ Δ m e q ∗ ∈ Δ n duas estratégias mistas de um jogo 

de soma zero com dois jogadores. Mostre que se o mínimo dos 

ganhos médios do jogador linha usando p ∗ é igual ao máximo 

das perdas médias do jogador coluna usando q ∗ ,istoé, se 

min u l(p ∗ , e l )= max (−u c(e k , q ∗ )), 

1≤l≤n 1≤k≤m 

então (p ∗ , q ∗ )é um equilíbrio de Nash do jogo. Aqui e k representa 

o k-ésimo vetor da base canônica de R m e e l o l- 

ésimo vetor da base canônica de R n . Use este resultado para


mostrar que as estratégias mistas p ∗ =(6/37, 20/37, 0, 11/37) 

e q ∗ = (14/37, 4/37, 0, 19/37, 0) constituem um equilíbrio de 

Nash do jogo de soma zero definido pela matriz 

⎡ 

⎤ 

5 8 3 1 6 

A = ⎢ 4 2 6 3 5 

⎥ 

⎣ 2 4 6 4 1 ⎦ . 

1 3 2 5 3 

[06] (Jogos de quadrados mágicos) Um quadrado mágico éuma 

matriz quadrada n × n cujas entradas são constituídas pelos 

números 1, 2,...,n 2 , arranjados de tal forma que a soma das 

n entradas em qualquer linha, coluna ou diagonal principal é 

sempre o mesmo número. Mostre como encontrar pelo menos 

um equilíbrio de Nash em estratégias mistas de um jogo de soma 

zero cuja matriz é um quadrado mágico. Aplique a técnica para 

amatriz 

⎡ 

A = ⎢ 

⎣ 

16 3 2 13 

5 10 11 8 

9 6 7 12 

4 15 14 1 

⎤ 

⎥ 

⎦ . 

Este quadrado mágico aparece na gravura Melencolia I de Albrecht 

Dürer: 

http://en.wikipedia.org/wiki/Melancholia_I. 

[07] Considere um jogo de soma zero definido por uma matriz A 

inversível que possui um equilíbrio de Nash (p ∗ , q ∗ ) totalmente 

misto (isto é, 0

Capítulo 5 

Jogos na forma extensa 

A forma normal de um jogo é usada em situações onde os jogadores 

escolhem sua estratégia simultaneamente ou o fazem sem conhecer 

aestratégia dos outros jogadores. Contudo, existem situações em que 

os jogadores tomam suas decisões de forma seqüencial, depois de observar 

a ação que um outro jogador realizou. A forma extensa tem 

uma estrutura mais adequada para analisar jogos desta natureza, especificando 

assim quem se move, quando, com qual informação e o 

ganho de cada jogador. Ela contém toda informação sobre um jogo. 

Existem várias formas de se representar um jogo da forma extensa, todas 

elas tentando formalizar a ideia de árvore. Entre elas: (1) relações 

de ordem, (2) teoria de grafos ([41]) e (3) alfabetos ([27]). Nossa abordagem 

aqui será mais informal. Trataremos dos jogos seqüencias de 

informação perfeita: os ganhos são de conhecimento comum de todos 

os jogadores, um único jogador faz um movimento por vez e cada 

jogador conhece as escolhas dos jogadores que o antecederam toda 

vez que for jogar. 

5.1 Definição 

Um jogo na forma extensa (também denominado jogo seqüencial) 

é aquele em que os jogadores realizam seus movimentos em uma ordem 

predeterminada. Por este motivo, uma maneira muito adequada 

108

[SEC. 5.1: DEFINIÇÃO 109 

de se representar um jogo na forma extensa éatravés de uma árvore. 

Por exemplo, na Figura 5.1, o jogador 1 joga primeiro: ele pode escolher 

entre as ações a e b. Depois,é a vez do jogador 2 jogar. Se 1 

jogou a, então 2 pode escolher entre c ou d e, se 1 jogou b,então 2 pode 

escolher entre e e f. Depois que todos jogadores realizaram (seqüencialmente) 

suas ações, cada jogador recebe o seu ganho. A convenção 

équeaprimeiracoordenadadovetordepayoffs represente o ganho 

de quem jogou em primeiro lugar, a segunda coordenada represente 

o ganho de quem jogou em segundo lugar, e assim por diante. 

1 

a 

2 

c 

d 

( 2, 4) 

( 1, 0) 

b 

2 

e 

f 

( 6,12) 

( 9, {1) 

Figura 5.1: Um jogo na forma extensa. 

Uma árvore é composta por nós e ramos. Os ramos representam 

as ações dos jogadores. No jogo da Figura 5.1 existem 6 ramos: a, b, 

c, d, e e f. Alguns são do jogador 1 (a e b), enquanto que outros são 

do jogador 2 (c, d, e e f). Os nós são de dois tipos: existem aqueles 

que emanam ramos e existem aqueles que não. Estes últimos são as 

folhas da árvore e neles estão os valores dos payoffs dos jogadores. 

Um nó que não é uma folha identifica o jogador que deve escolher 

uma das ações representadas pelos ramos que saem do nó. Nós que 

não são folhas são denominados nós de decisão. Por exemplo, no 

primeiro nó (também denominado raiz da árvore) o jogador 1 que 

deve fazer a sua escolha entre os ramos (ações) a e b. 

Uma estratégia de um jogador é um plano de ação completo que 

especifica uma ação factível deste jogador em cada nó de decisão 

em que o jogador pode atuar. No jogo da Figura 5.1, o jogador 1 

temapenasumnó de decisão. Por este motivo, suas estratégias se

110 [CAP. 5: JOGOS NA FORMA EXTENSA 

confundem com suas ações: 

S 1 = {a, b}. 

Por outro lado, o jogador 2 tem dois nós de decisão: um que se segue 

depois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b. 

Por este motivo, cada estratégia do jogador 2 deve conter duas ações: 

uma para o primeiro nó e a outra para o outro nó. Assim, uma 

estratégia possível para o jogador 2 é “jogar c se o jogador 1 jogar a 

e jogar f se o jogador 1 jogar b”. Outra é “jogar c se o jogador 1 

jogar a e jogar e se o jogador 1 jogar b”. Escrevendo apenas as ações 

que o jogador 2 pode tomar em cada nó de decisão, o conjunto de 

suas estratégias pode ser então representado da seguinte maneira: 

S 2 = {(c, e), (c, f), (d, e), (d, f)}. 

É muito importante notar a diferença entre ações e estratégias. Neste 

contexto, (c, e) éumaestratégia do jogador 2, enquanto que c e e são 

ações (uma para cada nó de decisão do jogador). Uma ação éum 

conceito local: ela representa o comportamento do jogador em um 

momento particular do jogo, isto é, em um nó de decisão. Uma 

estratégia é um conceito global: ela especifica o comportamento do 

jogador no jogo inteiro, isto é, em todos os nós de decisão do jogador. 

Mais exemplos: no jogo da Figura 5.2, 

S 1 = {a, b}, 

S 2 = {(c, e), (c, f), (c, g), (d, e), (d, f), (d, g)} 

e, no jogo da Figura 5.3, 

S 1 = {(a, l, p), (a, l, q), (a, m, p), (a, m, q), 

(b, l, p), (b, l, q), (b, m, p), (b, m, q)} 

e 

S 2 = {(c, e), (c, f), (d, e), (d, f)}. 

5.2 Equilíbrio de Nash 

A definição de equilíbrio de Nash para jogos seqüenciais éamesma 

dada para jogos na forma normal: se S i é o conjunto de estratégias

[SEC. 5.2: EQUILÍBRIO DE NASH 111 

1 

a 

2 

c 

d 

( 2, 4) 

( 1, 0) 

b 

2 

e 

f 

g 

( 6,12) 

( 9, {1) 

( 8, 9) 

Figura 5.2: Um jogo na forma extensa. 

a 

2 c 

d 

¯ 

( 2, 4) 

( 1,10) 

1 

® 

b 

2 

e 

1 l 

± 

m 

( 2, 3) 

( 1, 4) 

° 

f 

1 p 

q 

² 

( 5, 0) 

( 5, 4) 

Figura 5.3: Um jogo na forma extensa.


do jogador i, 1≤ i ≤ n, então um perfil de estratégias 

s ∗ =(s ∗ 1,...,s ∗ i ,...,s ∗ n) ∈ S 1 ×···×S i ×···×S n 

éumequilíbrio de Nash (em estratégias puras) se 

u i (s ∗ i , s∗ −i ) ≥ u i(s iji , s ∗ −i ) 

para todo i =1,...,n eparatodoj i =1,...,m i ,comm i onúmero 

de estratégias do jogador i. A caracterização via funções de melhor 

resposta também pode ser usada: s ∗ =(s ∗ 1,...,s ∗ i ,...,s∗ n) ∈ S éum 

equilíbrio de Nash em estratégias se, e somente se, s ∗ i ∈ MR i (s ∗ −i ) 

para todo i =1,...,n, onde MR i (s −i ) = argmax si∈S i 

u i (s i , s −i ). 

No jogo da Figura 5.4, temos que 

S 1 = {a, b}, 

S 2 = {(c, e), (c, f), (d, e), (d, f)} 

Assim, existem 8 perfis de estratégias: 

S = S 1 × S 2 = {(a, (c, e)), (a, (c, f)), (a, (d, e)), (a, (d, f)), 

(b, (c, e)), (b, (c, f)), (b, (d, e)), (b, (d, f))}. 

1 

a 

2 

c 

d 

( 2, 4) 

( 1, 9) 

b 

2 

e 

f 

( 5, 0) 

( 5, 4) 

Figura 5.4: Calculando equilíbrios de Nash em um jogo seqüencial. 

Vamos mostrar que o perfil (a, (c, f)) não é um equilíbrio de Nash 

do jogo. Inicialmente, observe que, para calcular o ganho dos jogadores 

associado a um determinado perfil de estratégias, basta seguir

[SEC. 5.2: EQUILÍBRIO DE NASH 113 

o caminho de execução do jogo. Por exemplo, para o perfil de estratégia 

(a, (c, f)), a execução do jogo se dá da seguinte maneira: 

o jogador 1 escolhe a ação a e, em seguida, o jogador 2 escolhe a 

ação c, o que resulta no ganho 2 para o jogador 1 (Figura 5.5). Já, 

para o perfil de estratégia (b, (c, f)), o jogador 1 escolhe a ação a 

e o jogador 2 escolhe a ação f, dando o ganho 5 para o jogador 1 

(Figura 5.6). 

1 

a 

2 

c 

d 

( 2, 4) 

( 1, 9) 

b 

2 

e 

f 

( 5, 0) 

( 5, 4) 

Figura 5.5: Caminho de execução associado ao perfil de estratégias 

(a, (c, f)). 

1 

a 

2 

c 

d 

( 2, 4) 

( 1, 9) 

b 

2 

e 

f 

( 5, 0) 

( 5, 4) 

Figura 5.6: Caminho de execução associado ao perfil de estratégias 

(b, (c, f)). 

Desta maneira, se o jogador 2 mantiver a sua estratégia (c, f), o 

jogador 1 ganhará mais trocando sua estratégia a pela estratégia b: 

u 1 (a, (c, f)) = 2 < 5=u 1 (b, (c, f)).


O per- 

Isto mostra que (a, (c, f)) não é um equilíbrio de Nash. 

fil (b, (c, f)), por sua vez, é um equilíbrio de Nash, pois 

e 

u 1 (b, (c, f)) = 5 > 2=u 1 (a, (c, f)) 

u 2 (b, (c, f)) = 4 > 0=u 2 (b, (c, e)), 

u 2 (b, (c, f)) = 4 > 0=u 2 (b, (d, e)), 

u 2 (b, (c, f)) = 4 ≥ 4=u 2 (b, (d, f)). 

O jogo possui mais um equilíbrio de Nash: o perfil (b, (c, f)). 

5.3 Indução retroativa e equilíbrio perfeito 

em subjogos 

A indução retroativa é um processo que produz um perfil de estratégias 

com a propriedade de que se cada jogador seguir as recomendações 

de ações estabelecidas pelo perfil, então suas estratégias 

serão ótimas em cada nó de decisão onde o jogador pode atuar. 

O algoritmo é simples. Começando pelos nós de decisão finais, 

determinamos as melhores ações disponíveis para os jogadores que 

vão atuar nestes nós. Isto éfácil de se fazer, já que não existem 

outros nós de decisão que sucedem os nós em questão: basta, em 

cada nó de decisão final, escolher a ação que dê ao jogador do nó 

o maior payoff possível. Seexisteumempateentreduasações que 

levam ao maior payoff, escolhemos uma delas arbitrariamente. Feito 

isto, as ações escolhidas são marcadas e, as demais, ignoradas. Este 

processo agora é repetido para os penúltimos nós de decisão, para os 

antepenúltimos, etc., até quearaizdaárvore seja alcançada. 

Por exemplo, no jogo seqüencial da Figura 5.3, os últimos nós de 

decisão são β, δ e ɛ. Assim, no passo 1 da indução retroativa, o jogador 

2 marca a ação d no nó β e o jogador 1 marca as ações l e p nos 

nós δ e ɛ, respectivamente (Figura 5.7). No passo 2, o jogador 2 marca 

aação e no nó γ (Figura 5.8). Finalmente, no passo 3, o jogador 1 

marca a ação b (Figura 5.9). O perfil de estratégias obtido é 

((b, l, p), (d, e)).

[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 115 

a 

2 c 

d 

¯ 

( 2, 4) 

( 1,10) 

1 

® 

b 

2 

e 

1 l 

± 

m 

( 2, 3) 

( 1, 4) 

° 

f 

1 p 

q 

² 

( 5, 0) 

( 5, 4) 

Figura 5.7: Indução retroativa: passo 1. 

a 

2 c 

d 

¯ 

( 2, 4) 

( 1,10) 

1 

® 

b 

2 

e 

1 l 

± 

m 

( 2, 3) 

( 1, 4) 

° 

f 

1 p 

q 

² 

( 5, 0) 

( 5, 4) 

Figura 5.8: Indução retroativa: passo 2.


a 

2 

¯ 

c 

d 

( 2, 4) 

( 1,10) 

1 

® 

b 

2 

e 

1 

± 

l 

m 

( 2, 3) 

( 1, 4) 

° 

f 

1 

² 

p 

q 

( 5, 0) 

( 5, 4) 

Figura 5.9: Indução retroativa: passo 3. 

O processo de indução retroativa dá, portanto, um algoritmo para 

encontrar um equilíbrio de Nash em estratégias puras de um jogo 

seqüencial com informação perfeita. Note, contudo, que nem todo 

equilíbrio de Nash pode ser obtido por indução retroativa. O perfil 

de estratégias (b, d) do jogo da Figura 5.10 é um equilíbrio de Nash 

que não é obtido por indução retroativa. 

1 

a 

2 

c 

d 

( 2, 1) 

( 0, 0) 

b 

( 1, 2) 

Figura 5.10: (b, d) é um equilíbrio de Nash que não é obtido por 

indução retroativa. 

Seja α um dos nós de decisão de um jogo G. O subjogo que 

começa em α é o jogo obtido copiando-se todos os nós de decisão, 

ramos e payoffs do jogo original que sucedem α. Por exemplo, no 

jogo da Figura 5.3, o subjogo que começa nó de decisão γ, é o jogo

[SEC. 5.3: INDUÇÃO RETROATIVA E EQUILÍBRIO PERFEITO EM SUBJOGOS 117 

da Figura 5.11. 

2 

e 

1 l 

± 

m 

( 2, 3) 

( 1, 4) 

° 

f 

1 p 

² 

q 

( 5, 0) 

( 5, 4) 

Figura 5.11: Subjogo que começa no nó γ do jogo da Figura 5.3. 

Dizemos que um perfil de estratégias (puras) s ∗ éumequilíbrio 

perfeito em subjogos de um jogo seqüencial G se os respectivos subperfis 

de s ∗ são equilíbrios de Nash de cada subjogo de G. Como 

veremos, este equilíbrio idealizado por Reinhard Selten, tem forte conexão 

com o processo de indução retroativa. De fato: considere, por 

exemplo, o jogo da Figura 5.3. Se 

s ∗ =((a α ,a δ ,a ɛ ), (a β ,a γ )) 

é um equilíbrio perfeito em subjogos deste jogo, então (a δ )e(a ɛ ) 

devem ser equilíbrios de Nash dos subjogos que começam nos nós δ 

e ɛ, respectivamente. Mas, neste caso, a δ e a ɛ devem ser ações que 

maximizem o ganho do jogador 1 nestes nós. Sendo assim, concluímos 

que a δ = l e a ɛ = p ou a ɛ = q. Tomemos a ɛ = p. Do mesmo modo, 

como (a β ) deve ser um equilíbrio de Nash do subjogo que começa no 

nó β, vemos que o jogador 2 escolherá a β = d. Então, nesta primeira 

iteração, já podemos afirmar que 

s ∗ =((a α ,l,p), (d, a γ )). 

Agora, se a γ = e, o jogador 2 ganhará 3(já que o jogador 1 escolhe l 

neste caso) e, se a γ = f, o jogador 2 ganhará 0(já que o jogador 1 

escolhe p neste caso). Como (a γ , (l, p)) deve ser um equilíbrio de 

Nash do subjogo que começa no nó γ, segue-se que, obrigatoriamente, 

a γ = e. Assim, após a segunda iteração, vale que 

s ∗ =((a α ,l,p), (d, e)).


Como as ações nos nós β, γ, δ e ɛ já estão agora todas determinadas, 

éfácil de ver que se s ∗ =((a α ,l,p), (d, e)) é um equilíbrio de Nash do 

jogo original, então a α = b. Assim, o equilíbrio perfeito em subjogos é 

s ∗ =((b, l, p), (d, e)). 

Note que a imposição de que os respectivos subperfis de s ∗ sejam 

equilíbrios de Nash de cada subjogo de G induz a mesma seleção de 

ações que seria feita no processo de indução retroativa. Époreste 

motivo que os equilíbrios perfeitos em subjogos coincidem com os 

equilíbrios obtidos por indução retroativa. 

5.4 O teorema de Kuhn-Zermelo 

Teorema 5.1 (Kuhn-Zermelo) Todo jogo seqüencial de informação 

perfeita possui pelo menos um equilíbrio de Nash em 

estratégias puras. 

Idéiadaprova.Ademonstração é feita por indução. Se o jogo possui 

apenas um único nó de decisão, entãooteoremaé verdadeiro: o jogador 

que age neste nó escolhe uma ação que maximiza o seu payoff. 

Os outros jogadores, se existirem, tem espaços de estratégias vazios. 

Suponha então que todo jogo com menos do que m>1nós de decisão 

possua pelo menos um equilíbrio de Nash. Escolhendo um nó de 

decisão β que sucede imediatamente a raiz α da árvore do jogo, criaremos 

dois jogos. O primeiro é o subjogo G β que começa em β. Pela 

hipótese de indução, G β possui pelo menos um equilíbrio de Nash s ∗ β . 

O segundo jogo, G −β ,éconstruído da seguinte maneira: removemos 

de G o subjogo G β enó β, que antes era de decisão, criamos uma 

folha cujos payoffs são dados pelos payoffs associados ao equilíbrio s ∗ β 

de G β . Novamente, pela hipótese de indução, G −β possui pelo menos 

um equilíbrio de Nash s ∗ −β .Seaação em s∗ −β 

não usa o ramo a 

que liga α a β em G −β ,então s ∗ −β é um equilíbrio de Nash do jogo 

original G. Por outro lado, se s ∗ −β usaoramoa, então (a, s∗ β )éum 

equilíbrio de Nash do jogo original G.

não confiar 



[01] (Jogo da centopéia) Use indução retroativa para obter um 

equilíbrio de Nash do jogo seqüencial da figura abaixo. O 

equilíbrio é Pareto eficiente? 

1 Continuar 2 Continuar 1 Continuar 2 Continuar 

(64, 16) 

Parar 

Parar 

Parar 

Parar 

(4, 1) (2, 8) (16, 4) (8, 32) 

. 

Este jogo foi desenvolvido pelo economista Robert W. Rosenthal, 

mas o seu nome é devido a Kenneth Binmore. 

[02] (Jogo da confiança) Use indução retroativa para obter um 

equilíbrio de Nash do jogo seqüencial da figura abaixo. O equilíbrio 

é Pareto eficiente? 

1 

confiar 

2 

trair 

honrar 

({1, 2) 

(1,1) 

(0, 0) 

.

Capítulo 6 

Exemplos 

6.1 O jogo Le Her simplificado 

Nesta seção estudaremos a versão simplificada do jogo Le Her, 

como apresentada por Benjamim e Goldman em [05]. Dois jogadores 

empregam um pacote de 13 cartas do mesmo naipe (A, 2, ..., 10, 

Q, J e K). Após um sistema de distribuição e troca de cartas que 

descreveremos a seguir, o vencedor é aquele com a maior carta (A < 

2 < ···< 10 < Q < J < K). 

Inicialmente, o jogador 1 embaralha as 13 cartas e distribui uma 

carta X para si, uma carta Y para o jogador 2 e deixa o restante 

dascartasemummonteZ, sem que nenhum dos dois jogadores 

veja as cartas. Feito isto, cada jogador vê suacarta,masnão as 

outras. O jogador 1 deve então decidir se mantém a sua carta ou 

a troca com o jogador 2 (que não pode se negar a fazer a troca). 

No primeiro caso, é a vez do jogador 2 decidir se ele mantém a sua 

carta (a única que ele conhece até o momento) ou se ele faz a troca 

com a primeira carta do monte Z. Depois que o jogador 2 faz a sua 

escolha, os jogadores mostram as suas cartas e vence aquele com a 

maior carta. No segundo caso, os dois jogadores conhecem os valores 

das duas cartas X e Y e o jogador 2 não tem escolha alguma: se, 

depois da troca, a sua carta for menor do que a carta do jogador 1, 

então ele deve obrigatoriamente trocá-la com a carta do monte Z 

na esperança de obter uma carta maior para vencer o jogo, caso 

120

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 121 

contrário, ele mantém a sua carta e vence o jogo. O leitor interessado 

pode se familiarizar com as regras do jogo atuando como o jogador 2 

no applet Java disponível no endereço: 

http://www.professores.uff.br/hjbortol/arquivo/2007.1/ 

applets/leher1_br.html. 

Quais são as estratégias puras do jogador 1? Cada estratégia pura 

corresponde a uma escolha de um subconjunto formado pelas cartas 

que ele irá manter na primeira etapa do jogo. Por exemplo, a escolha 

do subconjunto {5, 7, 9} corresponde àestratégia pura do jogador 1 

em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Desta 

maneira, existem tantas estratégias puras quantos subconjuntos do 

conjunto 

D = {A, 2, 3, 4, 5, 6, 7, 8, 9, 10, Q, J, K}, 

isto é, existem um total de 2 13 = 8192 estratégias puras para o jogador 

1. O mesmo vale para o jogador 2: ele tem 2 13 estratégias puras 

que estão em correspondência biunívoca com os 2 13 subconjuntos

122 [CAP. 6: EXEMPLOS 

distintos de D, cada um especificando quais cartas o jogador 2 irá 

manter. É importante observar mais uma vez que o jogador 2 só faz 

uma escolha (a de manter a sua carta Y ou trocá-la com uma carta 

do monte Z) quando o jogador 1 decide por manter a sua carta X. 

Se o jogador 1 resolve trocar de cartas, a ação do jogador 2 está completamente 

determinada pelos valores das cartas X e Y (supondo, 

naturalmente, que o jogador 2 seja racional). 

Amatrizdepayoffs do jogo tem, portanto, dimensão 2 13 × 2 13 . 

Este tamanho pode ser reduzido consideravelmente observando que 

estratégias puras “com saltos” são dominadas por aquelas “sem saltos”. 

Por exemplo, a estratégia pura 

{5, 7, 9} 

(manter apenas as cartas 5, 7 e 9) é dominada pela estratégia pura 

{5, 6, 7, 8, 9, 10, Q, J, K} 

(manter apenas as cartas maiores do que ou iguais a 5). Assim, ao 

invés de considerar todos os 2 13 subconjuntos de D, podemosnos 

restringir aos 13 subconjuntos da forma {C ∈ D | C ≥ ˜C}, onde 

˜C ∈ D. No que se segue, usaremos o seguinte abuso de notação 

A = {A, 2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, 

2 = {2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, 

3 = {3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},... 

para representar estas estratégias puras dominantes de cada jogador. 

O ganho do jogador 1 é sua probabilidade de vitória que, evidentemente, 

depende das estratégias puras (dominantes) escolhidas pelos 

dois jogadores. Através de cálculos com probabilidades condicionais 

(como em [05]) ou através de uma enumeração direta (veja o applet 

Java disponível no endereço http://www.professores.uff.br/ 

hjbortol/arquivo/2007.1/applets/leher2_br.html), obtemos a 

matriz de payoffs apresentada na tabela 6.1, onde as probabilidades 

foram calculadas com 3 casas decimais corretas. Como o jogo éde 

soma zero (isto é, um jogador vence se, e somente se, o outro perde), 

amatrizdepayoffs do jogador 2 éamatrizdepayofffs do jogador 1 

multiplicada por −1.


jogador 2 

A 2 3 4 5 6 7 8 9 10 Q J K 

A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462 

2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500 

3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533 

4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559 

5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578 

6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590 

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593 

8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588 

9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573 

10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549 

Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514 

J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468 

K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 

Tabela 6.1: Matriz de payoffs do jogador 1 para o jogo Le Her. 

jogador 1


Tabela 6.2: Matriz de payoffs do jogador 1 para o jogo Le Her após mais uma eliminação de estratégias 

estritamente dominadas. 

jogador 1 

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593 

8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588 

9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573 

jogador 2 

A 2 3 4 5 6 7 8 9 10 Q J K


Vamos usar dominância para simplificar ainda mais a matriz do 

jogo. Observe que as estratégias 7 e 9 do jogador 1 dominam, respectivamente, 

as estratégias de A a 6 ede10 a K (isto é, o jogador 1 

deve sempre trocar cartas ≤ 6edevesempre manter cartas ≥ 10). 

Eliminando-se então as linhas estritamente dominadas, obtemos a 

matriz da tabela 6.2. Para esta matriz reduzida, as estratégias 9 

e 10 do jogador 2 dominam, respectivamente, as estratégias de A a 8 

edeQaK (isto é, o jogador 2 deve sempre trocar cartas ≤ 8edeve 

sempre manter as cartas Q, J e K. Eliminando-se então as colunas 

estritamente dominadas, obtemos a matriz da tabela 6.3. 

jogador 1 

jogador 2 

9 10 

7 0.538 0.543 

8 0.547 0.548 

9 0.549 0.545 

Tabela 6.3: Matriz de payoffs do jogador 1 para o jogo Le Her após 

mais uma eliminação de estratégias estritamente dominadas. 

Finalmente, vemos que para esta matriz reduzida, a estratégia 8 do 

jogador 1 domina estritamente a estratégia 7. Eliminando-a, obtemos 

amatriz2× 2databela6.4. 

jogador 1 

jogador 2 

9 10 

8 0.547 0.548 

9 0.549 0.545 

Tabela 6.4: Matriz de payoffs do jogador 1 para o jogo Le Her após 

mais uma eliminação de estratégias estritamente dominadas. 

Usando-se programação linear ou funções de melhor resposta, podemos 

calcular facilmente o equilíbrio de Nash em estratégias mistas


deste jogo 2 × 2: 

(p 1 ,p 2 )=(4/5, 1/5) para o jogador 1 

e 

(q 1 ,q 2 )=(3/5, 2/5) para o jogador 2. 

Os payoffs médios são, respectivamente, 0.5474 e 0.4526. Vemos, 

portanto, que o jogador 1 leva vantagem nesta versão simplificada 

do Le Her supondo, é claro, que ele aja racionalmente seguindo o 

equilíbrio de Nash. 

Observações. 

1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar 

de cartas com o jogador 1 se sua carta for K (a de maior valor). No 

caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2 

vence. Mesmo na versão original, a probabilidade média de ganho 

do jogador 1 é maior do que a do jogador 2 no equilíbrio de Nash. 

Os detalhes podem ser encontrados nas referências [25] e [37]. 

2. O jogo Le Her foi investigado por Pierre Rémond de Montmort 

(1678–1719) e Nicholas Bernoulli (1687–1759), mas foi James Waldegrave 

(1684–1741) que forneceu uma solução para o jogo usando 

o conceito de equilíbrio em estratégias mistas. As referências [90] 

e [37] apresentam em detalhes a história deste jogo, incluindo a 

troca de correspondência entre Montmort, Bernoulli e Waldegrave 

e os erros cometidos na solução apresentada por Bernoulli. 

3. Benjamim e Goldman mostram em [05] que, para a versão simplificada 

do Le Her, a redução da matriz de payoffs para uma 

matriz 2 × 2 ocorre para qualquer baralho com um número N ≥ 3 

de cartas de um mesmo naipe. 

6.2 O modelo de duopólio de Cournot 

Sejam q 1 e q 2 as quantidades de um produto homogêneo fabricado 

por duas empresas 1 e 2, respectivamente. Diz-se que dois produtos 

fabricados por empresas diferentes são homogêneos quando os consumidores 

não percebem diferenças na qualidade dos dois produtos

[SEC. 6.2: O MODELO DE DUOPÓLIO DE COURNOT 127 

e, assim, eles tomam suas decisões sobre qual produto comprar considerando 

apenas o preço, independentemente do fabricante. Vamos 

assumir a situação de market-clearing, istoé, não existe excesso de 

demanda ou excesso de oferta no mercado. Assim, a quantidade demandada 

do produto é igual à quantidade ofertada do mesmo. Para 

simplificar, vamos supor que o preço de mercado é uma função linear 

da quantidade agregada Q = q 1 + q 2 do produto no mercado. Mais 

precisamente, 

P (Q) = 

{ A − Q, se QA, 

u 2 (q 1 ,q 2 ) = q 2 · P (q 1 + q 2 ) − c · q 2 

{ 

q2 · [A − (q 

= 

1 + q 2 ) − c], se q 1 + q 2 ≤ A, 

q 2 · [−c], 

se q 1 + q 2 >A, 

{ 

q2 · (−q 

= 

2 +(A − q 1 − c)), se q 1 + q 2 ≤ A, 

q 2 · [−c], 

se q 1 + q 2 >A. 

Desta maneira, as funções de melhor resposta das duas empresas são 

dadas por 

{ 

{(A − c − q2 )/2}, se q 

MR 1 (q 2 ) = 

2 ≤ A − c, 

{0}, se q 2 >A− c,


MR 2 (q 1 ) = 

{ 

{(A − c − q1 )/2}, se q 1 ≤ A − c, 

{0}, se q 1 >A− c. 

Lembrando que (q1 ∗,q∗ 2 )é um equilíbrio de Nash em estratégias puras 

se, e somente se, q2 ∗ ∈ MR 2(q1 ∗)eq∗ 1 ∈ MR 1(q2 ∗), vemos que (q∗ 1 ,q∗ 2 ) 

deve ser solução do sistema 

q ∗ 2 =(A − c − q ∗ 1)/2 e q ∗ 1 =(A − c − q ∗ 2)/2. 

Sendo assim, vemos que o único equilíbrio de Nash em estratégias 

puras do jogo é 

( A − c 

(q1 ∗ ,q∗ 2 )= , A − c ) 

. (6.1) 

3 3 

Estes valores também podem ser encontrados geometricamente, a- 

través dos pontos de interseção das representações gráficas das duas 

funções de melhor resposta (Figura 6.1). 

q 2 

A { c 

(A { c)/2 

(q , q ) 1 * * 2 

0 (A { c)/2 A { c 

q 1 

Figura 6.1: Calculando o equilíbrio de Nash do modelo de duopólio 

de Cournot.

[SEC. 6.3: O MODELO DE DUOPÓLIO DE BERTRAND 129 

6.3 O modelo de duopólio de Bertrand 

Neste modelo, ao invés de decidir o quanto produzir, as empresas 

devem escolher o quanto cobrar pelo produto, isto é, elas entram em 

uma competição de preços. Como no modelo de Cournot, estamos 

assumindo que tudo o que é produzido é consumido. Lembrando 

que A éopreço máximo aceitável pelo mercado, vemos que S 1 = 

S 2 =[0,A]eS = S 1 × S 2 =[0,A] × [0,A]. As funções utilidade são 

dadas por 

u i (p 1 ,p 2 )=p i · Q i (p 1 ,p 2 ) − c · Q i (p 1 ,p 2 )=(p i − c) · Q i (p 1 ,p 2 ), 

onde Q i (p 1 ,p 2 ) representa a produção vendida da empresa i com o 

perfil de preços (p 1 ,p 2 ). Comooprodutoé homogêneo, podemos 

assumir que os consumidores comprarão o produto mais barato. Se 

as duas empresas cobrarem o mesmo preço, vamos assumir que elas 

dividem igualmente o mercado. Desta maneira, 

⎧ 

⎨A − p i , se p i p j , 

e, portanto, 

⎧ 

⎨(p i − c) · (A − p i ), se p i p j , 

onde j ≠ i =1, 2. 

Quais são os equilíbrios de Nash em estratégias puras deste modelo? 

Certamente (p ∗ 1 ,p∗ 2 )=(c, c) é um equilíbrio de Nash pois, neste 

caso, 

u 1 (p ∗ 1,p ∗ 2)=0≥ u 1 (p 1 ,p ∗ 2) e u 2 (p ∗ 1,p ∗ 2)=0≥ u 2 (p ∗ 1,p 2 ), 

para todo p 1 ∈ S 1 eparatodop 2 ∈ S 2 . Existem outros equilíbrios de 

Nash? A resposta énão, como podemos concluir a partir dos casos 

descritos a seguir. 

(a) Se p ∗ 2


p 2 

A 

c 

Caso (c) 

Caso (d) 

Caso (e) 

Caso (b) Caso (f) 

Caso (g) 

Caso (h) 

Caso (a) 

0 c A 

p 1 

Figura 6.2: Calculando o equilíbrio de Nash do modelo de duopólio 

de Bertrand analisando os vários casos. 

(b) Se p ∗ 1 = p∗ 2

[SEC. 6.4: O MODELO DE DUOPÓLIO DE STACKELBERG 131 

(f) Suponha que p ∗ 2 = p∗ 1 >c. Se p∗ 1 = p∗ 2 ∈ ((A + c)/2,A], então 

u 1 (p ∗ 1,p ∗ 2) c. Como u 1(p ∗ 1 ,p∗ 2 )=0c.Sep ∗ 1


u 2 

0 c (A +c)/2 A p 2 

Figura 6.3: Gráfico da função p 2 ↦→ u 2 ((A + c)/2,p 2 ). 

e, então, escolhe a sua quantidade de produção q 2 ≥ 0. O ganho de 

cada empresa é o lucro que ela obtém: 

u 1 (q 1 ,q 2 )=q 1 · P (q 1 + q 2 ) − c · q 1 , 

u 2 (q 1 ,q 2 )=q 2 · P (q 1 + q 2 ) − c · q 2 , 

onde P (Q) =A − Q éopreço de mercado em função da quantidade 

agregada Q = q 1 + q 2 e c>0é o custo unitário de produção. 

Vamos usar indução retroativa para encontrar um equilíbrio de 

Nash deste jogo seqüencial. Primeiro, vamos calcular a ação ótima 

A 2 (q 1 )daempresa2emfunção da quantidade de produção q 1 : 

A 2 (q 1 ) = argmax q2≥0 u 2(q 1 ,q 2 ) = argmax q2≥0 q 2 · [A − q 1 − q 2 − c] . 

Pela regra de Fermat, obtemos que 

q 2 = A 2 (q 1 )= A − q 1 − c 

, 

2

[SEC. 6.5: A TRAGÉDIA DOS COMUNS 133 

desde que q 1


Two Lectures on the Checks to Population de 1833, que depois foi popularizada 

e estendida por Garret Hardin no seu artigo The Tragedy 

of the Commons publicado na revista Science em 1968 ([38]). 

A palavra “tragédia”temosignificadodadoporAlfredNorth 

Whitehead em seu livro Science and The Modern World: “The essence 

of dramatic tragedy is not unhappiness. It resides in the solemnity 

of the remorseless working of things.”. Já a palavra “comuns” 

designa uma área de pastagem coletiva, sem dono e sem qualquer 

regulamentação, usada por pastores na Idade Média, que cuidavam 

do rebanho de ovelhas para obter a lã que vendiam para a confecção 

de roupas. 

Com o crescimento do número de famílias de camponeses ao longo 

do tempo, ocorreu um aumento do número de ovelhas necessárias 

para o sustento de cada família. Como a área de pastagem era de uso 

comum, nenhuma família tinha incentivo para controlar o número de 

ovelhas de seu rebanho pois, se o fizesse, outras famílias usariam as 

pastagens de qualquer forma. Com uma superpopulação de ovelhas, a 

terra que antes era fértil, começou a se exaurir. A redução da área de 

pastagem afetou tanto o rebanho quanto a indústria local de roupas. 

Aparábola mostra, então, que a imprudência em administrar um 

recurso finito do qual todos se beneficiam pode levar àruína. 

Vamos usar teoria dos jogos para modelar uma versão ingênua da 

tragédia dos comuns. Considere uma aldeia com n pastores e seja o i 

onúmero de ovelhas do i-ésimo pastor, de modo que o número total 

de ovelhas da aldeia é o = o 1 + ···+ o n .Ocustodecompradeuma 

ovelha é c, independentemente do númerodeovelhasqueopastor 

já possui. O benefício de um pastor em deixar uma ovelha pastando 

é v(o) por ovelha. Como o campo de pastagem é um recurso finito, 

existe um número máximo o de ovelhas que ele pode suportar. Assim, 

v(o) > 0seo

[SEC. 6.5: A TRAGÉDIA DOS COMUNS 135 

exigindo-se que v ′ ≤ 0ev ′′ < 0. Desta maneira, v temumgráfico tal 

como o apresentado na Figura 6.4. 

v 

v 

0 o o 

Figura 6.4: Gráfico da função v. 

Neste jogo, a estratégia do pastor i é a escolha da quantidade de 

ovelhas que ele deixará no pasto. Podemos então considerar que o 

conjunto de estratégias puras do pastor i é S i =[0, o). Sua função 

utilidade é dada por 

u i (o 1 ,...,o i ,...,o n )=o i · v(o 1 + ···+ o i + ···+ o n ) − c · o i . 

Suponha que c0, logo μ i é crescente e, portanto, positiva, em 

um intervalo (0,ɛ)paraalgumɛ>0e


(5) μ i écôncava em [ 0, o − σ−i] ∗ . 

Logo, a função de melhor resposta do pastor i está bem definida: 

MR i (o ∗ ) = argmax oi∈(0,o−σ ∗ −i ) ( 

oi · v ( o i − σ ∗ −i) 

− c · oi 

) 

. 

Se o ∗ i ∈ MR i(o ∗ ), então, pela regra de Fermat, μ ′ i (o∗ i ) = 0, isto é, 

v(o ∗ i + σ∗ −i )+o∗ i · v′ (o ∗ i + σ∗ −i ) − c =0. 

Somando-se estas equações para i =1,...,n e, então, dividindo-se 

por n, obtemosqueσ ∗ deve satisfazer a seguinte equação: 

v(σ ∗ )+ 1 n · σ∗ · v ′ (σ ∗ )=0. (6.2) 

Por outro lado, se o objetivo é maximizar a utilidade coletiva, isto 

é,asomadasfunções utilidades individuais, então devemos resolver 

o seguinte problema de otimização: 

max (o · v(o) − c · o) . 

o∈(0,o) 

Usando novamente a regra de Fermat, concluímos que uma solução σ • 

deste problema de otimização deve resolver a seguinte equação: 

v(σ • )+σ • · v ′ (σ • )=0. (6.3) 

Observe que σ ∗ >σ • . Com efeito: se, por absurdo, σ ∗ ≤ σ • ,então 

v(σ ∗ ) ≥ v(σ • ), já quev é decrescente. Mas v ′ também é decrescente, 

já quev ′′ < 0. Desta maneira, 0 >v ′ (σ ∗ ) ≥ v ′ (σ • ). Como 0 < 

σ ∗ /n < σ ∗ ≤ σ • , segue-se que 

σ ∗ 

n · v′ (σ ∗ ) ≥ σ∗ 

n · v′ (σ • ) >σ • · v ′ (σ • ) 

e, portanto, 

0=v(σ ∗ )+ σ∗ 

n · v′ (σ ∗ ) >v(σ • )+σ • · v ′ (σ • )=0, 

uma contradição. Vemos então que o equilíbrio de Nash o ∗ coloca 

mais ovelhas no pasto do que o número de ovelhas sugerido pelo 

equilíbrio coletivo o • . Isto acontece porque cada pastor considera 

apenas o seu próprio benefício e nãooefeitodesuasações sobre os 

outros pastores.

Apêndice A 

Convexidade 

Neste apêndice apresentaremos as definições e propriedades básicas 

de funções convexas necessárias no texto. As demonstrações 

omitidas podem ser encontradas em [42]. 

Definição A.1 (Conjuntos convexos) Dizemos que U ⊂ 

R n éumconjunto convexo se, e somente se, para todo p, q ∈ U 

tem-se 

(1 − t) · p + t · q ∈ U, 

para todo t ∈ [0, 1], isto é, se o segmento de reta que une dois 

pontos quaisquer de U está sempre contido em U. 

Teorema A.1 Seja {U ξ } ξ∈Ξ 

uma família de conjuntos convexos 

em R n Então ⋂ 

ξ∈Ξ 

U ξ 

também é um conjunto convexo em R n . 

137

138 [CAP. A: CONVEXIDADE 

(a) 

(b) 

Figura A.1: O conjunto da esquerda é convexo enquanto que o da 

direita não o é. 

Definição A.2 (Semiplanos e Semiespaços) Seja a um vetor 

não-nulo em R n esejac um número real. Os conjuntos 

H + = {x ∈ R n | ax ≥ c} e H − = {x ∈ R n | ax ≤ c} 

são denominados, respectivamente, semiespaços fechados correspondentes 

ao semiplano H = {x ∈ R n | ax = c}. 

Por linearidade, segue-se que semiplanos e semiespaços são conjuntos 

convexos. 

Definição A.3 (Politopos e Poliedros) Um politopo éum 

conjunto que pode ser expresso como a interseção de um número 

finito de semiespaços fechados. Um poliedro é um politopo limitado. 

Note que politopos e poliedros são conjuntos convexos, como interseção 

de conjuntos convexos. 

Definição A.4 (Combinação convexa) Sejam x 1 ,...,x k ∈ 

R n e λ 1 ,...,λ k números reais ≥ 0taisque ∑ n 

i=1 λ i =1. Acombinação 

convexa de x 1 ,...,x k com pesos λ 1 ,...,λ k éoponto 

λ 1 · x 1 + ···+ λ i · x k .

139 

(a) 

(b) 

Figura A.2: O conjunto de todas as combinações convexas de (a) dois 

pontos distintos éumsegmentoderetaqueligaosdois 

pontos e de (b) três pontos não-colineares éumtriângulo 

(lados e interior) com vértices nos três pontos. 

Teorema A.2 Um subconjunto U de R n é convexo se, e somente 

se, toda combinação convexa de pontos de U pertence 

a U. 

Definição A.5 (Funções convexas e côncavas) 

(a) Dizemos que uma função f : U ⊂ R n → R definida em um 

subconjunto convexo U de R n é convexa se, e somente se, 

f((1 − t) · p + t · q) ≤ (1 − t) · f(p)+t · f(q), 

(A.1) 

para todo p, q ∈ U etodot ∈ [0, 1]. 

(b) Dizemos que uma função f : U ⊂ R n → R definida em um 

subconjunto convexo U de R n é côncava se, e somente se, 

f((1 − t) · p + t · q) ≥ (1 − t) · f(p)+t · f(q), 

(A.2) 

para todo p, q ∈ U etodot ∈ [0, 1]. 

A interpretação geométrica é a seguinte: para uma função convexa, o 

segmento de reta secante que passa pelos pontos (p,f(p)) e (q,f(q)) 

sempre está acima ou coincide com o gráfico de f para qualquer


y 

f(p) 

segmento de reta secante 

(1{t) . f(p)+t. 

f(q) 

gráfico de f 

f(q) 

f((1{t) . p +t. 

q) 

0 

p 

(1{t) . p+t. 

q 

q 

x 

Figura A.3: Para uma função convexa, o segmento de reta secante 

fica sempre acima ou coincide com o gráfico da função, 

para quaisquer escolhas de p e q. 

escolha de pontos p e q em U (veja a Figura A.3). Já parauma 

função côncava, o segmento de reta secante que passa pelos pontos 

(p,f(p)) e (q,f(q)) sempre está abaixo ou coincide com o gráfico 

de f para qualquer escolha de pontos p e q em U. Note que f é 

côncava se, e somente se, −f éconvexa. 

Opróximo teorema estabelece o motivo de convexidade ser uma propriedade 

tão desejável em otimização. 

Teorema A.3 

(a) Se f : U ⊂ R n → R éconvexa,então todo ponto de mínimo 

local de f em U também é ponto de mínimo global de f 

em U. 

(b) Se f : U ⊂ R n → R écôncava, então todo ponto de máximo 

local de f em U também é ponto de máximo global de f 

em U.

141 

Teorema A.4 Seja f : U ⊂ R n → R uma função de classe C 1 

definida em um subconjunto convexo U de R n . 

(a) f é uma função convexa em U se, e somente se, 

f(q) ≥ f(p)+∇f(p) · (q − p), 

(A.3) 

para todo p, q ∈ U, istoé, se, e somente se, cada hiperplano 

tangente ao gráfico de f está sempreabaixo ou coincide com 

ográfico de f. 

(b) f é uma função côncava em U se, e somente se, 

f(q) ≤ f(p)+∇f(p) · (q − p), 

(A.4) 

para todo p, q ∈ U, istoé, se, e somente se, cada hiperplano 

tangente ao gráfico de f está sempreacima ou coincide com 

ográfico de f. 

Aqui ∇f(p) denota o vetor gradiente de f em p. 

y 

gráfico de f 

0 

x 

Figura A.4: Para uma função convexa, cada hiperplano tangente ao 

gráfico de f está sempre abaixo do gráfico de f.


Definição A.6 (Funções quase-convexas e quase-côncavas) 

(a) Dizemos que uma função f : U ⊂ R n → R definida em um 

subconjunto convexo U de R n é quase-convexa se, e somente 

se, 

{x ∈ U | f(x) ≤ c} 

é um conjunto convexo para todo c ∈ R. 

(b) Dizemos que uma função f : U ⊂ R n → R definida em um 

subconjunto convexo U de R n é quase-côncavo se, e somente 

se, 

{x ∈ U | f(x) ≥ c} 

é um conjunto convexo para todo c ∈ R. 

Note que f équase-côncava se, e somente se, −f équase-convexa. 

Toda função convexa é quase-convexa e toda função côncava équasecôncava. 

Existem funções quase-convexas que não são convexas. Por 

exemplo, a função f : R → R definida por y = f(x) = 3√ x 2 équaseconvexa, 

mas não éconvexa. 

y 

0 x 

Figura A.5: y = f(x) = 3√ x 2 é quase-convexa, mas não éconvexa 

em R.

143 

Toda função f : R → R monótona é quase-convexa e quase-côncava. 

A função y = f(x) =⌊x⌋ que leva x ∈ R no maior inteiro menor do 

que ou igual a x é função quase-convexa que não écontínua. A função 

da Figura A.6 é um exemplo de função que não équase-convexa. 

Teorema A.5 Seja f : U ⊂ R n → R uma função definida em 

um subconjunto convexo U de R n . 

(a) As seguintes condições são equivalentes: 

(1) f é uma função quase-convexa em U. 

(2) ∀x 1 , x 2 ∈ U, ∀t ∈ [0, 1], se f(x 1 ) ≤ f(x 2 ), então 

(3) ∀x 1 , x 2 ∈ U, ∀t ∈ [0, 1], 

f(t · x 1 +(1− t) · x 2 ) ≤ f(x 2 ). 

f(t · x 1 +(1− t) · x 2 ) ≤ max{f(x 1 ),f(x 2 )}. 

(b) As seguintes condições são equivalentes: 

(1) f é uma função quase-côncava em U. 

(2) ∀x 1 , x 2 ∈ U, ∀t ∈ [0, 1], se f(x 1 ) ≥ f(x 2 ), então 

(3) ∀x 1 , x 2 ∈ U, ∀t ∈ [0, 1], 

f(t · x 1 +(1− t) · x 2 ) ≥ f(x 2 ). 

f(t · x 1 +(1− t) · x 2 ) ≥ min{f(x 1 ),f(x 2 )}. 

Teorema A.6 Seja f : U ⊂ R n → R uma função de classe C 1 

definida em um subconjunto convexo U de R n . 

(a) f équase-convexaemU se, e somente se, 

∀x 1 , x 2 ∈ U, f(x 2 ) ≤ f(x 1 ) ⇒ ∇f(x 1 ) · (x 2 − x 1 ) ≤ 0.


y 

c 

0 x 

Figura A.6: Um exemplo de função que não équase-convexa. 

(b) f équase-côncava em U se, e somente se, 

∀x 1 , x 2 ∈ U, f(x 2 ) ≥ f(x 1 ) ⇒ ∇f(x 1 ) · (x 2 − x 1 ) ≥ 0.

Apêndice B 

Programação Linear 

Neste apêndice apresentaremos as definições e propriedades básicas 

da teoria de programação linear necessárias no texto. Para 

detalhes, demonstrações e extensões, recomendamos os excelentes livros 

[14, 52]. 

Um programa linear éumproblemadeotimização onde a função 

que queremos otimizar e as restrições são todas lineares. Por exemplo, 


x 1,x 2∈R 

sujeito a 3 x 1 +2x 2 ≥ 8, 

x 1 +5x 2 ≥ 7, 

x 1 ≥ 0, 

x 2 ≥ 0, 

(B.1) 

é um programa linear. Para resolvê-lo, precisamos encontrar um 

ponto (x 1 ,x 2 )doconjunto admissível 

K = {(x 1 ,x 2 ) ∈ R 2 | 3 x 1 +2x 2 ≥ 8,x 1 +5x 2 ≥ 7,x 1 ≥ 0,x 2 ≥ 0} 

que torna o valor da função objetivo o(x 1 ,x 2 )=x 1 + x 2 omenor 

possível. O conjunto K está desenhado na Figura B.1. Por inspeção, 

vemos que a solução ótima é dada por (x ∗ 1 ,x∗ 2 )=(2, 1). Este ponto é 

ainterseção da curva de nível f(x 1 ,x 2 )=x 1 + x 2 = c “mais baixa” 

que intercepta o conjunto admissível. 

145

146 [CAP. B: PROGRAMAÇÃO LINEAR 

x 2 

4 

3 

1 

0 2 3 

7 

x 1 

Figura B.1: O conjunto admissível do programa linear B.1. 

Dizemos que um programa linear está naforma padrão se todas 

as variáveis de decisão são não-negativas e se todas as restrições são 

em igualdade: 

minimizar 

x 1,...,x n 

∈ R c 1 x 1 + ···+ c n x n 

sujeito a a 11 x 1 + ··· + a 1n x n = b 1 , 

. . . . . 

a m1 x 1 + ··· + a mn x n = b m , 

e x 1 ≥ 0, ..., x n ≥ 0. 

Todo programa linear pode ser reescrito na forma padrão com o uso 

de variáveis de folga. Por exemplo, uma restrição da forma 

a i1 x 1 + ···+ a in x n ≥ b i 

pode ser substituída, de maneira equivalente, pelas restrições 

a i1 x 1 + ···+ a in x n − y i = b i e y i ≥ 0. 

Se uma variável de decisão x i pode assumir qualquer valor real, isto é, 

se não existe restrição de não-negatividade em x i ,então podemos

147 

substituir x i por u i − v i , a diferença de dois números positivos. Se 

colocarmos o programa linear B.1 na forma padrão, obtemos o seguinte 

PL: 

minimizar 

x 1,x 2,y 1,y 2∈R 

x 1 + x 2 

sujeito a 3 x 1 +2x 2 − y 1 =8, 

x 1 +5x 2 − y 2 =7, 

x 1 ≥ 0, 

x 2 ≥ 0, 

y 1 ≥ 0, 

y 2 ≥ 0. 

(B.2) 

Um programa linear pode ser escrito de forma mais compacta 

usando-se matrizes e vetores: 


x∈R n 

sujeito a Ax = b e x ≥ 0, 

(B.3) 

onde x ∈ R n , c ∈ R n , b ∈ R m e A é uma matriz m × n. Note 

que o conjunto admissível K = {x ∈ R n | Ax = b e x ≥ 0} de um 

programa linear, quando não-vazio, é um politopo convexo, e que as 

hipersuperfícies de nível da função objetivo são hiperplanos. 

Problemas de maximização podem ser transformados em problemas 

de minimização substituindo-se a função objetivo o por −o. Mais 

precisamente, x ∗ é uma solução ótima de 

maximizar c T x 

x∈R n 

sujeito a Ax = b e x ≥ 0, 

se, e somente se, x ∗ também ésolução de 

minimizar −c T x 

x∈R n 

sujeito a Ax = b e x ≥ 0. 

Na teoria de programação linear, assume-se que m


Da teoria de Álgebra Linear sabemos, então, que existem m colunas 

de A que são linearmente independentes. Renomeando-se índices se 

necessário, podemos assumir que estas colunas sejam as m primeiras. 

Isto induz uma decomposição de A edex: 

A = [ B C ] [ ] 

xB 

, x = , 

x C 

onde B é uma matriz m×m inversível. Como o sistema linear Ax = b 

é equivalente a Bx B + Cx C = b, segue-se então que existe uma 

solução x de Ax = b na forma 

[ 

xB 

0 

] 

. 

Esta solução é denominada solução básica do sistema linear Ax = 

b associada à base B. As componentes de x B são denominadas 

variáveis básicas. 

Teorema B.1 (Teorema Fundamental da Programação 

Linear) Considere um programa linear na forma padrão B.3, 

com A matriz m × n de posto m. 

(a) Se o programa linear possui um ponto admissível, então ele 

possui um ponto admissível que é uma solução básica do 

sistema linear Ax = b. 

(b) Se o programa linear possui um ponto ótimo, então ele possui 

um ponto ótimo que é uma solução básica do sistema 

linear Ax = b. 

Opróximo teorema dá uma interpretação geométrica para pontos 

admissíveis que são soluções básicas: eles correspondem aos pontos 

extremos (vértices) do politopo K = {x ∈ R n | Ax = b e x ≥ 0}. 

Definição B.1 (Ponto Extremo) Dizemos que um ponto x 

em um conjunto convexo U é ponto extremo de U se não existem 

dois outros pontos distintos x 1 e x 2 em U tais que x = α x 1 + 

(1 − α) x 2 para algum α no intervalo (0, 1).

149 

Na Figura B.2, x 1 , x 2 e x 3 são os únicospontosextremosdo 

conjunto admissível K do PL B.1. O ponto x 4 não éumponto 

extremo de K, pois ele pode ser escrito como uma combinação convexa 

de x 2 ∈ K e x 3 ∈ K. Como x 6 = α x 5 +(1− α) x 7 para 

algum α ∈ (0, 1), vemos que o ponto x 6 (no interior do conjunto 

admissível) também não é um ponto extremo de K. 

x 2 

4 

3 

x 1 

x x 7 

6 

x 5 

x 4 

1 

x 2 

x 3 

0 x 1 

2 3 

7 

Figura B.2: x 1 , x 2 e x 3 são os únicospontosextremosdoconjunto 

admissível do PL B.1. 

Teorema B.2 (Equivalência entre Pontos Extremos e 

Soluções Básicas) Seja A uma matriz m × n de posto m, 

b um vetor em R m e K = {x ∈ R n | Ax = b e x ≥ 0} oconjunto 

admissível de B.3. Então x é um ponto extremo de K 

se, e somente se, x é um ponto admissível que ésolução básica 

de Ax = b. 

Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, não 

é preciso considerar todos os pontosdoconjuntoadmissível K: basta 

procurar pelo ponto ótimo entre os pontos extremos (vértices) de K! 

Ométodo simplex explora esta estrutura para construir um algoritmo 

muito popular para se resolver B.3. Outra categoria de métodos que


recentemente ganhou bastante popularidade é a classe dos métodos 

de ponto interior. Não é nosso propósito estudar estes algoritmos 

aqui. O leitor interessado poderá consultar os livros [14, 52]. O que é 

preciso se ter em mente é que programas lineares podem ser resolvidos 

numericamente de maneira muito eficiente nos dias de hoje. A seguir 

estabeleceremos resultados sobre dualidade, um conceito fundamental 

emuitoútil em programação linear. 

Definição B.2 (O problema dual) O problema dual de 


x∈R n 

sujeito a Ax ≥ b e x ≥ 0, 

(B.4) 

é o programa linear 

maximizar λ T b 

λ∈R m 

sujeito a A T λ ≤ c e λ ≥ 0, 

(B.5) 

onde λ T b = ∑ m 

i=1 λ ib i . B.5 é denominado o problema dual 

de B.4. Neste contexto, B.4 é denominado problema primal. 

Por exemplo, o problema dual do programa linear B.1 é 

minimizar 8 λ 1 +7λ 2 

λ 1,λ 2∈R 

sujeito a 3 λ 1 + λ 2 ≤ 1, 

2 λ 1 +5λ 2 ≤ 1, 

λ 1 ≥ 0, 

λ 2 ≥ 0. 

(B.6) 

O problema dual de qualquer programa linear pode ser encontrado 

convertendo-o para o formato B.4. Por exemplo, como Ax = b se, 

esomentese,Ax ≥ b e −Ax ≥−b, o programa linear na forma 

padrão B.3 pode ser escrito na forma do problema primal B.4 da

151 

seguinte maneira equivalente 

minimizar 

x∈R n 

sujeito a 

[ 

A 

−A 

] 

x ≥ 

c T x 

[ 

b 

−b 

] 

e x ≥ 0. 

Particionando-se agora as variáveis duais na forma (u, v), o problema 

dual deste último PL é 

minimizar 

u T b − v T b 

x∈R n 

sujeito a A T u − A T v ≤ c, u ≥ 0 e v ≥ 0. 

Fazendo-se λ = u − v, o problema acima pode ser simplificado, o que 

nos leva ao seguinte par de problemas duais: 

Par Dual B.1 



x∈R n 

sujeito a Ax = b, 

x ≥ 0, 



λ∈R m 

sujeito a A T λ ≤ c. 

Outros pares de problemas duais de interesse são dados a seguir. 

Par Dual B.2 


maximizar c T x 

x∈R n 

sujeito a Ax = b, 

x ≥ 0, 


minimizar λ T b 

λ∈R m 

sujeito a A T λ ≥ c.


Par Dual B.3 (O da Definição B.2) 



x∈R n 

sujeito a Ax ≥ b, 

x ≥ 0, 



λ∈R m 

sujeito a A T λ ≤ c, 

λ ≥ 0. 

Par Dual B.4 



y∈R m 


y ≥ 0, 


minimizar 

x∈R n 

sujeito a 

c T x 

x T A ≥ b Ț 

x ≥ 0. 

Teorema B.3 (Teorema fraco de dualidade) Se x e λ são 

admissíveis para os problemas B.3 e B.5, respectivamente, então 

c T x ≥ λ T b. 

Este teorema mostra que um ponto admissível para um dos problemas 

fornece uma cota para o valor da função objetivo do outro 

problema. Os valores associados com o problema primal são sempre 

maiores ou iguais aos valores associados com o problema dual. Como 

corolário, vemos que se um par de pontos admissíveis pode ser encontrado 

para os problemas primal e dual com valores iguais da função 

objetivo, então estes pontos são ótimos. 

Teorema B.4 (Teorema forte de dualidade) Se um dos 

problemas B.3 ou B.5 tem uma solução ótima finita, então o 

outro também terá uma solução ótima finita e, neste caso, os 

valores das respectivas funções objetivo são iguais. Se a função

153 

objetivo do problema primal não é limitada inferiormente, então 

oconjuntoadmissível do problema dual é vazio e, se a função 

objetivo do problema dual não é limitada superiormente, então 

oconjuntoadmissível do problema primal é vazio. 

Oconjuntoadmissível do problema dual B.6 do programa linear B.1 

está desenhado na Figura B.3. Por inspeção, vemos que a solução 

ótima é dada por (λ ∗ 1,λ ∗ 2)=(4/13, 1/13). Este ponto éainterseção da 

curva de nível g(λ 1 ,λ 2 )=8λ 1 +7λ 2 = c “mais alta” que intercepta 

oconjuntoadmissível. Lembrando que (x ∗ 1 ,x∗ 2 )=(2, 1) é a solução 

do problema primal B.1, vemos que 

f(x ∗ 1 ,x∗ 2 )=x∗ 1 + x∗ 2 =3=8λ∗ 1 +7λ∗ 2 = g(λ∗ 1 ,λ∗ 2 ), 

como afirma o teorema forte da dualidade. 

¸2 

3/7 

1/5 

(4/13, 1/13) 

0 

1/3 

3/8 

¸1 

Figura B.3: O conjunto admissível do problema dual B.6 do programa 

linear B.1. 

Por fim, gostaríamos de observar que se a função objetivo do programa 

linear B.3 não é limitada inferiormente no conjunto admissível


K = {x ∈ R n | Ax = b e x ≥ 0} , 

então existem ponto extremo ˜x eraioextremo˜r de K tal que o valor 

da função objetivo de B.3 em x = ˜x + t˜r tende a −∞ quando t tende 

a+∞. Emparticular, 

c T˜r < 0. 

Dizemos que ˜r éumraiodeK se, e somente se, ˜r ≠ 0 e o conjunto 

{p ∈ R n | p = x + t˜r e t ≥ 0} está contidoemK para todo x ∈ K. 

Um raio ˜r de K é extremo, senão existem outros dois raios r 1 e r 2 

de K (com r 1 ≠ t r 2 para todo t>0) e um escalar s no intervalo (0, 1) 

tal que ˜r = s r 1 +(1− s) r 2 . 

r 2 

r 3 

K 

0 x 1 

Figura B.4: Os vetores r 1 e r 2 não são raios extremos de K. O vetor 

r 3 éumraioextremodeK.

Apêndice C 

Respostas dos exercícios 

Capítulo 2 

[01] O processo de dominância estrita iterada reduz o jogo para uma 

matriz 1×1 comumúnico perfil de estratégias puras: (s 13 ,s 22 ). 

[02] (a) Não existem estratégias dominantes neste jogo. 

(b) (l 1 ,c 1 )e(l 2 ,c 2 )são os únicos equilíbrios de Nash em estratégias 

puras do jogo. 

[03] (a) c 2 domina estritamente c 1 . 

(b) (l 2 ,c 2 )éoúnico equilíbrio de Nash em estratégias puras do 

jogo. 


(b) (desviar, não desviar) e (não desviar, desviar) são os únicos 

equilíbrios de Nash em estratégias puras do jogo. 


(b) (brigar, ameaçar) e (ameaçar, brigar) são os únicos equilíbrios 

de Nash em estratégias puras do jogo. 

[06] Usando o processo de dominância fraca iterada, o jogo se reduz 

para uma matriz 3 × 3: 

155

156 [CAP. C: RESPOSTAS DOS EXERCÍCIOS 

Eixo 

A B C 

Aliados 

1 (+13, −13) (+29, −29) (+ 8, − 8) 

3 (+18, −18) (+22, −22) (+31, −31) 

. 

6 (+23, −23) (+22, −22) (+19, −19) 

[07] O processo de dominância estrita iterada reduz o jogo para 

uma matriz 1 × 1 × 1comumúnico perfil de estratégias puras: 

(x 3 ,y 2 ,z 4 ). 

[08] O processo de dominância estrita iterada reduz o jogo para 

uma matriz 1 × 1 × 1comumúnico perfil de estratégias puras: 

(x 2 ,y 1 ,z 2 ). 

[09] O perfil de estratégias (x 2 ,y 2 ,z 3 )éoúnico equilíbrio de Nash 

em estratégias puras do jogo. 

[10] (a) Para o jogador 1, a estratégia M é fracamente dominada 

pela estratégia T etambém fracamente dominada pela estratégia 

B. Para o jogador 2, a estratégia L éfracamente 

dominada pela estratégia R. 

(b) O processo de eliminação das estratégias fracamente dominadas 

conduz a duas reduções 1 × 1: {(B,C)} e {(T,R)}. 

(c) Os equilíbrios de Nash em estratégias puras são (T,C), 

(T,R)e(B,C). Note que (T,C) não está entre os perfis 

de estratégias encontrados no item anterior. 

[11] Suponha, por absurdo, que s ∗ =(s ∗ 1,...,s ∗ n)não seja um e- 

quilíbrio de Nash. Então devem existir índice i eestratégia 

pura s [1] 

i ∈ S i ,coms [1] 

i ≠ s ∗ i ,taisqueu i(s ∗ i , s∗ −i )

157 

porque a estratégia s [1] 

i foi fracamente dominada por outra estratégia 

s [2] 

i . Logo, u i(s [1] 

i , s −i) ≤ u i (s [2] 

i , s −i) paratodos −i 

que pode ser construído com as estratégias que restaram nos 

espaços de estratégias puras dos outros jogadores neste estágio 

do processo (que inclui s ∗ −i ) e, mais ainda, pelo menos para 

um s [2] 

−i , vale a desigualdade estrita: u i(s [1] 

i , s[2] −i )


[12] Note que 

u i (p ∗ ) = u i (p ∗ i , p∗ −i ) 

= 

∑m 1 

j 1=1 

··· 

∑m n 

j n=1 

Reordenando os somatórios, obtemos que 

onde 

v ji = 

∑m 1 

j 1=1 

··· 

u i (p ∗ i , p ∗ −i) = 

m∑ 

i−1 

m∑ 

i+1 

j i−1=1 j i+1=1 

p ∗ 1j 1 ····p ∗ nj n · u i (s 1j1 ,...,s njn ). 

∑m i 

j i=1 

··· 

p ∗ ij i · v ji = 〈p ∗ i , v〉 

∑m n 

j n=1 

c j1,...,j n 

· u i (s 1j1 ,...,s njn ), 

com c j1,...,j n 

= p ∗ 1j 1 ···p ∗ (i−1)j i−1 

· p ∗ (i+1)j i+1 

···p ∗ nj n 

. Desta maneira, 

se x 1 ,...,x r ∈ Δ i e λ 1 ,...,λ r são escalares não-negativos 

com ∑ r 

k=1 λ k =1,então 

( r∑ 

) 〈 r∑ 

〉 

u i λ k · x k , p ∗ −i = λ k · x k , v 

k=1 k=1 

= 

= 

r∑ 

λ k ·〈x k , v〉 

k=1 

r∑ 

λ k · u i (x k , p ∗ −i ). 

k=1 

Nas igualdades acima não usamos que λ 1 ,...,λ r são escalares 

não-negativos com ∑ r 

k=1 λ k = 1. De fato, esta exigência é 

necessária 

∑ 

apenas para garantir que se x 1 ,...,x r ∈ Δ i ,então 

r 

k=1 λ k · x k ∈ Δ i . 

[13] Suponha que a estratégia pura s ik do jogador g i seja estritamente 

dominada por uma estratégia mista 

p ′ i =(p ′ i1,...,p ′ ik,...,p ′ im i 

) ∈ Δ mi .

159 

Vamos mostrar que se p i =(p i1 ,...,p ik ,...,p imi )éumaoutra 

estratégia mista do jogador g i com p ik > 0, então p i também 

é estritamente dominada. Como s ik éestritamentedominada 

por p ′ i , segue-se que 

u i (p ′ i ,s −i) >u i (s ik ,s −i ), ∀s −i ∈ S −i . 

Assim, 

u i (p i ,s −i ) 

(∗) 

= 

= 

< 

∑m i 

r=1 

m i 

p ir · u i (s ir ,s −i ) 

∑ 

p ir · u i (s ir ,s −i )+p ik · u i (s ik ,s −i ) 

r=1 

r≠k 

∑m i 

r=1 

r≠k 

p ir · u i (s ir ,s −i )+p ik · u i (p ′ i,s −i ), 

onde, em (∗), usamos a propriedade 2.4 da página 31. Mas, por 

esta mesma propriedade, 


∑m i 

r=1 

r≠k 

∑m i 

r=1 

r≠k 

u i (p ′ i ,s −i) = 

∑m i 

r ′ =1 

u i (p i ,s −i ) 

< 

p ir · u i (s ir ,s −i )+p ik · 

= 

p ′ ir ′ · u i(s ir ′,s −i ). 

∑m i 

r ′ =1 

p ′ ir ′ · u i(s ir ′,s −i ) 

(p ir + p ik · p ′ ir) · u i (s ir ,s −i )+p ik · p ′ ik · u i (s ik ,s −i ) 

∑m i 

r=1 

= 

p ′′ 

ir · u i(s ir ,s −i ),


onde os coeficientes p ′′ 

ir são definidos por 

{ 

p ′′ 

ir = pir + p ik · p ′ ir , se r ≠ k, 

p ik · p ′ ik 

, se r = k. 

Como p ′′ 

ir ≥ 0paratodor =1,...,m i e ∑ m i 

r=1 p′′ ir =1,segue-se 

que p ′′ 

i =(p ′′ 

i1 ,...,p′′ ir ,...,p′′ im i 

)é uma distribuição de probabilidades 

e, sendo assim, 

∑m i 

u i (p i ,s −i ) 

ir · u i(s ir ,s −i )=u i (p ′′ 

i ,s −i), ∀s −i ∈ S −i . 

r=1 

Isto mostra que a estratégia mista p i éestritamentedominada 

pela estratégia mista p ′′ 

i . 

[14] Para o dilema dos prisioneiros, as funções de melhor resposta 

são dadas por: 

MR Bob (p) = argmax q∈[0,1] ((4 p +1)q − (9 p +1))={1}, 

MR Al (q) = argmax p∈[0,1] ((4 q +1)p − (9 q +1))={1}. 

A partir das representações gráficas destas funções (Figura C.1), 

vemos que o único equilíbrio de Nash em estratégias mistas do 

jogo éoperfil(1, 0; 1, 0), que corresponde ao único ponto de 

interseção (p ∗ ,q ∗ )=(1, 1) das duas representações gráficas. 

Para o jogo de comparar moedas, as funções de melhor resposta 

são dadas por: 

MR 2 (p) = argmax q∈[0,1] (2 (+1 − 2 p) q − 1+2p) 

⎧ 

⎨ {1}, se p ∈ [0, 1/2), 

= [0, 1], se p =1/2, 

⎩ 

{0}, se p ∈ (1/2, 1], 

MR 1 (q) = argmax p∈[0,1] (2 (−1+2q) p +1− 2 q) 

⎧ 

⎨ {0}, se q ∈ [0, 1/2), 

= [0, 1], se q =1/2, 

⎩ 

{1}, se q ∈ (1/2, 1]. 

A partir das representações gráficas destas funções (Figura C.2), 

vemos que o único equilíbrio de Nash em estratégias mistas do

161 

(Bob) 

q 

(Confessar) 

1 

(Negar) 

0 

1 p (Al) 

(Negar) 

(Confessar) 

Figura C.1: Calculando os equilíbrios de Nash usando as representações 


jogo éoperfil(1/2, 1/2; 1/2, 1/2), que corresponde ao único 

ponto de interseção (p ∗ ,q ∗ )=(1/2, 1/2) das duas representações 

gráficas. 

[15] Um equilíbrio de Nash não pode por probabilidade positiva em 

uma estratégia pura que é estritamente dominada. De fato: 

suponha, por absurdo, que p ∗ =(p ∗ i , p∗ −i ) seja um equilíbrio 

de Nash com p ∗ i =(p∗ i1 ,...,p∗ ik 1 

,...,p ∗ ik 2 

,...,p ∗ im i 

)ep ∗ ik 1 

> 0, 

onde s ik1 éumaestratégia pura estritamente dominada por s ik2 . 

Defina agora p • i =(p ∗ i1 ,...,0,...,p∗ ik 1 

+ p ∗ ik 2 

,...,p ∗ im i 

). Note 

que p • i ∈ Δ(S i)eu i (p • i , p∗ i ) >u i(p ∗ i , p∗ i ), contradizendo o fato 

de p ∗ =(p ∗ i , p∗ −i ) ser um equilíbrio de Nash. Um equilíbrio de 

Nash pode por probabilidade positiva em uma estratégia pura 

fracamente dominada. No jogo abaixo, 

g 2 

s 21 s 22 

g 1 

s 11 (12, 10) (28, 26) 

s 12 (20, 46) (20, 46) 

,


(g ) 2 

q 

(s ) 21 

1 

1/2 

(s ) 22 

0 

(s ) 12 

1/2 1 p 

(s ) 11 

(g ) 1 

Figura C.2: Calculando os equilíbrios de Nash usando as representações 


o perfil de estratégias mistas (0, 1; 1/2, 1/2) é um equilíbrio de 

Nash que põe probabilidade p 21 =1/2 > 0naestratégia s 21 

e s 21 é fracamente dominada pela estratégia s 22 . 

[16] O perfil de estratégias puras s ∗ = (confessar, confessar) não é 

Pareto eficiente pois, se s • = (negar, negar) étalqueu Al (s • )= 

−1 > −5 =u Al (s • )eu Bob (s • )=−1 > −5 =u Bob (s • ). 

Capítulo 3 

[01] (a) Considere Δ = [0, 1] e F: Δ→ Δcujográfico édadona 

Figura C.3. 

(b) Considere Δ = (0, 1) e F: Δ→ Δcujográfico édadona 

Figura C.4. 

(c) Considere Δ = [0, 1/3] ∪ [2/3, 1] e F: Δ→ Δcujográfico é 

dado na Figura C.5.

163 

y 

1 

1/2 

0 1/2 

1 

x 

Figura C.3: Gráfico do item (a). 

y 

1 

2/3 

0 1/3 

1 

x 

Figura C.4: Gráfico do item (b).


y 

1 

2/3 

1/3 

0 1/3 2/3 

1 

x 

Figura C.5: Gráfico do item (c). 

y 

1 

3/4 

1/4 

0 1/2 

1 

x 

Figura C.6: φ não possui ponto fixo.

165 

[02] Conforme a Figura C.6 na página 164, um exemplo é obtido 

tomando-se X =[0, 1] e 

⎧ 

⎨[3/4, 1], se 0 ≤ x




sujeito a 3 x 1 + x 2 ≥ 1, 

x 1 +3x 2 ≥ 1, 

x 1 ≥ 0, 

x 2 ≥ 0. 

Asolução do problema dual é(x ∗ 1 ,x∗ 2 )=(1/4, 1/4) e a solução 

do problema primal é(y1,y ∗ 2)=(1/4, ∗ 1/4). Se 

θ = x ∗ 1 + x∗ 2 = y∗ 1 + y∗ 2 = 1 2 , 

segue-se que o único equilíbrio de Nash do jogo de comparar 

moedas é dado por (p ∗ , q ∗ ), onde 

p ∗ = (x∗ 1,x ∗ 2) 

θ 

( 1 

= 

2 , 1 2) 

e q ∗ = (y∗ 1,y ∗ 2) 

θ 

= 

( 1 

2 , 1 2) 

. 

[03] Considere o seguinte jogo matricial geral de ordem 2 × 2: 

[ ] 

a b 

A = . 

d c 

Se existe um ponto de sela, basta usarmos os resultados da Subseção 

4.3.2 para encontrar um equilíbrio de Nash do jogo. Suponha 

então que a matriz A não possua pontos de sela. Desta 

maneira, o jogo possui apenas equilíbrios de Nash 

(p ∗ , 1 − p ∗ ; q ∗ , 1 − q ∗ ) 

totalmente mistos, isto é, com 0

167 

ou a>b, bde d


v 

* 

5 

v* ={7p* +5 

v* =8p* {3 

Coluna 2 

1 

v* ={2p* +1 

v* =3p* {2 

Coluna 3 

0 1 p 

{ 1 

Coluna 1 

* 

{ 2 

Coluna 4 

{ 3 

Figura C.7: Envelope inferior. 

isto é, ⎧⎪ ⎨ 

⎪ ⎩ 

v ∗ ≤ −2 p ∗ +1, 

v ∗ ≤ 8 p ∗ − 3, 

v ∗ ≤ 3 p ∗ − 2, 

v ∗ ≤ −7 p ∗ +5. 

(C.1) 

As funções afins v ∗ = −2 p ∗ +1, v ∗ =8p ∗ − 3, v ∗ =3p ∗ − 2 

e v ∗ =3p ∗ − 2 representam os ganhos médios do jogador linha 

quando ele escolhe a distribuição de probabilidades (p ∗ , 1−p ∗ )e 

o jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente. 

Os gráficos destas funções para 0 ≤ p ∗ ≤ 1estão desenhados na 

Figura C.7. 

Para um valor fixo de p ∗ , o jogador linha está seguro de que seu 

ganho médio é pelo menos o mínimo destas quatro funções calculadas 

em p ∗ ,oenvelope inferior destas quatro funções. Como 

o jogador linha pretende maximizar os seus ganhos médios,

169 

então ele precisa encontrar p ∗ queatingeomáximo deste envelope 

inferior. De acordo com a Figura C.7, o máximo ocorre 

justamente na interseção das retas v ∗ = −2 p ∗ +1 e v ∗ =3p ∗ −2, 

as quais representam, respectivamente, as colunas 1 e 3 do jogador 

coluna. Deste modo, uma solução do jogo 2 × 4original 

pode ser obtida estudando-se o jogo 2 × 2 definido pela matriz 

R = 

[ 

−1 +1 

+1 −2 

O valor deste jogo é v ∗ = −1/5 parap ∗ =3/5 eq ∗ =3/5. 

Assim, um equilíbrio de Nash do jogo original é dado por 

( 3 

(p ∗ , 1 − p ∗ ; q ∗ , 0, 1 − q ∗ , 0) = 

5 , 2 5 ; 3 5 , 0, 2 ) 

5 , 0 . 

Naturalmente, a técnica aqui descrita pode ser aplicada para 

qualquer jogo de soma zero com matriz A de tamanho 2 × n. 

[05] Lembre-se que u l (p, q) =p T Aq e u l (p, q) =−p T Aq. Sejam 

e k ∗ e e l ∗ tais que 

min u l(p ∗ , e l )=u l (p ∗ , e l ∗) 

1≤l≤n 

e 

max (−u c(e k , q ∗ )) = −u c (e k ∗, q ∗ ), 

1≤k≤m 

isto é, p ∗T Ae l ≥ p ∗T Ae l ∗ para todo l e e T k Aq∗ ≤ e T k ∗Aq∗ para 

todo k. Destamaneira, 

e T k Aq∗ ≤ e T k ∗Aq∗ = −(−p ∗T Ae l ∗)=p ∗T Ae l ∗ ≤ p ∗T Ae l , 

para todo k =1,...,me l =1,...,n. Por linearidade, segue-se 

que 

p T Aq ∗ ≤ p ∗T Aq, 

para todo p ∈ Δ m e q ∈ Δ n .Emparticular,p T Aq ∗ ≤ p ∗T Aq ∗ 

e p ∗T Aq ∗ ≤ p ∗T Aq, istoé, u l (p, q ∗ ) ≤ u l (p ∗ , q ∗ )eu c (p ∗ , q) ≤ 

u c (p ∗ , q ∗ )paratodop ∈ Δ m e q ∈ Δ n . Istomostraque(p ∗ , q ∗ ) 

é um equilíbrio de Nash do jogo. 

] 

.


Para a matriz A de tamanho 4 × 5 do enunciado, temos que 

u l (p ∗ , e 1 )= 121 

37 , u l(p ∗ , e 2 )= 121 

37 , u l(p ∗ , e 3 )= 160 

37 , 

u l (p ∗ , e 4 )= 121 e u l (p ∗ , e 5 )= 169 

37 

37 , 

e 

u c (e 1 , q ∗ )= 121 

37 , u c(e 2 , q ∗ )= 121 

37 , u c(e 3 , q ∗ )= 120 e 

37 

u c (e 4 , q ∗ )= 121 

37 , 

de modo que 

min u l(p ∗ , e l ) = 121/37 = max (−u c(e k , q ∗ )) = 121/37. 

1≤l≤n 1≤k≤m 

Pelo resultado acima, isto mostra que (p ∗ , q ∗ )é um equilíbrio 

de Nash do jogo. 

[06] Seja M = ∑ n 

l=1 a il = ∑ n 

k=1 a kj a constante obtida pela soma 

de qualquer linha ou coluna. Defina 

( 1 

p ∗ = q ∗ = 

n n) 

,..., 1 ∈ Δ n . 

∑ 

Observe que, para todo k, l ∈{1,...,n}, u l (p ∗ , e l )=p ∗ Ae l = 

n 

i=1 p∗ i a il = p ∗ ∑ n 

i i=1 a il = M/n e u c (e k , q ∗ ) = −e k Aq ∗ = 

− ∑ n 

j=1 a kjqj ∗ = ∑ n −q∗ j j=1 a kj = −M/n. Portanto, 

min u l(p ∗ , e l )= M 

1≤l≤n n = max (−u c(e k , q ∗ )). 

1≤k≤m 

Pelo resultado do exercício anterior, concluímos que (p ∗ , q ∗ )é 

um equilíbrio de Nash do jogo. Para o caso do quadrado mágico 

da gravura Melancolia I de Albrecht Dürer, 

( 1 

p ∗ = q ∗ = 

4 , 1 4 , 1 4 , 1 4) 

e o valor do jogo é v ∗ =34/4 =17/2.

171 

[07] Se (p ∗ , q ∗ )é um equilíbrio de Nash totalmente misto, então, 

pelas relações 4.5, 

n∑ 

a ij qj ∗ = v ∗ , 

j=1 

∀i ∈{1,...,n}. 

Estas equações podem ser escritas usando-se matrizes da seguinte 

maneira: Aq ∗ = v ∗ ½. Como, por hipótese, A éuma 

matriz inversível, segue-se que q ∗ = v ∗ A −1 ½. Agora, 

n∑ 

qj ∗ =1 ⇒ 1=½ T q ∗ = v ∗ ½ T A½ ⇒ v ∗ 1 

= 

½ T A −1 ½ . 

j=1 

Sendo assim, 

q ∗ = 

A−1 ½ 

½ T A −1 ½ . 

Do mesmo modo, pelas relações 4.6, 

n∑ 

p ∗ i a ij = v ∗ , 

i=1 

∀j ∈{1,...,n}. 

Estas equações podem ser escritas usando-se matrizes da seguinte 

maneira: p ∗T Aq ∗ = v ∗ ½. Como, por hipótese, A éuma 

matriz inversível, segue-se que p ∗ = v ∗ ½A −1 e, assim, 

Capítulo 5 

p ∗ = 

½A−1 

½ T A −1 ½ . 

[01] O equilíbrio de Nash em estratégias puras obtido por indução 

retroativa é 

((Parar, Parar), (Parar, Parar)). 

Este equilíbrio não é Pareto eficiente pois, em comparação com 

o perfil acima, 

((Continuar, Continuar), (Continuar, Continuar)) 

dá um ganho maior para os dois jogadores.


[02] O equilíbrio de Nash em estratégias puras obtido por indução 

retroativa é 

(Não confiar, Trair). 

Este equilíbrio não é Pareto eficiente pois, em comparação com 

o perfil acima, 

(Confiar, Honrar) 

dá um ganho maior para os dois jogadores.

Referências 

Bibliográficas 

[01] K. R. Apt, Uniform Proofs of Order Independence for Various 

Strategy Elimination Procedures. Contributions to Theoretical 

Economics, vol. 4, no. 1, article 5, 48 páginas, 2004. 

[02] R. Aumann, What Is Game Theory Trying to Accomplish?. 

Em Frontiers of Economics, K. Arrow, S. Honkapohja e 

B. Blackwell (editores), pp. 28-76, 1985. 

[03] R. Avenhaus, M. Canty, D. M. Kilgour, B. von Stengel, S. Zamir, 

Inspection Games in Arms Control. European Journal of 

Operational Research, vol. 90, no. 3, pp. 383-394, 1996. 

[04] G. S. Becker, Crime and Punishment: An Economic Approach. 

Journal of Politial Economy, vol 79, pp. 169-217, 1968. 

[05] A. T. Benjamin e A. J. Goldman, Analysis of the N-Card 

Game Le Her. Journal of Optimization Theory and Applications, 

vol. 114, no. 3, pp. 695–704, 2002. 

[06] J. Bertrand. Theorie Mathematique de la Richesse Sociale. 

Journal des Savants, pp. 499-508, 1883. 

[07] E. Borel, The Theory of Play and Integral Equations with Skew 

Symmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100, 

1953. Originalmente publicado em: Comptes Rendus Hebdomadaires 

des Seances de l’Academie des Sciences, 1921. 

173

174 

REFERÊNCIAS BIBLIOGRÁFICAS 

[08] E. Borel, On Games that Involve Chance and the Skill of the 

Players. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Originalmente 

publicado em: Elements de la Théorie des Probabilités, 

1924. 

[09] T. Börgers, Pure Strategy Dominance. Econometrica, vol. 61, 

no. 1, pp. 423-430, 1993. 

[10] S. J. Brams e D. M. Kilgour, Game Theory and National Security. 

Basil Blackwell, 1988. 

[11] F. Brandt, F. Fischer e Y. Shoham, On Strictly Competitive 

Multi-Player Games. Proceedings of the 21st National Conference 

on Artificial Intelligence (AAAI), AAAI Press, pp. 605- 

612, 2006. 

[12] J. N. Brown e R. W. Rosenthal, Testing The Minimax Hypothesis: 

A Re-Examination of O’Neill’s Game Experiment. 

Econometrica, vol 58, no. 5, pp. 1065-1081, 1990. 

[13] L. I. de Castro e J. H. Faro, Introdução àTeoriadaEscolha. 

25 o Colóquio Brasileiro de Matemática, IMPA, 2005. 

[14] V. Chvátal, Linear Programming. W. H. Freeman and Company, 

1983. 

[15] Y. C. Chen, N. Y. Long e X. Luo, Iterated Strict Dominance 

in General Games. CIRANO Working Papers, 2007s-03, 2007. 

[16] S.-F. Cheng e M. P. Wellman, Iterated Weaker-Than-Weak 

Dominance Twentieth International Joint Conference on Artificial 

Intelligence, Hyderabad, India, pp. 1233-1238, 2007. 

[17] P. A. Chiappori, S. Levitt e T. Groseclose, Testing Mixed- 

Strategy Equilibria When Players Are Heterogeneous: The Case 

of Penalty Kicks in Soccer. The American Economic Review, 

vol. 92, no. 4, pp. 1138-1151, 2002. 

[18] V. Conitzer e T. Sandholm, Complexity of (Iterated) Dominance. 

Proceedings of the 6th ACM Conference on Electronic 

Commerce, pp. 88–97, 2005.

REFERÊNCIAS BIBLIOGRÁFICAS 175 

[19] A. A. Cournot, Recherches sur les Principes Mathématiques de 

la Théorie des Richesses, 1838. Traduzido por N. T. Bacon em 

Researches into the Mathematical Principles of the Theory of 

Wealth, McMillan, New York, 1927. 

[20] R. S. Datta, Algebraic Methods in Game Theory. Tesededoutorado, 

Departamento de Matemática, University of California 

at Berkeley, 2003. 

[21] R. S. Datta, Using Computer Algebra To Find Nash Equilibria. 

International Conference on Symbolic and Algebraic Computation, 

Proceedings of the 2003 International Symposium on 

Symbolic and Algebraic Computation, pp. 74-79, 2003. 

[22] R. S. Datta, Finding All Nash Equilibria of a Finite Game 

Using Polynomial Algebra. Artigo aceito para publicação, The 

Journal of Economic Theory, 2007. Disponível eletronicamente 

em: http://arxiv.org/abs/math.AC/0612462. 

[23] G. Debreu, A Social Equilibrum Existence Theorem. Proceedings 

of the National Academy of Sciences of the United States 

of America (PNAS), vol. 38, no. 10, pp. 886-893, 1952. 

[24] G. Debreu, Existence of Competitive Equilibrium. EmHandbook 

of Mathematical Economics, vol. II, K. J. Arrow e M. D. 

Intriligator (editores), North-Holland, pp. 697-743, 1982. 

[25] M. Dresher, Games of Strategy: Theory and Applications. 

Prentice-Hall, Englewood Cliffs, 1961. 

[26] M. Dufwenberg e M. Stegeman, Existence and Uniqueness of 

Maximal Reductions Under Iterated Strict Dominance. Econometrica, 

vol. 70, n. 5, pp. 2007–2023, 2002. 

[27] K. Etessami, Algorithmic Game Theory and Aplications. Lecture 

Notes, School of Informatics, The University of Edinburgh, 

Scotland, UK, 2004. 

[28] A. Fabrikant, A. Luthra, E. Maneva, C. H. Papadimitriou e 

S. Shenker, On a Network Creation Game. Annual ACM Symposium 

on Principles of Distributed Computing, Proceedings

176 


of the Twenty-Second Annual Symposium on Principles of Distributed 

Computing, pp. 347–351, 2003. 

[29] J. W. Friedman, Game Theory with Aplications to Economics, 

Second Edition. Oxford University Press, 1990. 

[30] D. Fudenberg e D. K. Levine, The Theory of Learning in 

Games. The MIT Press, 1996. 

[31] D. Fudenberg e J. Tirole, Game Theory. The MIT Press, 1995. 

[32] I. Gilboa, E. Kalai e E. Zemel, On the Order of Eliminating 

Dominated Strategies. Operations Research Letters, vol. 9, 

pp. 85–89, 1990. 

[33] I. Gilboa, E. Kalai e E. Zemel, The Complexity of Eliminating 

Dominated Strategies, Mathematics of Operations Research, 

vol. 18, no. 3, pp. 553–565, 1993. 

[34] I. L. Glicksberg, A Further Generalization of the Kakutani 

Fixed Point Theorem, with Application to Nash Equilibrium 

Points, Proceedings of the American Mathematical Society, 

vol. 3, no. 1, pp. 170-174, 1952. 

[35] S. Govindan e R. Wilson, Direct Proofs of Generic Finiteness 

of Nash Equilibrium Outcomes. Econometrica, vol. 69, no. 3, 

pp. 765-769, 2001. 

[36] F. Gül, D. Pearce, E. Stacchetti, A Bound on The Proportion 

of Pure Strategy Equilibria in Generic Games. Mathematics of 

Operations Research, vol. 18, no. 3, pp. 548-552, 1993. 

[37] A. Hald, A History of Probability and Statistics and Their Applications 

before 1750. John Willey & Sons, New York, 1990. 

[38] G. Hardin, The Tragedy of the Commons. Science, vol 162, 

pp. 1243-1248, 1968. 

[39] J. C. Harsanyi, Games with Randomly Disturbed Payoffs: A 

New Rationale for Mixed Strategy. International Journal of 

Game Theory, vol. 2, no. 1, pp. 1-23, 1973.


[40] J. C. Harsanyi, Oddness of The Number of Equilibrium Points: 

ANewProof. International Journal of Game Theory, vol. 2, 

no. 1, pp. 235-250, 1973. 

[41] S. Hart, Games in Extensive and Strategic Forms. Capítulo 2 

em Handbook of Game Theory, vol.1,R.J.AumanneS.Hart 

(editores), Elsevier Science Publishers, 1992. 

[42] J. B. Hiriart-Urruty e C. Lemarechal, Convex Analysis and Minimization 

Algorithms I: Fundamentals. Springer-Verlag, 1993. 

[43] J. Hirshleifer e E. Rasmusen, Are Equilibrium Strategies Unaffected 

by Incentives?. Journal of Theoretical Politics, vol. 4, 

no. 3, pp. 353-367, 1992. 

[44] H. Hotelling, The Stability of Competition. The Economic Journal, 

vol 39, no. 153, pp. 41-57, 1929. 

[45] S. Kakutani, A Generalization of Brouwer’s Fixed Point Theorem. 

Duke Mathematical Journal, vol 8, pp. 457-459, 1941. 

[46] T. H. Kjeldsen, John von Neumann’s Conception of the Minimax 

Theorem: A Journey Through Different Mathematical 

Contexts. Archive for History of Exact Sciences, vol. 56, no. 1, 

pp. 39-68, 2001. 

[47] D. Knuth, C. Papadimitriou e J. Tsitsiklis, A Note on Strategy 

Elimination in Bimatrix Games. Operations Research Letters, 

vol. 7, pp. 103–107, 1988. 

[48] D. M. Kreps, Game Theory and Economic Modelling. Clarendon 

Lectures in Economics, Oxford University Press, 1990. 

[49] C. E. Lemke e J. T. Howson Jr., Equilibrium Points of Bimatrix 

Games. Journal of the Society for Industrial and Applied 

Mathematics, vol. 12, no. 2, pp. 413-423, 1964. 

[50] R. J. Leonard, From Parlor Games to Social Science: Von Neumann, 

Morgenstern, and the Creation of Game Theory 1928- 

1944. Journal of Economic Literature, vol. 33, no. 2, pp. 730- 

761, 1995.

178 


[51] R. J. Lipton e E. Markakis, Nash Equilibria via Polynomial 

Equations. EmLATIN 2004: Theoretical Informatics, Lectures 

Notes in Computer Science, Springer-Verlag, pp. 413-422, 2004. 

[52] D. G. Luenberger, Linear and Nonlinear Programming, Second 

Edition. Addision-Wesley Publishing Company, 1989. 

[53] W. B. MacLeod, Incentives in Organizations: An Overview of 

Some of the Evidence and Theory. EmTrends in Business Organization, 

Horst Siebert (editor), The Kiel Institute of World 

Economics, 1995. 

[54] E. Markakis, Computational Aspects of Game Theory and Microeconomics. 

Tese de doutorado, Faculdade de Computação, 

Georgia Institute of Technology, 2005. 

[55] L. M. Marx e J. M. Swinkels, Order Independence for Iterated 

Weak Dominance. Games and Economic Behavior, vol 18, 

pp. 219–245, 1997. 

[56] J. Maynard Smith e G. R. Price, The Logic of Animal Conflict. 

Nature, vol. 246, no. 5427, pp. 15-18, 1973. 

[57] K. A. McCabe, A. Mukherji e D. E. Runkle, An Experimental 

Study of Information and Mixed-Strategy Play in Three-Person 

Matching-Pennies Game. Economic Theory, vol. 15, pp. 421- 

462, 2000. 

[58] R. D. McKelvey, A Liapunov Function for Nash Equilibria. Social 

Science Working Paper 953, California Institute of Technology, 

1998. 

[59] R. D. McKelvey e A. McLennan, The Maximal Number of Regular 

Totally Mixed Nash Equilibria. Journal of Economic Theory, 

vol. 72, pp. 411-425, 1997. 

[60] A. McLennan, The Maximal Generic Number of Pure Nash 

Equilibria. Journal of Economic Theory, vol. 72, no. 2, pp. 408- 

410, 1997.


[61] I. Milchtaich, Congestion Games with Player-Specific Payoff 

Functions. Games and Economic Behavior, vol 13, n. 1, 

pp. 111–124, 1996. 

[62] P. R. Milgrom e R. J. Weber, A Theory of Auctions and Competitive 

Bidding. Econometrica, vol. 50, no. 5, pp. 1089-1122, 

1982. 

[63] J. Milnor, Analytic Proofs of the “Hairy Ball Theorem” and the 

Brouwer Fixed Point Theorem. The American Mathematical 

Monthly, vol. 85, no. 7, pp. 521-524, 1978. 

[64] K. G. Murty, Linear Complementarity, Linear and Nonlinear 

Programming. Heldermann-Verlag, 1988. 

[65] R. G. Myerson, Nash Equilibrium and the History of Economic 

Theory. Journal of Economic Literature, vol. 37, no. 3, 

pp. 1067-1082, 1999. 

[66] J. F. Nash Jr., Equilibrium Points in n-person Games. Proceedings 


of America, pp. 48–49, 1950. 

[67] J. F. Nash Jr., Non-Cooperative Games. PhD.Thesis.Princeton 

University Press, 1950. 

[68] J. F. Nash Jr., The Bargaining Problem. Econometrica, vol. 18, 

no. 2, pp. 155–162, 1950. 

[69] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathematics, 

vol. 54, pp. 286–295, 1951. 

[70] J. F. Nash Jr., Two-person Cooperative Games. Econometrica, 

pp. 128–140, 1953. 

[71] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathematische 

Annalen, vol. 100, pp. 295-320. Traduzido por S. 

Bargmann: On the Theory of Games of Stategy em Contributions 

to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker 

e R. D. Luce (editores), Princeton University Press, 1959.

180 


[72] J. von Neumann e O. Morgenstern, Theory of Games and Economic 

Behavior. Princeton University Press, 1944. 

[73] B. O’Neill, Nonmetric Test of the Minimax Theory of Twoperson 

Zerosum Games. Proceedings of the National Academy 

of Sciences of the United States of America (PNAS), vol. 84, 

pp. 2106-2109, 1987. 

[74] M. J. Osborne e A. Rubinstein, A Course in Game Theory. 

The MIT Press, 1994. 

[75] R. Otter e J. Dunne, Games with Equilibrium Points. Proceedings 


of America (PNAS), vol. 39, pp. 310-314, 1953. 

[76] R. Radner e R. Roshental, Private Information and Pure Strategy 

Equilibrium. Mathematics of Operations Research, vol. 7, 

pp. 401-409, 1982. 

[77] A. Rapoport e R. B. Boebel, Mixed Strategies in Strictly Competitive 

Games: A Further Test of The Minimax Hypothesis. 

Games and Economic Behaviour, vol. 4, no. 2, pp. 261-283, 

1992. 

[78] P. J. Reny, On The Existence of Pure and Mixed Strategy Nash 

Equilibria in Discontinuous Games. Econometrica, vol. 67, 

no. 5, pp. 1029-1056, 1999. 

[79] C. A. Rogers, A Less Strange Version of Milnor’s Proof of 

Brouwer’s Fixed-Point Theorem. The American Mathematical 

Monthly, vol. 87, no. 7, pp. 525-527, 1980. 

[80] R. W. Rosenthal, A Class of Games Possessing Pure-Strategy 

Nash Equilibria. International Journal of Game Theory, vol. 2, 

n. 1, pp. 65–67, 1973. 

[81] A. Rubinstein, Comments On The Interpretation of Game Theory. 

Econometrica, vol. 59, no. 4, pp. 909-924, 1991. 

[82] B. W. Russell, Common Sense and Nuclear Warfare. George 

Allen & Unwin, 1959.


[83] T. L. Saaty, Mathematical Models of Arms Control and Disarmament: 

Application of Mathematical Structures in Politics. 

John Wiley & Sons, 1968. 

[84] R. Savani e B. von Stengel, Exponentially Many Steps for Finding 

a Nash Equilibrium in a Bimatrix Game. CDAM Research 

Report LSE-CDAM-2004-03, 2004. 

[85] T. C. Schelling, The Strategy of Conflict. Oxford University 

Press, 1968. 

[86] U. Schwalbe e P. Walker, Zermelo and the Early History of 

Game Theory. Games and Economic Behavior, vol. 34, no. 1, 

pp. 123-137, 2001. 

[87] L. S. Shapley, A Note on the Lemke-Howson Algorithm. 

Mathematical Programming Study I: Pivoting and Extensions, 

pp. 175-189, 1974. 

[88] H. von Stackelberg, Marktform und Gleichgewicht. Julius 

Springer, 1934. 

[89] T. Stuckless, Brouwer’s Fixed Point Theorem: Methods of 

Proof and Generalizations. Dissertação de mestrado, Departamento 

de Matemática, Simon Fraser University, 2003. 

[90] I. Todhunter, A History of the Mathematical Theory of Probability. 

Chelsea, New York, 1949. 

[91] J. P. Torres-Martínez, Fixed Points as Nash equilibria. Fixed 

Point Theory and Applications, vol. 2006, 4 páginas, 2006. 

[92] G. Tsebelis, The Abuse of Probability In Political Analysis: The 

Robison Crusoe Fallacy. The American Political Science Review, 

vol. 83, no. 1, pp. 77-91, 1989. 

[93] G. Tsebelis, Are Sanctions Effective? A Game-Theoretic 

Analysis. The Journal of Conflict Resolution, vol. 34, no. 1, 

pp. 3-28, 1990.

182 


[94] A. Vetta, Nash Equilibria in Competitive Societies, with Applications 

to Facility Location, Traffic Routing and Auctions. 

Proceedings of the 43rd Annual IEEE Symposium on Foundations 

of Computer Science (FOCS’02), IEEE Computer Society, 

pp. 416–425, 2002. 

[95] N. N. Vorob’ev, Foundations of Game Theory: Noncooperative 

Games. Birkhäuser Verlag, 1994. 

[96] P. Walker, A Chronology of Game Theory. http://www.econ. 

canterbury.ac.nz/personal pages/paul walker/gt/hist 

.htm, 2005. 

[97] R. Wilson, Computing Equilibria of N-Person Games. SIAM 

Journal on Applied Mathematics, vol. 21, no 1, 1971. 

[98] E. Zermelo, Über eine Anwendung der Mengdenlehre auf die 

theories des Schachspiels. AtasdoDécimo Quinto Congresso 

Internacional de Matemáticos, vol. 2, pp. 501–504, 1913. 

[99] J. Zhao, The Equivalente Between Four Economic Theorems 

andBrouwer’sFixedPointTheorem. Working paper, Department 

of Economics, Iowa State University, 2002.

Índice 

Árvore, 109 

Bernoulli, Nicholas, 5, 126 

Bertrand 

Modelo de duopólio, 129 

Binmore, Kenneth, 119 

Borel, Émile, 6 

Combinação convexa, 31, 138 

Complementaridade Linear, 102 

Conjunto 

admissível de um PL, 145 

convexo, 137 

Cournot 

Augustin, 5 


de Montmort, Pierre Rémond, 

126 

Dominância 

em estratégias mistas, 32 

em estratégias puras, 14 

estrita iterada, 15, 34 

fraca iterada, 18 

Dürer, Albrecht, 107 

Eficiência de Pareto, 59 

Equilíbrio 

de estratégia estritamente 

dominante, 15, 35 

de estratégia fracamente dominante, 

18 

de Nash, 20, 110 


perfeito em subjogos, 117 

Espaço de estratégias 

mistas, 29 

puras, 11 

Estratégia 

de um jogo sequêncial, 109 

mista, 27 

suporte, 80 

pura, 11 

totalmente mista, 69 

Folgas complementares, 102 

Folha de uma árvore, 109 

Forma 

normal, 11 

padrão de um PL, 146 

Função 

côncava, 139 

convexa, 139 

de melhor reposta, 22 

objetivo de um PL, 145 

quase-côncava, 142 

quase-convexa, 142 

183

184 ÍNDICE 

utilidade, 11 

esperada, 30 

Gambit, 104 

Ganho, 10 

Hardin, Garret, 134 

Harsanyi, John, 9 

Indução retroativa, 114 

Informação perfeita, 108 

Jogo 

a batalha dos sexos, 13 

bimatricial, 101 

Chicken, 52 

comparar moedas, 21 

da centopéia, 119 

da confiança, 119 

da inspeção, 42 

de informação perfeita, 108 

de soma zero, 82 

2 × 2, 106 

2 × n, 169 

matriz inversível, 107 

quadrado mágico, 107 

do covarde, 52 

estratégico, 11 

estritamente competitivo, 

82 

hawk-dove, 54 

Le Her, 120 

na forma extensa, 108 

na forma normal, 11 

não-cooperativo, 11 

o dilema do prisioneiro, 11 

quadrado mágico, 107 

sequêncial, 108 

Kalmar, Laszlo, 6 

Le Her, 120 

Lloyd, William Forster, 133 

Market-clearing, 127 

Matriz de payoffs,12 

Melhor resposta, 22 

Método simplex, 149 

Modelo de Duopólio 

de Bertrand, 129 

de Cournot, 126 

de Stackelberg, 131 

Montmort, Pierre Rémond, 5 

Morgenstern, Oskar, 8 

Nash 

Equilíbrio de 


em estratégias puras, 20 

Nash Jr., John Forbes, 9, 60 

Nó deumaárvore, 109 

Ótimo de Pareto, 59 

Pareto, eficiência de, 59 

Payoff ,10 

Perfil de estratégias 

mistas, 29 

puras, 11 

Politopo, 138 

Ponto 

extremo, 148 

fixo, 60, 65 

Problema 

de complementaridade linear, 

102 

dual, 150 

dual de um LP, 150

ÍNDICE 185 

primal de um LP, 150 

Produto homogêneo, 126 

Proposição da Irrelevância do Payoff, 

47 

básica de um PL, 148 

de folga de um PL, 146 

von Neumann, John, 7 

von Stackelberg, Heinrich, 131 

Quadrado mágico, 107 

Raiz de uma árvore, 109 

Ramo de uma árvore, 109 

Rosenthal, Robert W., 119 

Russell, Bertrand, 52 

Waldegrave, James, 5, 126 

Whitehead, Alfred North, 134 

Zermelo, Ernst, 6 

Selten, Reinhard, 9, 117 

Semiespaço, 138 

Semiplano, 138 

Simplex, 149 

Solução 

básica de um PL, 148 

Solução estratégica, 20 

Stackelberg 


Subjogo, 116 

Suporte, 80 

Teorema 

do ponto fixo de Brouwer, 

60 

do ponto fixo de Kakutani, 

65 

forte de dualidade, 152 

fraco de dualidade, 152 

fundamental da programação 

linear, 148 

Tucker, Albert W., 11 

Utilidade, 11 

esperada, 30 

Variável

UMA INTRODUÇÃO ÀTEORIA ECONÔMICA DOS JOGOS

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?