TEORIA n'!s JOGü3 CONCEITOS Mario Henrique Simonsen I J- 1990 -
TEORIA DOS JOGOS
CONCEITOS BÁSICOS
1.1) Objetivo da Teoria dos Jogos
Como tomar decisões cujos resultados dependem de açoes
de terceiros é o que se procura analisar na teoria dos jogos.
Trata-se de um programa extremamente ambicioso, que levado às úl-
timas conseqüências ensinaria qualquer indivíduo a transformar-se
em campeao mundial de xadrez, a nivelar-se aos melhores profis-
A
sionais do poquer ou qualquer outro jogo de cartas, a solucionar
qualquer problema econômico, a jamais perder qualquer eleição e a
perpetuar-se como o maior general de todos os tempos. Com efeito,
não só o xadrez e o pôquer, mas também a tomada de decisões eco-
nômicas, as campanhas pOlíticas e a guerra sao jogos, no sentido
C2 que o resultado colhido por cada um nao depende apenas C~ SEüS
~~OP~, mas também das decisões de terceiros.
Não surpreende que, diante de um programa tão am0icio-
so, a teoria dos jogos seja um ramo altamente incompleto da mate-
mática aplicada. O ponto de partida foi um livro excepcionalmente
importante, o "Theory of Games and Economic Behavior" de John
von Neumann e Oskar Morgenstern, publicado em 1944, mas apenas um
ponto de partida. Quarenta anos de pesquisas enriqueceram a teo-
ria dos jogos com alguns resultados admiráveis, mas que ainda
deixam pelo menos três campos para muita análise.
.2.
Primeiro, a maioria dos jogos realmente interessantes
depa'ra-se com problemas ainda nao solucionados de computação, em-
bora muitas vezes se possa dizer algo sobre o seu resultado com
base em teoremas de existência. Como veremos no Capítulo 2, o
Teorema de Zermello assegura que o jogo de xadrez , e estritamente
determinado, no sentido de que urna e só uma das três seguintes
proposições é verdadeira: a) existe uma estratégia de ganho para
o jogador das peças brancas, qualquer que seja a estratégia das
pretas; b) existe uma estratégia que dá ganho às pretas qualquer
que seja a estratégia das brancas; c) qualquer que seja a estra-
tégia das brancas existe pelo menos uma outra que assegura , as
pretas o empate, e vice-versa. o problema é que, até agora, ne-
nhum computador conseguiu dissecar todas as estratégias ,
POSS1-
veis numa partida de xadrez. É isso que torna o xadrez tão exci-
tante quanto infantil o jogo da velha, ainda que ambos ,sejam ab-
solutamente equivalentes do ponto de vista do teorema de Zermello.
Segundo, e aí reside o ponto mais sutil da teoria dos
j~gos, o conceito de racionalidade nem sempre , e isento dI" ::.tlllbi-
qüidades. De um lado porque em mui tos casos surgem coY,fli tos en-
tre a noção de racionalidade individual e a de racionalic.:.'Ide co-
letiva. O exemplo clássico nesse sentido é o dilema dos prisio-
neiros, descrito mais adiante. De outro lado porque uma coisa , e
agir racionalmente diante de adversários ou colegas igualmente
racionais, outra agir racionalmente quando se põe em dúvida a ra-
cionalidade dos demais parceiros. Como veremos mais adiante, es-
se problema pode abalar seriamente a aplicabilidade prática do
principal conceito da teoria dos jogos não cooperativos, o de e-
quilíbrio de Nash.
I
I
.3.
Terceiro, muitos jogos admitem diferentes equilíbrios,
com resultados diferentes para os vários participantes. É de se
reconhecer que, nesses casos, o atual conhecimento sobre a teoria
deixa um campo de indeterminaç~o sobre o que seja decis~o racio-
nal em problemas de interdependência estratégica.
Apesar desses problemas ainda nao resolvidos, a teoria
dos jogos já avançou o bastante para dar importantes contribui-
ções a várias ciências, particularmente à economia. Tratemos,
pois, de estudá-la.
.4.
1.2) Conceitos Básicos
Genericamente um jogo é um conjunto de regras que esta-
belecem: i) o número de participantes; ii) as informações for-
necidas a cada participante; iii) as decisões permitidas a cada
participante; iv) os resultados (pay-offs) auferidos por cada
um dos participantes. Estes últimos podem depender exclusiva-
mente das decisõ8s tornadas pelos participantes (corno no jogo de
xadrez) ou também de fatores aleatórios (como no bridge ou no pô-
quer). O segundo caso reduz-se ao primeiro trazendo para o jogo
umparticipante adicional, a "natureza", mas com uma ressalva im-
portante: a natureza tem caprichos próprios, nem estando interes-
sada em ganhar nem em perder.
As regras dividem os jogos em dois tipos fundamentais,
os cooperativos e os nao cooperativos. No primeiro caso permitem-
-se coalizões entre os participantes sob a forma de contratos ir-
revogáveis e irretratáveis. Esses contratos podem ser de dois ti-
!"';.5 distintos, os que admitem pagamentos laterais entre os ;·:.rti-
cipantes, ( . -e os que prolbem tals pagamentos. No caso d~d jogos nao
cooperativos, é proibida qualquer comunicação entre os 0iferen-
tes jogadores, eliminando-se a possibilidade de contratos, amea-
ças explícitas ou coalizões. Em qualquer dos casos, uma estraté-
gia é um conjunto de decisões acessível a cada jogador.
Nos jogos nao cooperativos há urna categoria especial,
e que será analisada em pormenores no Capítulo 2, os jogos de ,
duas pessoas-soma zero. O que caracteriza esses jogos e que o
ganho de um é a perda do outro, como numa partida de xadrez.
Tais jogos, em tese, não abrem espaço a qualquer possibilidade de
cooperaçao, pois o interesse de um participante é diametralmente
.5.
oposto ao do outro. Também não geram a dúvida atroz que cerca a
teoria dos jogos não cooperativos: "o que acontecerá se meu par-
ceiro não se comportar racionalmente", pois o parceiro , e adver-
sário, e por isso mesmo quanto mais errar melhor.
A teoria presume que o jogo seja jogado , .
uma unlca vez.
Isso nao exclui a possibilidade de que um mesmo jogo seja re-
petido um número finito ou infinito de vezes, mas obriga a uma
reflexão muito importante: um superjogo, isto , e, um mesmo jogo
repetido n vezes, não é a mesma coisa do que n repetições inde-
pendentes do mesmo jogo. A diferença não é relevante no caso dos
jogos cooperativos, mas é fundamental no caso dos jogos nao coo-
perativos de soma variável, onde surge a possibilidade de cada
participante sinalizar aos demais o seu desejo de cooperar, des-
de que os demais façam o mesmo. Embora as regras do jogo lmpeçam
qualquer comunicação entre os participantes, a sinalização é pos-
sível na medida em que um jogador escolha estratégias que mos-
trem a sua disposição para cooperar enquanto os demais fizerem o
mesmo, e 8~ retaliar em caso contrário. Em jogos infinitamente
repet~~~~. ~ssa pnsFiLilid~~p ~p cooperação por vias indiretas se
demonstra por um fd:,.CSO teorema de Aumann. Essa é uma forte razão
para que se dedique especial atenção a essa classe de jogos.
.6.
1.3) Jogos na Forma Extensiva
Trataremos os jogos como uma sequencia de lances, cada
um decidido por um único participante. Isso permite descrever to
das as evoluções possíveis do jogo por meio de uma árvore de de
cisões, em que cada lance representa a transição de um vértice
para outro ao longo da árvore. O jogo diz-se finito ou infinito
conforme o número de vértices seja finito ou infinito. O fato de,
em alguns jogos, os participantes deverem fazer lances simultâ
neos concilia-se com essa descrição por um artifício simples: bas
ta transformar os lances anteriores em sequenciais, mas admitir
que cada participante desconheça os lances anteriores da sequen
cia.
Isso significa que a árvore de decisões decreve todas
as possíveis evoluções do jogo, mas não fornece a desc~ição com
pleta do jogo. Para completá-la é preciso especificar o que cada
participante conhece no momento de tomar suas decisões. Nesse
sentido, os jogos podem classificar-se em vários tipos, de acordo
com três critérios:
i) quanto ao conhecimento das regras do jOq0' os jo~~s
dizem-se de informação completa quando cada participante conhece:
a) o número de participantes do jogo; b) as decisões que qualquer
deles pode tomar; c) os pay-offs de todos os participantes. Se
algum desses elementos for desconhecido por algum participante, o
jogo diz-se de informação incompleta;
ii) quanto à memória: os jogos dizem-se de memória per
feita quando cada participante se lembra, a cada momento, de to
dos os lances que efetuou desde o início do jogo; de memória lm
perfeita, em caso contrário;
iii) quanto ao conhecimento da evolução do ioqo: um jogo
diz-se de- informação perfeita quando cada participante, ao efe-
.7.
tuar seus lances, conhece em que vértice da árvore se encontra o
jogo (a exemplo do xadrez); de informação imperfeita em caso con-
trário (a exemplo do pôquer).
Vejamos alguns exemplos:
A) NIM 2x2:
Estado Inicial: duas pilhas, cada urna com dois livros.
Número de Jogadores: 2.
Seqüência de Chamada: o jogador A é o primeiro a jogar, seguido
por B, e assim alternadamente.
Ações Permitidas: cada jogador deve retirar quantos livros quiser
ou puder, desde que pelo menos um, e desde que só mexa de
cada vez na mesma pilha. Se as duas pilhas contiverem o mesmo
número de livros, só é permitido mexer na pilha esquerda.
Fim do Jogo: quando o último livro for retirado.
Pay-offs: quem retirar o último livro paga um centavo ao outro.
Trata-se de um jogo de perfeita informação completa
(presumivelmente também de perf€::: ' ... a memória), 8 que se descreve
pela seguinte árvore (onde as l~~Ld~ em C~~_ v~rticc .iüdicam o
jogador a efetuar o próximo lance, se for o ~2S0, ,
e onde os ver-
tices com um retângulo em volta indicam as situações de fim de
jogo e o respectivo vencedor:
A (1,0)
IB!<o.Oll
o 8 o
É imediato que o segundo jogador pode vencer facilmente
pela seguinte regra: se, no lance inicial, A mandar o jogo para o
vértice BI' B responde mandando o jogo para A3 0 E se, no lance i
nicial, A mandar o jogo para B2 , B responde mandando o jogo para
B) Mini-porrinha
Estado Inicial: dois jogadores, A e B, com as maos vazias.
Primeiro Lance: A coloca na mao direita um palito de fósforo ou
dois, sem que B saiba de sua escolha.
Segundo Lance: B coloca na mão direita um ou dois palitos de fós-
foro, sem que A saiba da escolha.
Terceiro Lance: A escolhe um número inteiro que pode ser 2,3 ou 4.
Quarto Lance: B escolhe um inteiro de 2 a 4 diferente do escolhido por A.
Fim do Jogo: ambos abrem as respectivas mãos direitas e totalizam ,
o numero de palitos.
Pay-offs: o jogador que acertar o total (pelo terceiro ou pelo
quarto l~nce, recebe um d61ar do outro). Se ninguém acertar,
h? ..::mpate.
A árvore de Jogo apresenta-se a seguir, dentro das se-
guintes convençoes gráficas:
a) os vértices nos quatro primeiros , .
nlvelS indicam a
, . quem cabe o proxlmo lance;
b) os vértices I a 24 indicam as possíveis configura-
çoes finais do jogo;
c) as passagens de um vértice para outro indicam a es-
colha do jogador a quem cabe o lance: ou em termos de palitos de
fósforo a serem colocados na mao, ou em termos de palpite quanto
ao total de fósforos dos dois jogadores;
• .9.
d) abaixo dos vértices 1 a 24 indica-se o vencedor do
jogo (A, B ou empate = E).
5 6
~ B B B
4~ 1~ 21\3 19 20 21 22 23 24
A A B E B E B E A A E B B E A A E B E B E B A A
h diferença funda~ental entre a mini-porrinha e o Nim
2x2 8 que agora os iúqadores, ao efetuarem seus lances, não sabem
em que ~~rtice J~ ~rvore se encontram, o que caracteriza um jogo
de informação imperfeita. Ao efetuar o segundo lance, B nao sabe
se está em Bl ou em B2 . Ao efetuar o terceiro, A sabe se está
na sub-árvore que começa em BI ou na que começa em B2 , mas nao
dispõe de elementos que lhe permitam distinguir se o jogo está em
AloU A2 , no primeiro caso, ou em A3 ou A4 , no segundo. Do mesmo
modo, no quarto lance, B não dispõe de elementos para distinguir
se está no vértice Bi ou Bi+6. Isso, naturalmente, torna a mini
-porrinha um jogo mais interessante que o Nim 2x2.
, .10.
o dilema dos prisioneiros: Dois marginais, suspeitos de
um crime, são apanhados pela polícia e interrogados em celas
separadas. Cada um deles é abordado por um juiz, cujas ameaças e
promessas estão acima de qualquer suspeita, e que lhes diz: "con-
fesse o crime, colaborando com a justiça, em seu próprio interes-
se. Se ambos, você e seu parceiro, confessarem, cada qual pegará
seis anos de xadrez. Se um confessar e o outro nao, o primeiro só
pegará dois anos de cadeia, o outro dez cnos, . -corno punlçao pela
mentira. É possível que nenhum de vocês confesse e, nesse caso, a ,
pena sera de apenas quatro anos para cada um. Mas pense, pois seu
interesse é confessar".
A árvore do jogo é descrita abaixo, C indicando a con-
fissão, N a negação. Os números debaixo dos vértices terminais
indicam os pay-offs dos dois tratantes, o sinal menos lembrando
que quanto mais anos de cadeia, pior.
A
N
4
(-6;-6) (-2;-10) (-10;-2) (-4;-4)
o jogo pressupoe que o segundo prisioneiro, ao tornar
sua decisão de confessar ou não, nao saiba se se encontra no vér-
tice Bl ou B2 da árvore de decisões. No jogo em questão, isso nao
chega a ser muito relevante, p01S cada jogador dispõe de urna es-
tratégia dominante, isto é, que assegura maior pay-off qualquer
que seja a decisão do parceiro, pois a pena individual
confessando o crime do que negando. Com efeito, cada prisioneiro
, e menor
.11.
pensará com seus botões: se meu colega confessar, pegarei 6 anos
de cadeia se também confessar, 10 anos se negar minha culpa. Se
ele não confessar, pegarei só 2 anos confessando contra 4 se ne-
gar o crime. Logo, em qualquer hipótese, o melhor para mim é con-
fessar. O raciocínio vale quer o prisioneiro já conheça a deci-
sao do parceiro ou nao. Trata-se de um exemplo clássico de con-
flito entre racionalidade individual e coletiva. Se fosse permi-
tido um pacto irrevogável e irretratável entre os dois parceiros
do crime, o melhor para ambos seria não confessar e pegar apenas
quatro anos de xadrez. O interrogatório em celas separadas impede
esse pacto, e a racionalidade individual condena ambos a seis a-
nos de cadeia.
Os três jogos apresentados tipificam a variedade de
problemas que a teoria dos jogos pretende abordar. O Nim2x2 é um
jogo de duas pessoas-soma zero com perfeita informação. Trata-se
de um jogo infantil, no sentido de que a estratégia de ganho pode
ser descoberta sem maiores dores de cabeça, mas exceto quanto a
este l~J ~lmo aspecto (8s.:iencial, do ponto de vista prático), o jo-
go e 00 mesmu ~:ei'~ro que o xadrez. A mini-porrinha também , e um
jogo de duas pessoas-':'/;:'a zero, mas com a diferença de que nao
mais existe perfeita informação. Não existe nenhuma estratégia
que garanta a vitória incondicional de A ou de B. No entanto, co-
mo veremos no Capítulo 2, se o jogo for repetido várias vezes, há
uma estratégia favorável ao primeiro jogador dentro da lei dos
grandes números. Já o dilema dos prisioneiros ilustra um tercei-
ro tipo de jogo, de soma variável, onde a não cooperaçao gera a
dissonância entre racionalidade individual e coletiva. É de se
presumir que, em versão repetida, o dilema dos prisioneiros pro-
picie estratégias de cooperaçao indireta via sinalização.
....-------------------------------------------- --
.12.
At~ agora s~ exemplificamos jogos finitos. Há também
os infinitos e a sua descrição extensiva requer urna
mais abrangente do que sejam: a) urna árvore topológica;
conjunto de informações; c) urna estrat~gia. Antes de
essas definições, vale no entanto explorar a trajetória
definição
b) um
formular
heurís-
tica do conceito de estrat~gia e de jogo sob a forma normal.
.13.
1.4} Jogos matriciais e bi-matriciais
Cuidemos agora de um tipo particular de jogo de duas
pessoas, A e B: no primeiro lance, A escolhe um número inteiro de
I a m; no segundo, B escolhe um número inteiro de I a n, sem estar
informado da escolha de A. Indicando por i o inteiro escolhido
por A e por j o escolhido por B, o primeiro jogador recebe a .. , 1J
o segundo b ... Um tal jogo apelida-se bi-matricial, no sentido de 1J
que ele se descreve por um par de matrizes de pay-offs, onde as
linhas representam as possíveis estratégias de A, as colunas as
possíveis estratégias de B:
Estratégia de B Estratégia de A
BI B2 · ..... B n
AI (all;bll ) (a I2 ;bI2 ) · ..... (alnibln)
A2 (a 21 ;b21 ) (a 22 ;a22 ) · ..... (a 2n ib2n )
. . . . . . . . . . . . . . . . . . . . . . . ................ ~ . . . . . . . . . . . .
A (aml i b m1 .\ (a '-- ) (a ·b ) m2' ';n', · ..... m mn' mn - ------ --_.
No caso dos jogos de duas pessoas soma zero, b .. = -a .. , 1J 1J
tornando dispensável a explicitação da matriz dos pay-offs de B.
Nesse caso, para a descrição do jogo, basta apresentar a matriz
dos pay-offs do primeiro jogador. Esses são os apelidados "jogos
matriciais".
A importância dos jogos bi-matriciais decorre de que
todo jogo finito de duas pessoas pode representar-se como um jo-
go bi-matricial. Trata-se de um caso particular de um teorema
.14.
mais geral que será dpmonstrado ainda neste capítulo. Para tanto
basta entender claramente o que seja estratégia num jogo sob a
forma extensiva.
A idéia de estratégia é a de um plano de jogo. Em suma,
trata-se de urna sequencia completa de lances, até o fim do jogo,
cada um deles representando urna função do conjunto de informações
disponíveis e com valores permitidos pelas regras do jogo. Trate-
mos de apresentar na forma bi-matricial os jogos apresentados sob
a forma extensiva na secção anterior.
o caso do dilema dos prisioneiros é imediato, pois as
estratégias possíveis para cada jogador se resumem a confessar
(c) ou negar (N):
Estratégia de B Estratégia de A
C N
C (-E;-6) (-2;-10)
N (-10;-2) (-4;-4) - ~
A descrição acima supoe que o jogo se rc~lize com info~
maçao imperfeita, isto é, que A e B tenham que fazer suas esco
lhas ignorando a do parceiro. Se A fosse o primeiro a decidir e B
tivesse que fazer seu lance já conhecendo o de A, a descrição bi-
-matricial seria outra. A continuaria apenas com duas estraté-
gias, confessar ou não confessar. Mas B teria quatro estratégias
possíveis, funções da decisão de A: a) confessar quer A tenha
confessado ou negado; b) negar quer A tenha confessado ou nao;
c) negar se A tiver negado, confessar se A tiver confessado;
.15.
d) confessar se A tiver negado, negar se A tiver confessado.
Vejamos agora o caso do Nim. No primeiro lance, A pode
mandar o jogo para BI ou para B2 . Na primeira hipótese, o curso
do jogo independe de qualquer outra decisão de A. Na segunda, A
só tem mais de uma opção se o jogador B, no seu primeiro lance,
tiver mandado o jogo para A4. Nesse caso, A tanto pode mandar o
jogo para B4 quanto para B5. Em suma, A só dispõe de três estra
tégias, isto é, possíveis planos de jogo:
AI mandar o jogo para BI no primeiro lance;
AlI mandar o jogo para B2 no primeiro lance; posteriormente,
se B mandar o jogo para A4' mandar o jogo para B4 ;
AIII : mandar o jogo para B2 no primeiro lance; posteriormente,
se B tiver mandado o jogo para A4' mandar o jogo para BS.
, . Vejamos agora os posslvels planos para B. Se, inicial-
mente, A tiver mandado o jogo para BI' B pOderá mandar o jogo pa
ra A2 ou A~. Se A tiver mancado o jogo para B2' B poderá respon
der m~~dando o jogo ~dra A4' AS ou A6. Em qualquer das hipóteses,
a post0:-ior e\ic] "'·'.2n do jogo independe de qualquer decisão de B.
Isto posto, há seis e a~~Das seis estratégias para B:
BI BI -A2 ou B2-A4
BII
· : BI -A2 ou B2-AS
BIII : BI -A2 ou B2-A6
BIV BI
-A3 ou B2-A
4
BV BI -A3 ou B2-AS
BVI BI -A3 ou B2-A6
.16.
A primeira estratégia indicando "se r; jogo estiver em
B1 , mandá-lo para A2 , se estiver em B2 mandá-lo para A4"' e assim
por diante.
A representação matricial do jogo (com os pay-offs de
A) é a que se segue:
BI BII BIII BIV BV BVI
AI 1 1 1 -1 -1 -1
AlI -1 1 -1 -1 1 -1
AIII 1 1 -1 1 1 -1
A representação matricial confirma o que já se viu an
teriormente: B ganha o jogo escolhendo a estratégia BVI '
Cuidemos agora da mini-porrinha. A tem que tomar duas
~2cisões independentes: quantos palitos de fósforo
.. U\..lV e que número (2,3 ou 4) estimar para o total de p~:' ~ '::::::. Is-
to posto, há seis estratégias possíveis para A:
Estratégia Palitos na mao Total anunciado
AI 1 2
A2 1 3
A3 1 4
A4 2 2
AS 2 3
A6 2 4
.17.
Obviamente as estratégias A3 e A4 sa0 absolutamente es
túpidas, pois se A tem um só palito na mão o total nao pode ser
quatro, e se A tem dois palitos o total não pode ser dois. Acon-
tece que até agora nao estamos interessados em examinar se os
jogadores sao ou não inteligentes, mas apenas o que lhes é permi-
tido fazer.
Vejamos agora as estratégias de B. Elas se compoem de
dois passos também independentes. O primeiro consiste em escolher
quantos palitos esconder na mao. O segundo é um plano de respos-
ta ao total estimado por A, isto é, uma função f(x), definida e
com valores no conjunto (2;3;4), tal que f(x) F x. Há oito fun-
, . çoes posslvels dessa natureza. Corno B pode ter escondido um ou
dois palitos de fósforo, segue-se que há dezesseis possíveis
planos de jogo P?ra B:
Estratégia Palitos na mao f(2);f(3);f(4)
BI I (3 2 2)
B2 1 (3 2 3)
B3 I (~ 4 2)
B4 I (3 4 ~ ;
BS 1 (4 2 2)
B6 1 (4 2 3)
B7 I (4 4 2)
Ba 1 (4 4 3)
Bg 2 ( 3 2 2)
BIO 2 (3 2 3)
BII 2 (3 4 2)
Bl2 2 (3 4 3)
Bl3 2 (4 2 2)
.18.
Estratégia Palitos na mao f(2)if(3)if(4)
B14 2 (4 2 3)
BIS 2 (4 4 2)
B16 2 (4 4 3)
A matriz representativa da mini-porrinha (com os pay
-offs de A) é, pois,a seguinte:
B1 B2 B3 B4 BS B6 B7 BS B9 B
10 Bn B12 B13 B
14 BIS B16
AI 1 1 1 1 1 1 1 1 -1 -1 -1 -1 O O O O
A2 -1 -1 O O -1 -1 O O 1 1 1 1 1 1 1 1
A3 -1 O -1 O -1 O -1 O O -1 O -1 O -1 O -1
A4 -1 -1 -1 -1 O O O O O O O O -1 -1 -1 -1
AS 1 1 1 1 1 1 1 1 O O -1 -1 O O -1 -1
A6 O -1 O -1 O -1 O -1 1 1 1 1 1 1 1 1
.19.
l.S} Dominância, max~zn, equilíbrio de Nash
Analisemos agora os critérios de tomada racional de de-
cisões em jogos não cooperativos. A teoria gravita em torno de
três conceitos centrais, dominância, maxmin e equilíbrio de Nash.
Embora a discussão da presente secção se limite a jogos bi-matri-
ciais, a maioria dos resultados se estende naturalmente a casos
mais gerais.
Diz-se que uma estratégia S .. do jogador j domina a sua 1J
estratégia Skj quando, qualquer que seja a combinação de estra-
tégias dos demais jogadores, S .. lhe proporciona ganhos maiores 1J
ou iguais do que Skj' sendo estritamente maiores pelo menos para
alguma combinação de estratégias dos demais participantes do jo-
go. Especificamente, no caso de jogos bi-matriciais:
i) a estratégia A. do primeiro jogador domina a sua es-1
tratégia Ak quando a ij ~ a kj para j = 1,2, ... ,n, valendo a de-
sigualdade estrita para algum índice j;
ii) a estratégia B d0 segundo jogado~ domina a sua esr
tratégia B quando b. ~ b. V""l:ra 1 0- 1.:.> .... , m, valendo a de-s 1r 1S
sigualdade estrita para algum índice i.
A título de exemplo, no Nim 2x2 a estratégia AIII do
primeiro jogador domina a sua estratégia AlI. A estratégia BV1 do
segundo jogador domina qualquer outra de suas estratégias. No di-
lema dos prisioneiros, a estratégia "confessar" domina a estraté-
gia "negar" para ambos os participantes.
Um axioma fundamental estabelece que participantes ra-
cionais de jogos não cooperativos desprezam as estratégias domi
nadas. Isto posto, o que seja comportamento racional de um indi-
~-------------------------------------------~ ------
FUNDAÇÃO GETÚLIO VARG~ Riblioteca Mário Henrique Simoht~ri
víduo num jogo nao cooperativo é algo muito simples quando ele
dispõe de urna estratégia dominante, isto é, de urna estratégia que
domine todas as demais, tal corno BVI para o segundo jogador' no
Nim 2x2 e "confessar" no dilema dos prisioneiros. O indivíduo, no
caso, nao precisa preocupar-se em saber se os demais jogadores
são ou não racionais, pois isso não altera a sua escolha, que de-
ve recair sobre a estratégia dominante.
Infelizmente, na maioria dos jogos interessantes nao
existem estratégias dominantes para os jogadores. Isso nos leva
a dois outros conceitos bem mais controversos de comportamento
racional.
O primeiro é o de "maxmin". O "maxmin", para cada jo-
gador, é o ganho mínimo que ele pode assegurar para si, indepen-
dentemente das estratégias dos demais jogadores, escolhendo pru-
dentemente a sua estratégia. Em jogos bi-matriciais, o maximin de
A e B são expressos por:
VA = mêlÀ min a. i j 1j
• T = max m1n b . \In 1j ~ j 1
Urna estratégia que assegure ao jogador um ganho ,. .
m1n1-
mo igual ao seu maxmin é dita urna estratégia de maxmin. A títu-
lo de exemplo, no jogo bi-matricial abaixo:
(10;10) (-10;9)
(9;-10) (8;8)
.21.
Escolhendo a estratégia AI' o primeiro jogador, depen
dendo da opção do segundo, tanto pode ganhar 10 quanto -10; esco-
lhendo AlI' pode ganhar 9 ou 8. Isto posto, AlI é a estratégia do
maxmin para o primeiro jogador, garantindo-lhe um ganho pelo me
nos igual a 8. Do mesmo modo, BII é a estratégia de maxmin para o
segundo jogador.
A idéia de maxmin é a de açao tão prudente quanto pos-
sível, típica do jogador que teme enfrentar um bando de loucos.
Quando existe uma estratégia dominante, o jogo do maxmin é obvia-
mente racional, por força do seguinte:
Teorema 1.1:
Demonstração:
Uma estratégia dominante , e uma estratégia de
maxmin.
Suponhamos que, num jogo bi-matricial, o jogador A
disponha de uma estratégia dominante Ak. Então,por
definição:
Logo:
min j
a igualdade
VA =
~ a .. 1J
para
a kj ~ min j
valendo para
mln a kj = j
1 = 1,2, ... ,n.
a (i=l, 2, ... ,n) - I
i=k. Segue-se que:
max min a kj · i j
A existência de uma estratégia de maxmin em jogos fini
tos é trivial, e o fato de que uma estratégia dominante é uma es-
tratégia de maxmin demonstra-se facilmente em jogos bem mais ge
rais do que os bi-matriciais. O problema é que a recíproca não é
verdadeira: no jogo apresentado acima nem AlI nem BII são estratg
gias dominantes. Isto posto, associar racionalidade à escolha de
.22.
uma estratégia de maxmin, é supor que os jogadores Vlvam na re-
tranca do pessimismo. Em casos simples, como o da mini-porrinha,
essa retranca a nada leva, no sentido de que qualquer estratégia
possível é uma estratégia de maxmin, quer para A que para B. Ou
seja, ela pode condenar quem queira viver defensivamente ao pior
dos mundos.
Isso nos leva a um terceiro conceito fundamental da
teoria dos jogos não cooperativos, o de equilíbrio de Nash. Tra-
ta-se de uma combinação de estratégias, uma para cada participan-
te, tal que nenhum jogador possa aumentar seu ganho mudando unilateral
mente de estratégia. Em jogos bi-matriciais, trata-se de um par
(Ak,Br) de estratégias, uma para cada jogador, tal que:
( i= 1, 2, ... , m)
(j=1,2, ... ,n)
A idéia é uma extensão de uma construção econômica cláâ
sica e qu~ será descri ta m?.:Ls adiante, a de equilíbrio de Cournot
para S 01igop6lio, a~cesentada em 1838. Um equilíbrio de Nash
corresp8nde à ~a~~~~alidade dos participantes de um jogo não coo-
perativo num sentido ba~tante restrito: a de uma combinação de
estratégias que, se for orquestrada, não decepciona os partici
pantes, no sentido de que nenhum se arrepende da estratégia que
adotou.
O problema desse conceito de racionalidade , e que, por
hip6tese, os jogos não cooperativos nao obedecem ao comando de um
maestro. Mais ainda, a teoria supoe que o jogo s6 se jogue uma
única vez (no sentido de que um mesmo jogo repetido várias vezes
nao é o mesmo do que várias repetições independentes do mesmo jo-
go, como se verá na pr6xima secção). Isto posto, cabe indagar por
.23.
que jogadores racionais acertam na mosca um equilíbrio de Nash.
Num primeiro caso particular a resposta é simples, quan
do cada jogador dispõe de uma estratégia dominante, como no dile-
ma dos prisioneiros. Isso resulta do seguinte:
Teorema 1.2: Uma combinação de estratégias dominantes
num jogo bi-matricial é um equilíbrio de Nash.
Demonstração: Por hipótese, a kr ~ a ir , para i=1,2, ... ,m e
b kr ~ bkj
para j=1,2, ... ,n.
Num outro caso também é fácil associar racionalidade a
equilíbrio de Nash: aquele em que uma combinação de estratégias
de maxmin fornece um equilíbrio de Nash. Basta, aí, supor que ca-
da jogador seja prudente. Isso é o que ocorre em jogos de duas
pessoas-soma zero com um equilíbrio de Nash,conforme demonstra o:
Teorema 1.3:
Demonstração:
Seja [ao o] a matriz mxn de ganhos do jogador A num 1J
jogo de duas ppssoas-soma zero. Admitamos que o
par d0 estratégias (AkiBr) seja um equilíbrio de
~a~n. Então, indicando por vA e vB o maxmin de ca
da um ~~S jogadores:
= -v B
Por hipótese a kr ~ a ir (i=l, ... ,m) e
(j=l, ... ,n).
o que implica:
max i
ao 1r
, Como o jogo e de soma zero, b o o=-a o o,
1J 1J
(i=l, ... ,m) i (j=l, ... ,n)
= min j
·24.
Em suma, se o par de estratégias (Ak;~r) for um equili
brio de Nash, o elemento a kr da matriz de ganhos do jogador de A
ser~ um ponto de sela, isto é, um elemento mínimo na linha k e
m~ximo na coluna r. Daí se segue imediatamente que:
A título de exemplo, tomemos o jogo de duas pessoas-
-soma zero onde a matriz de ganhos do jogador A é:
BI BII
BIII
BIV BV B
IV
AI 3 O -2 1 -3 -4
AlI 3 2 O 1 1 1
AIII 8 -7 -1 O 9 -8
Basta que o jogador A seja prudente ou admita que B se-
ja ~'rudente para que escolha a estratégia AlI' Pelo mesmo é:. '9"1,
mento, o jogador B escolher~ BIII . Isto posto, chega-s2 ~mediata
mente ao equilíbrio de Nash (AII;BIII)'
Fora casos particulares como os acima apresentados, a
associação entre comportamento racional em jogos não cooperativos
e equilíbrio de Nash é problem~tica. Com efeito, para cada joga-
dor, escolher uma estratégia que leva a um tal equilíbrio ,
so , e
sinônimo de decisão ótima se lhe for assegurado que todos os de-
mais jogadores também escolherão estratégias conducentes a esse
equilíbrio. Ocorre que até no caso mais elementar dos jogos bi-
-matriciais não h~ como fornecer essa garantia, pois o jogador A
. escolhe uma linha e o jogador B uma coluna, cada qual ignorando a
·25.
decisão do parceiro.
Como primeiro exemplo sobre a fragilidade da associação
entre comportamento racional e equilíbrio de Nash, tomemos o jogo
. .. (+) bl.-matrl.cl.al:
(20;20) (-20;20)
(18;18) (16;16)
o único equilíbrio de Nash é a combinação de estratégia
(Al;B l ). Como Bl é a estratégia dominante para o segundo jogador,
A não hesitará em escolher AI se confiar cegamente na racionalid~
de do parceiro. Sucede que, no caso,se B escolher B2 ao invés de
Bl' nada terá a perder se A escolher AI' e pouco perderá se A es
colher A2 . Já para o jogador A, escolher AI será um desastre se
r: 0ptar por B2 . Não é de surpreender, nessas condições, ar:. .... A, que
+~m que tomar sua decisão sem conhecer a de R, opte pr I~ ~~traté-
gia de maxmin A2 .
o exemplo acima mostra o principal problema na associa-
çao entre comportamento racional e equilíbrio de Nash. Para al-
guns participantes do jogo, pode ser extremamente imprudente es-
colher estratégias conducentes a um tal equilíbrio sem a garantia
de que todos os demais jogadores façam o mesmo, o dilema do joga-
dor A no exemplo acima. A explicação convencional usada para as-
(+) Para identificar um equilíbrio de Nash num jogo bi-matricial, há uma regri Rrática muito simples: basta descobrir uma casa onde o ganho de A seja máximo na coluna e o de B máximo na linha.
.26.
sociar racionalidade pm jogos nao cooperativos a equilíbrio de
Nash consiste em engajar cada jogador num exercício mental. Cada
um veste não só a própria pele, mas também a dos parceiros, ,
so
parando a indagação sobre "eu penso que você pensa que eu penso
que você pensa" quando se chegar a urna combinação de estratégias na
qual ninguém possa lucrar mudando unilateralmente a sua decisão".
Infelizmente essa explicação nada explica, pois ela equivale a
postular que comportamento racional é acertar um equilíbrio àe
Nash na mosca. De resto, o exercício mental só faz sentido se se
admitir (o que é uma hipótese gratuita num jogo de informação im-
perfeita) que os demais parceiros se envolvam num exercício seme-
lhante.
, Quanto maior o numero de participantes de um jogo nao
cooperativo sem estratégias dominantes ou onde o equilíbrio de
Nash não corresponde a uma combinação de estratégias de maxmin,
mais temerário se torna escolher uma estratégia conducénte a um
tal equilíbrio sem a garantia de que os demais decidam da mesma
forma. Um exercício interessante jogo da metêoc da média.
N pessoas são convocadas a e2~rp.ver num ped?;o np. ,
naneI um nume-
ro real no intervalo fechado [O;l]. , por x. o numero e~
1
colhido pelo iésimo participante (que deve escoll1er xi desconhe
cendo a opção dos demais), computa-se a metade s da média:
s :; _1_
2N
N E
i:;l
o ganho de cada jogador sendo:
S. 1
i) 100 dólares, se xi :; s, isto é, se sua escolha ti
ver coincidido da metade da média;
ii) O, se x. > s, isto é, se sua escolha tiver ultrapas-1
sado metade da média;
iii) -100 dólares (perda) se
lha ficar abaixo da metade da m~dia.
X. 1
< s,
.27.
icto ~ se sua esco-
É fácil verificar que o único equilíbrio de Nash se al-
cança quando todos os jogadores escrevem zero no seu papelucho
individual. Se todos agirem dessa forma, cada qual ganhará 100
dólares. Sucede que basta que um jogador escreva um número acima
de zero para que quem tiver escolhido zero fique abaixo da m~-
dia e com isso perca 100 dólares, ao inv~s de ganhar a mesma
quantia. Isso ~ o suficiente para que agentes racionais, mas com
um mínimo de prudência, prefiram errar por excesso do que por
falta, já que o excesso nada lhes custa. É muito fácil testar es-
se jogo numa sala de aula com alunos pós-graduados de matemática,
engenharia ou economia. E, desde que se impeça qualquer comunica-
ção entre os participantes, como se supoe na teoria dos jogos nao
cooperativos, ~ muito improvável que se chegue imediatamente ao
equilíbrio de Nash.
Um terceiro exemplo em que a associação entre rac;ona-
lidade e equilíbrio de Nash ~ mais do que problemática, e forne-
cido pelo jogo bi-matricial:
(-20;-20) (15;-15)
(-15;15) (10;10)
primeiro muito bom para o jogador A mas muito ruim para o jogador
B e vice-versa. Como coordenar o jogo, eis um problema que trans-
.28.
cende a idéia de equilíbrio de Nash. Com efeito, se o primeiro
jogador tentar forçar o que lhe é o melhor equilíbrio de Nash,
jogando Ar' e o segundo agir da mesma forma jogando Br' o resul
tado será o pior dos mundos para ambos, com ganhos negativos
(-20;-20). O bom senso sugere que a melhor combinação para ambos
é (Arr;Brr ). Trata-se de uma combinação de estratégias de maxmin,
mas não de um equilíbrio de Nash.
A discussão precedente sublinha um ponto essencial:
salvo em casos especiais, o que seja comportamento racional num
jogo não cooperativo é um conceito ambíguo. A matemática, que
não tolera ambigüidades, explora amplamente as propriedades da-
quilo que se pode definir com precisão, um equilíbrio de Nash.
Resta apenas lembrar que o conceito de equilíbrio de Nash é o de
sabedoria a posteriori: uma combinação de estratégias que, termi-
nado o jogo, não deixa ninguém arrependido. Trata-se, ~e certo
modo, de uma associação espúria entre Aristóteles e Darwin, e que
qualifica como racional quem sobreviveu à seleção natural. E que
d8j~a sem resposta o que realmente constitui a indagação rel~~an
te: como agir no presente para escapar ao arrependimer.tv futuro.
.29.
1.6} Jogos repetidos
Cuidemos agora dos superjogos, isto é, dos jogos repe
tidos. Na presente secção analisaremos especificamente o seguin-
te super jogo: "um mesmo jogo bi-matricial é repetido p vezes; ao
final de cada etapa, cada participante torna conhecimento da es-
tratégia escolhida pelo outro. O ganho final de cada jogador , e a
média aritmética dos ganhos contabilizados em etapa".
A diferença entre o superjogo e p repetições indepen-
dentes do mesmo jogo está no conceito de estratégia, pelo menos
quando se supoe memória perfeita. De fato, há agora dois concei-
tos a distinguir, o de estratégia no superjogo e o de escolha em
cada jogada. Estratégia, no superjogo, é um plano de açao para
cada jogada, função da história até então conhecida do jogo.
Para esclarecer a questão, consideremos o jogo bi-matri
cial em que cada jogador dispõe de duas estratégias:
Consideremos o super jogo correspondente a dois lances
sucessivos desse jogo bi-matricial. No primeiro lance, é óbvio que
cada participante dispõe apenas de duas opções possíveis, ou
A2 para o primeiro, BI ou B2 para o segundo. No segundo lance, PQ
rém, cada jogador pode formular sua escolha em função do que ti-
ver ocorrido no primeiro. Isso aumenta, não de dois para quatro,
.30.
mas de dois para oito, o leque de estratégias de cada participante
do superjogo. De fato, os possíveis planos de A para o superjogo
sao agora:
Estratégia de A lQ lance 2Q lance, se no lQ B tiver escolhido
Bl B2
AI AI AI AI
AlI AI AI A2
AlII AI A2 AI
AIV AI A2
A2
~ A2 AI Ar
~I A2 Ar A2
~lI A2 A
2 AI
~lll A2
A2
A2
Da mesma maneira, os possíveis planos de jogo para B sao:
r Estratégia de B
I BI
BIl
BIll
Brv
BV
BVI
BVII
BVllI
12 lance 22 lance, se no lQ A ti~cr
.31.
Assim por exemplo, a combinação de e~tratégias (AIII,BV
)
implica as realizações (A l ,B2 ) no primeiro lance, (A2
,Bl
) no se
gundo. A combinação (AVI,BVII) leva às realizações (A2
,B2
) e
(A2 ,B l ), e assim sucessivamente. Com um pouco de paciência, é fá
cil verificar que os ganhos no superjogo em questão são dados por:
BI BII BIII BIV BV BVI BVII BVIII
AI a a e e e e b b
AlI a a e e h h 1- i
AIII f f g g e e b b
AIV f f g g h h i i
AV f h f h g i g 1-
~I f h f h j d j d
~II c j c j g i g 1-
AVIII c j c j j d j d
onS0:
a = (all;bll )
b = (a12 ;b12 )
c = (a 2l ;b2l )
d = (a 22 ;b22 )
e = (O,5(a ll+a12 ); O,5(bll +b12 »
f = (O,5(all+a 21 ); O,5(bll+b2l »
g = (O,5(a ll+a 22 ); O,5(b2l +b22 »
h = (O,5(a12+a 21 ); O,5(b12+b2l »
i = (O,5(a12+a 22 ); O,5(b12+b22 »
j = (O,5(a 2l+a 22 ); O,5(b2l+b22 »
.32.
Até que ponto é vantajoso para cada jogador condicio
nar cada lance à história conhecida do superjogo é questão a dis-
cutir. Em alguns casos a resposta é positiva, noutros negativa.
De qualquer forma, a especificação das estratégias no superjogo
cobre os dois tipos de comportamento. Assim, no exemplo apresen-
tado,as estratégias AI' AIV ' AV e AVIII do primeiro jogador (as
sim corno as correspondentes do segundo) estabelecem um comporta-
mento determinístico, no sentido de que as decisões do primeiro
jogador independem do que o parceiro resolver no primeiro lance.
Já as estratégias AlI' AIII , AVI e AVII tornam o segundo lance do
primeiro jogador dependente do primeiro lance do segundo.
Suponhamos que a combinação de estratégias (A , B ) r s
seja o único equilíbrio de Nash de um jogo bi-matricial. Tornemos
o super jogo correspondente a p lances consecutivos do jogo bi-ma-
tricial, cada participante (cuja memória se supõe perfeita) sendo
informado ao cabo de cada lance da escolha do outro. É claro que,
nesse caso, a combinação de estratégias (AR,BS ) onde AR e BS sig-,
n ~[icam escolher incondicionalmente A e B em todos os 12:"~ds e r s
~',.,., ~~'.lilíbr io de Nash do super jogo. Resta indagar se 1""" <=>y; stem
outros equilíbrios de Nash no super jogo em questão. Para t~~to,tº
memos o jogo bi-matricial:
(20;20)
(18;18)
(-20;20)
(16;16)
o único equilíbrio de Nash é (Al;B l ). Consideremos o
superjogo correspondente a dois lances consecutivos desse jogo
I
\
.33.
bi-matricial, os ganhos finais de cada participante sendo ,
a me-
dia aritm~tica dos ganhos contabilizados em cada lance. O super
jogo descreve-se, na forma estrat~gica, por:
Ar I (20; 20) 1I (20; 20) I (O; 20)
AlI [(20;20) 11(20;20) 1 (0;20)
(0;20) (0;20) (0;20) (-20;20) (-20;20)
(0;20) (-1;19) (-1;19) (-2;18) (-2;18)
Arrr (19;19) (19;19) (18;18) (18;18) (0;20) (0;20) (-20;20) (-20;20)
Arv (19;19) (19;19) (18;18) (18;18) (-1;19) (-1;19) (-2;18) (-2;18)
Av (19;19) (-1;19) 1(19;19)J (-1;19) (18;18) (-2;18) (18;18) (-2;18)
Avr (19;19) (-1;19) 1(19;19)1 (-1;19) (17;17) (16;16) (17;17) (16;16)
Avr (18;18) (17;17) (18;18) (17;17) 1(18;18)1 (-2;18) 1(18;18)1 (-2;18)
Avrrr (18;18) (17;17) (18;18) (17;17) (17;17) (16;16) (17;17) (16;16)
Para identificar os equilíbrios de Nash nessa bi-;,':..triz
8 x 8 basta aplicar o crit~rio pr~tico j~ enunciado e~ -~.~ de
rodap~; uma casa ~ equilíbrio de Nash se e somente se nem A ~udeL
!c61horar na coluna nem B puder melhorar na linha correspondente.
Encontram-se assim os oitos equilíbrios de Nash envolvidos
retângulos:
Equilíbrio Realizações em cada lance
(Al;B l )
(Al;B l )
(Al;Bl )
(Al;B l )
(Al;Bl )
em
.34.
Equilíbrio Realizações em cada lance
I!! 2!!
(Arr;B rr ) (Al;B l ) (Al;B l )
(Av;B rrr ) (A2 ;Bl
) (AI;B I )
(Avr;Brrr) (A2 ;Bl
) (AI;B I )
(Avrr;Bv ) (A2
;B2
) (AI;B l )
(Avrr;Bvrr) (A2
;B2
) (Al;B I )
Todos esses equilíbrios retratam s~bedoria a posteriori,
no sentido de que, dada a estratégia do parceiro, ninguém se ar-
repende do que fez. O exercício serve para mostrar corno a repeti-
ção de um jogo pode ampliar o número de equilíbrios de Nash.
Resta examinar corno cada um desses equilíbrios adere , a
noçao comum de racionalidade a priori. Para tanto, lembremos as
características do jogo bi-matricial (2x2) que deu origem ao su-
perjogo; i) B dispõe de urna e~tratégia dominante BI' mas pouco
tem a pc,-::er se escolher :8 2 ; ii) (AI;BI ) é o único equilíbrio de
Nash, jogar AI e o parceiro jogar
B2 ; iii) jogando A2 , c primeiro jogador deixa de ganhar se B
optar pela sua estratégia dominante BI ; mas defende-se com um sa
tisfatório maxmin caso B escolha B2 .
Isto posto, examinemos as estratégias de A e de B en-
volvidas nos oito equilíbrios de Nash no superjogo:
i) Ar: o primeiro jogador escolhe sempre a estratégia
AI' independentemente do que faça B no primeiro lance; trata-se
de uma opção temerária, caso B escolha B2 no primeiro lance;
.35.
ii) Arr: o primeiro jogador começa com AI' na suposição
de que o segundo opte pela estratégia dominante BI. Caso verifi
que que B agiu dessa forma, repete AI no segundo lance. Caso ob-
serve que, no primeiro lance, B escolheu B2 , passa no segundo , a
estratégia de maxmin A2 . Trata-se de uma estratégia sensata;
iii) AV: o primeiro jogador prudentemente toma a estraté-
gia de maxmin no primeiro lance, esperando com isso convencer o
adversário a escolher a estratégia dominante no segundo lance;
isso posto, joga AI no segundo lance. Trata-se de uma sinalização
algo arriscada, mas psicologicamente justifi6ável;
iv) Avr: no primeiro lance, o primeiro jogador caminha
prudentemente com a estratégia de maxmin A2 . No segundo passa pa
ra AloU repete A2 conforme o outro jogador tenha escolhido BI ou
B2 no primeiro lance;
v) Br: trata-se do modelo de comportamento racional pa
ra o segundo jogador, qual seja, optar pela sua estratégia domi-
nante;
vi) B1r
: e~0r~a nao se trate da estratégia dominante, B
pouco ~em a P0L~L- se adotá-la, ao invés de Br. A intenção é pu
nir o jogador A, caso 2~Le comece o primeiro lance com a estraté-
gia de maxmin: para tanto, B joga BI no primeiro lance e, no se
gundo, joga BI ou B2
conforme A tenha escolhido no primeiro lance
AloU A2
. Trata-se de uma estratégia psicologicamente compreensí
vel, ainda que fora do melhor padrão de comportamento racional;
vii) B1rr : trata-se de uma estranha variante da estraté-
gia Brr e que transforma a punição em pr~mio e vice-versa; B co-
meça com BI mas, no segundo lance, troca as bolas: premia A (e
possivelmente a si próprio) jogando BI , caso A, no primeiro lan
ce, tenha escolhido A2 , e vice-versa.
.36.
viii) BV: trata-se de um comportamento 0~tranho do segundo
jogador, que opta no primeiro lance pela estratégia dominada B2
;
ix) Bvrr: o segundo jogador se comporta de forma dupla
mente estranha, optando pela estratégia dominada no primeiro lan
ce, e reagindo à escolha de A no primeiro lance com o sistema de
prêmios e punições às avessas da estratégia Brrr.
Em SUffiu, dos oito equilíbrios de Nash, apenas as com-
binações (Arr;B r ) e (Arr;Brr ) envolvem comportamentos plausíveis
de ambos os jogadores. Nos outros seis, pelo menos um dos parti
cipantes se comporta de modo estranho. Já a combinação bem mais
atrativa ao senso comum (Avr;B r ) em que A é cauteloso e em que B
escolhe sempre a sua estratégia dominante não é um equilíbrio de
Nash.
Vejamos um outro exemplo, o do superjogo em dois lances
do jogo bi-matricial:
(-20;-20) (16;-16)
(-16;16) (10;10)
onde há dois equilíbrios de Nash conflitantes, (A l ;B 2 ) e (A2 ;B l )
o primeiro bom para A mas ruim para B, o segundo bom para B mas
ruim para A. O superjogo descreve-se pela bi-matriz 8 x 8:
.37.
Br Bn Brn Brv BV Bvr Bvn ~vrn
AI (-20j-20) (-20j-20) (-2j-18) (-2j-18) (-2j-18) ·(-2 j -18) 106j-16) 1 106j-16) I AlI (-20:-20) (-20j-20) (-2j-18) (-2j-18) 1 (Oj O) 1 (OjO) (13j-3) (13j-3)
AIII (-18j-2) (-18j-2) (-5j-5) (-5j-5) (-2j-18) (-2j-18) 06j-16) 06j-16)
AIV (-18j-2) (-18j-2) (-5j-5) (-5j-5) I(OjO) 1 (OjO) (13j-3) 03j-3)
AV (-18j-2) I( Oj O) 1 (-18j-2) I(Oj O) 1 (-5j-5) (13j-3) (OjO) (13j-3)
AVI (-18j-2) (OjO) (~18j-2) (OjO) (-3j 13) .<10j10) (-3j13) 00jl0)
AVII I (-16j 16) 1 (-3j 13) (-16j16) (-3j 13) (-5j-5) (13j-3) (-5j-5) (13j-3)
AVIII I (-16j16) 1 (-3j13) (-16j16) (-3j13) (-3j 13) (lOj 10) (-3j13) 00j10)
Os oito equilíbrios de Nash do superjogo realizam, nos
dois lances, os dois equilíbrios de Nash do jogo bi-matricial
(2x2), (AI
;B2
) ou (A2 ;Bl
) ou sucessiva ou alternadamente. O que
parece o compromisso sensato, a combinação de estrat~gids (A2 ;B 2 )
não ~ um equilíbrio de Nash do s .... J~erjogo.
Vale explorar algumas I,Toprieú~C~~ do super jogo corres-
pondente a duas jogadas sucessivas do mesmo jogo bi-matricial
m x n. No primeiro lance, o primeiro jogador escolhe a estrat~gia
r, o segundo a estrat~gia s; no segundo, o primeiro escolhe a es
trat~gia f(s), o segundo a estratégia g(r). Isto posto, uma es
trat~gia de A no superjogo ~ o par de números inteiros (rif(s».
Uma estrat~gia de B, o par (s,g(r». No caso, g(r) ~ uma função
definida no conjunto dos inteiros I a m e com valores no conjunto
dos inteiros· I a n; f(s) com domínio nos inteiros de I a n e com
valores nos inteiros I a m.
.38.
Suponhamos que o par de estrat~gias (r;f(s» (s;g(r) )
seja um equilíbrio de Nash do superjogo. Isso implica que, para
qualquer inteiro i de I a m, para qualquer inteiro j de I a n, e
para quaisquer funções de reação fi (s) e gl (r):
a rs a. 1S + a fl (s)g(i) (1)
( 2)
Particularizemos essas desigualdades tomando i=r e j=s.
Como as funções de reação podem ser escolhidas de modo a se ter
fi (s) igual a qualquer inteiro de I a m e gl (r) igual a qualquer
inteiro de I a n, segue-se, tomando i=r e j=s, que:
(p= I, ... , m)
(q= I, ... , n)
Isso significa que o equilíbrio de Nash do super jogo
realiza, n0 lance final, um 2quilíbrio de Nash do jogo bi-matri-
cial c .... :iginal, como ~_usinuam os dois exemplos acima discutidos.
J~ para o p~jmeiro lance, nao se pode assegurar que a
realização do equilíbrio de Nash no superjogo também seja um e-
quilíbrio de Nash do jogo bi-matricial. A razão, analiticamente
explicada pelas desigualdades (1) e (2), é que, ao alterar a es-
colha no primeiro lance, cada jogador pode levar o parceiro a al-
terar a escolha do segundo lance.
Não obstante, é possível obter uma desigualdade muito
importante quanto aos ganhos no primeiro lance. Designemos por:
WA af(s)g(r)
wB ::::: bf(s)g(r)
·39.
Corno foi visto, esses sao os ganhos correspondentes a
um equilíbrio de Nash do jogo bi-matricial simples. Observemos a-
gora que, qualquer que seja a função de reação g(i) do segundo ,
jogador a primeira jogada do primeiro, A pode escolher fI (s) de
modo a pelo menos lhe assegurar o seu maxm1n vA
. Do mesmo modo,
B pode escolher gl(r) de modo a garantir seu maxmin vB
. Isto pos
to, as desigualdades (1) e (2) levam a:
a + wA ~ a. + v A rs 1S (i=l, ... ,m)
(j=l, ... ,n)
Num caso particular, essas desigualdades levam a uma
conclusão extremamente importante, aquele em que todo equilíbrio
de Nash também é um equilíbrio de maxmin, no sentido de que
WA=vA e wB=vB . Nesse caso, pode-se assegurar que um equilíbrio de
Nash do superjogo realiza, desde o primeiro lance, um equilíbrio
de Nash do jogo matricial.
É fácil estp~0e~ a demonstração acima em duas direções:
do mesmo jogo de 2 para p,
sendo pu!;; inteiro p2sitivo. (Basta, para tanto, quebrar o super-
jogo em dois lances de um ~rimeiro jogo bi-matricial correspon-
dente ao primeiro lance, e um segundo correspondente aos p-l úl-
timos lances, e então raciocinar por indução finita); ii) esten-
dendo de 2 para N o número de jogadores. Conclui-se que, se qual-
quer equilíbrio de Nash é também um equilíbrio de maxmin, então o
superjogo, em matéria de equilíbrios de Nash, é equivalente, em
matéria de realizações, a p repetições independentes do mesmo jo-
. , go. Em suma, nesse caso, n1nguem tem o que ganhar condicionando
suas decisões à história conhecida do jogo.
,,----------------- -- -
.40.
o equilíbrio de Nash de um jogo bi-matricial é um equi
líbrio de maxmin em dois casos particulares: i) nos jogos em que
cada jogador dispõe de urna estratégia dominante; ii) nos jogos
de duas pessoas-sorna zero com ponto de sela. Isso leva à conclu-
sao de que, nesses casos, a repetição é incapaz de trazer novida-
des em matéria de equilíbrios de Nash.
No caso dos jogos de duas pessoas-sorna zero com ponto
de sela, a conclusão nada tem de surpreendente. Afinal, se, em ca-
da lance, A pode garantir um ganho mínimo vA e B um ganho mínimo
vB' sendo vA+vB=O, não há por que imaginar que a repetição do jogo
possa trazer qualquer novidade, quer o jogo seja repetido ,
um nu-
mero finito ou infinito de vezes. De fato, o único sentido da re-
petição é dar consistência prática ao conceito de estratégias
mistas em jogos matriciais sem ponto de sela, assunto de que tra-
taremos na próxima secção.
Já no caso do dilema dos prisioneiros, em que a estra-
tégia dominante é confessar, e conclusão é decepcionante. Com e-
feito, ~~ria de se p~ep~mir que a repetição levasse à cooperaçao.
Contuà~" corno '-.:~ .... rata de um jogo em que o equilíbrio de Nash
coincide com o de maxnl~ 1 1 , em qualquer equilíbrio de Nash do dile-
ma dos prisioneiros repetido um número finito de vezes, a apeli-
dada "estratégia de disparo", na qual nenhum confessa até ser in-
formado de que o parceiro confessou no lance anterior, confessan-
do daí por diante, é visivelmente superior ao "confessar sempre"
de qualquer equilíbrio de Nash. Apenas, no dilema dos prisionei
ros repetido um número finito de vezes, a estratégia de disparo
nao é equilíbrio de Nash. Da mesma forma, no jogo bi-matricial
com equilíbrios de Nash conflitantes:
.41.
(-20;-20) (16;-16)
(-16;16) (10;10)
A combinação prudente e cooperativa (A2 ;B 2 ) nao fornece
um equilíbrio de Nash se o jogo só for repetido um número finito
de vezes. A estratégia de disparo, no caso, seria A jogar A2
en
quanto B jogasse B2 e vice-versa, cada qual tratando de punir o
outro que tomasse a iniciativa de querer lucrar à custa do prejui
zo do outro.
Esse impasse leva ao estudo dos jogos nao cooperativos
repetidos por um número infinito de vezes. Aí sim, as estratégias
de disparo se transformam em equilíbrios de Nash. No dilema dos
prisioneiros, cada um nega até que o outro confesse, e daí por
diante confessa. A combinação dessas estratégias no jl':Jo infini-
tamente repetido é um equilíbric ~e Nash, par~ o.~uJio dos matemá-
ticos. E, cuja realização prát<"':d é a r"!..~. ~:cnciCt Ud racionalida-
de coletiva sobre a individual já q~e ninguém c~nfessa em qual-
quer lance do jogo. Na mesma linha, no jogo bi-matricial com e-
quilíbrios de Nash conflitantes anteriormente apresentado, a com-
binação de estratégias em que A escolhe A2 enquanto B escolher
B2 passando para AI quando B tiver escolhido Bl e vice-versa,
um equilíbrio de Nash do super jogo infinitamente repetido.
, e
Na realidade, a teoria dos jogos infinitamente repeti-
dos é bem mais consentânea com o comportamento do mundo real do , ,
que a dos jogos que acabam apos um numero finito de iterações. A
diferença resulta de que, no último caso, os participantes do jo-
.42.
go substituem a reputação pelo egoísmo na últim~ jogada. Por que
os mortais não agem dessa maneira descrita nos jogos finitamente
iterados, explica-se por tr~s razoes: a) ningu~m sabe o dia exa
to da morte; b) não falta quem creia na vida eterna; c) mesmo
os agnósticos podem querer deixar urna herança de honorabilidade e
reputação individual.
.43.
1.7) Estratégias mist3s
A análise precedente omitiu uma indagação essencial, a
existência de equilíbrios de Nash em jogos bi-matriciais. Infe-
lizmente tal existência não pode ser assegurada, pelo menos na
medida em que o jogo é descrito como "A escolhe uma linha e B u
ma coluna do par de matrizes." A título de exemplo, tomemos o jo
go bi-matricial:
(10;6)
(9;4)
(4;8)
(10;3)
Em qualquer das quatro casas do par de matrizes, ou A
pode melhorar mudando de coluna ou B pode aumentar seu ganho mu
dando de linha. Isso significa que nenhuma das quatro combinações
possíveis de estratégias puras ~ um equilíbri 0 de Nash.
Na mesma linha, tomem02 o jogo d~ ~~ns pessoas-soma ze
ro, onde os ganhos do primeiro jogador são dados por:
1
-1
-1
1
A matriz em questão nao possui nenhum ponto de sela,
1-.44.
isto é, um elemento que seja ao mesmo tempo mínimo de linha ,
e ma-
ximo de coluna. O que seja comportamento racional, no caso, , e uma
questão insolúvel, no sentido de que A pensará com seus botões:
IIse eu escolher AI o melhor para meu adversário será escolherB2
;
mas se ele optar por B2 , melhor para mim será escolher A2 ; nesse
caso, a melhor escolha de meu adversário será Bl , e aí o melhor
para mim é voltar para AllI. B enfrenta o mesmo dilema.
Para contornar o problema, von Neumann inventou o con-
ceito de estratégia mista, como tal entendida uma distribuição
de probabilidades no conjunto das estratégias puras. Para ilus-
trar a questão, comecemos com os jogos bi-matriciais 2 x 2, do
tipo:
'-------
Se A escolhe AI com probabilidade l-x e A2 com probabi-
lidade x (O ~ x ~ 1) e se B escolhe Bl com probabilidade l-y e
B2
com probabilidade y (O ~ y ~ 1), tem-se um
cujas possíveis realizações sao:
(Al;B l ) com probabilidade (l-x)(l-y)
(Al ;B 2 ) com probabilidade (l-x)y
(A 2 ;B l ) com probabilidade x(l-y)
(A 2 ;B 2 ) com probabilidade xy
jogo aleatório,
• .45.
Isto posto, os ganhos esperados de A e B sao:
w(A) = (l-x)(l-y)all + (l-x)y a 12 + x(l-y) a 21 + xy a22
w(B) = (l-x)(l-y)bll
+ (l-x)y b12
+ x(l-y) b21
+ xy b22
Um equilíbrio de Nash é agora uma combinação de estra
tégias mistas, uma para cada jogador, tal que nem A possa aumen
tar seu ganho espêrado modificando unilateralmente x, nem B possa
aumentar seu ganho esperado modificando unilateralmente y. No ca
so de jogos bi-matriciais com apenas duas estratégias puras para
cada jogador é fácil calcular o equilíbrio de Nash com estraté
gias mistas.
Com efeito, tomemos as derivadas parciais:
FA(y) dw(A)
(1-y)(a21
-all ) + y(a22
-a12
) . = = dX
FB(X) dw(B)
(l-x) (b12-bll ) + x(b22-b21 ) = = dy
Num equilíbrio de Nash deve-se ter simultane~illente:
? O; se x = O
= O; se O < x < 1
O; se x = 1 ~
~ O; se y = O
= O; se O < Y < 1
<: O; se y = 1
No caso particular dos jogos bi-matriciais com apenas
duas estratégias puras para cada jogador, a existência de um
equilíbrio de Nash com estratégias mistas prova-se trivialmente.
Com efeito, das duas uma:
• .46.
a) pelo menos um jogador dispõe de urna estratégia domi-
nante: nesse caso, há um equilíbrio de Nash com estratégias pu-
ras (que são casos particulares de estratégias mistas), construí-
do da seguinte forma: i) o jogador que dispõe de estratégia domi-
nante escolhe essa estratégia; ii) presumida essa escolha, o ou-
tro jogador toma a estratégia que lhe dê o maior ganho possí-
vel;
b) nenhum jogador dispõe de uma estratégia dominante:
nesse caso, (a21-all)(a22-a12) < O e (b12-bll)(b22-b21) < O. Sg
gue-se que FA(O)FA(l) < O e FB(O)FB(l) < O. Como as funções
FA(y) e FB(X) são lineares, e portanto contínuas, existem x€(O;l)
e i€(O;l) tais que FA(y) = FB(x) = o. Os valores de x e y sao ex-
pressos, no caso por:
x = y =
Assim, por exemplo, no jogo bi-matricial já apres:,:õ·::é'd·:):
(10;6) (4;8)
(9;4) (10;3)
obtém-se x = 2/3, y = 1/7. No equilíbrio de Nash com estraté-
gias mistas,o primeiro jogador escolhe lotericamente as estraté
gias AloU A2
com probabilidades (1/3; 2/3), o segundo mistura
B e B com probabilidades (6/7; 1/7). Nesse equilíbrio, os ga-. 1 2
nhos esperados são:
64 w(A} = ;
7 w(B} = 14
3
·47.
Qual o significado prático do conceito de estratégia
mista, eis uma questão que dá panos para mangas. À primeira vista,
parece uma temeridade o jogador A misturar as estratégias para
obter um ganho esperado de 64/7, mas com o risco de ganhar apenas
4 (se se realizar a combinação de estratégias (Al ;B 2 }), ao . , lnves
de se ater à estratégia do maxmin,que lhe assegura um ganho pelo
menos igual a 9 = 63/7. Há duas escapatórias, cada qual com os
seus problemas.
A primeira, na linha de von Neumann e Morgenstern, con-
siste em admitir que os ganhos de cada jogador sejam medidos em
termos de utilidades e não em termos de pagamentos efetivos. As
utilidades transformam os pagamentos por meio de funções. que hie-
rarquizam as preferências de cada indivíduo diante de problemasde
escolha envolvendo risco, conforme se verá no Capítulo IV. Dentro
da t80ria, o objetivo de cada participante do jogo é o de maxirni·
zar a utilidade esperada, dadas as escolhas estratégic?~ dos de-
mais participantes. Isso dá pleno suporte à idéia de ~qtratés:~
mista. Surgem, no entanto, dois outros problemas. Primeiro, salvo
para os indivíduos indiferentes ao risco, a utilidade da média
nao é a média das utilidades. Isso torna bem mais complexa a teo-
ria dos jogos repetidos. Além do mais, em jogos nao repetidos,
torna-se essencial lembrar que jogos de duas pessoas - soma zero
não necessariamente são jogos de soma de utilidade zero. (Esse
é um ponto, aliás, muito importante, e que explica por que os po
bres não costumam jogar pôquer com os milionários).
A outra escapatória consiste em admitir que os jogos
sejam repetidos muitas vezes, e que a sabedoria das estratégias
.48.
mistas encontre abrigo na lei dos grandes números. o problema , e
que,· como se viu na secção anterior, um mesmo jogo repetido n ve-
zes não necessariamente equivale a n repetições independentes do
mesmo jogo. De qualquer forma, a idéia pode ser defendida pois,
como já se viu, a repetição de um equilíbrio de Nash no jogo for
nece um equilíbrio de Nash no superjogo.
Em qualquer hipótese, o conceito de estratégia mista
fornece uma pista para o que seja comportamento racional em jogos
onde não existem sequer equilíbrios de Nash com estratégias pu-
ras, como no caso da mini-porrinha.
Voltando ao caso dos jogos bi-matriciais com apenas
duas estratégias para cada participante, vale sublinhar um ponto
fundamental: é possível que existam, ao mesmo tempo, equilíbrios
de Nash com estratégias puras e equilíbrios de Nash com estraté-
gias mistas. A título de exemplo, voltemos ao jogo bi-matricial:
(-20;-20) (15;-15)
(-15;15) (10;10)
Há dois equilíbrios de Nash com estratégias puras
(Al
;B2
) e (A2
;Bl). Além do mais, como nenhum dos jogadores dis
põe de uma estratégia dominante, há um equilíbrio com estratégias
mistas, cada jogador combinando as suas duas estratégias com pro-
babilidades (1/2; 1/2), e obtendo ganhos esperados wA=wB=-5/2.
.49.
o conceito de estrat~gia mista se e3~ende naturalmente
para os jogos bi-matriciais com m estrat~gias puras para o pri-
meiro jogador e n para o segundo. Para tanto definamos o simplexo
k-l k fundamental S do R como sendo o conjunto dos vetores do
Rk com coordenadas nao negativas e de soma igual a 1:
k-l I S = {(Pl"" ,Pk) Pl ~ Oi •• • Pk ~ Oi Pl+'" .+Pk = I}
Uma estrat~gia mista primeiro jogador ,
para o e um vetor
E: m-l estrat~gia mista segundo jogador p S , uma para o um vetor
E: n-l Indicando p' a matriz lxm transposta da matriz q S • por co-
luna p, os ganhos esperados de cada jogador, combinando as estra-
t~gias puras de acordo com os vetores de probabilidade p e q, se-
rão dados por:
m w(A) = L
i=l
m w(B) = L
i=l
n L
j=l
n L
j=l
a .. p.q. 1.J 1. J
b .. p.q. 1.J 1. 1.
=
=
p'Aq
p'Bq
Isto posto, um equilíbrio de Nash define-se ,_._--UlT''''
combinação de estrat~gias (poiqo)' uma para cada jogador, --:"ll q,-le
nénhum deles possa aumentar seu ganho mudando unilateralmente de
e&trat~gia, isto ~, tal que:
p' Aq ~ P Aq o o o para
p' Bq ~ p' Bq o o o para
todo
todo
m-l p E: S
n-l q E: S
Note-se que um equilíbrio de Nash com estrat~gias pu
ras ~ tamb~m um equilíbrio de Nash no campo das estrat~gias mis-
tas. Com efeito, se a combinação (Ar,Bs) ~ um equilíbrio de Nash
no campo restrito das estratégias puras:
a rs ~ a.
1S
~ b . rJ
(i=l, .... ,m)
(j=l, .... ,n)
.50.
m .ésima Indicando por e i o vetor do R cuja 1 coordenada é
igual a 1 e as demais iguais a zero, e por f. o vetor do Rn J
cuja
.ésima d ' . J coor enada e 19ual a 1 e as demais iguais a zero, as desi-
gualdades acima equivalem a:
e' Af ~ e! Af r s 1 s
e " B f ~ e' B f . r s r J
(i=l, .... ,m)
(j=l, .... ,n)
Daí se segue que se p = (Pl' .... 'Pm) , e um vetor do
m-l S , isto é, um vetor com coordenadas não negativas e soma 1:
p.e'AF ~ p.e!Af 1 r s 1 1 S
(i=l, .•... ,m)
e por~anto, somando para i de 1 a m:
a = e'Af ~ p'Af rs r s s
Do mesmo modo se conclui que:
= e'Bf > e'Bq r s r
para qualquer q E Sn-l.
Do ponto de vista analítica, a mágica do conceito de e~
tratégia mista é que ele transforma o conjunto de estratégias de
cada jogador num subconjunto convexo e compacto do Rk
(o inteiro
k podendo variar de um jogador para outro). Com isso, consegue-se
provar a existência de pelo menos um equilíbrio de Nash não ape-
nas para jogos bi-matriciais, mas para jogos bem mais gerais de n
.51.
pessoas. Cuidaremos do assunto no Capítulo 3. A demonstração , e
bem mais sofisticada do que a acima apresentada para jogos bi-ma-
triciais com apenas duas estratégias para cada jogador, exigindo
a substituição da aritmética simples pelo teorema de Kakutani.
.52.
1.8) O Oligopólio de Cournot
Corno se disse anteriormente, a idéia de equilíbrio de
Nash num jogo não cooperativo é urna extensão do modelo de oligo-
pólio desenvolvido por Cournot em seu "Recherches sur les princi-
pes Mathématiques de la Théorie des Richesses" publicado em 1838.
Vale apresentar esse modelo.
Cournot admite um mercado onde n empresas concorram pa-
ra a produção de um produto homogêneo, onde a curva de demanda
inversa é p = f (Q), sendo Q o total das quantidades vendidas pe-
las n empresas por unidade de tempo. Designando por qi a quantidª , .
d d 'd 1 .eSlma 'd d e a pro UZl a pe a 1 empresa por unl a e de tempo, por
C.(q.) o custo de produção dessa quantidade e supondo que as quaQ 1 1
tidades vendidas sejam iguais às produzidas, o lucro da .ésima 1 e~
presa será dado por:
L. (q.) = pq. - C. (q.) = q.f(ql+q2+ ... +q ) - C. (q.) 1 1 111 1 n 1 1
A hipótese de Cournot é que cada empresa escolha 0_ de
modo a maximizar o seu lucro tornando corno dadas as G'-.ctntidades
produzidas pelas concorrentes. Isso equivale a tratar o 0]igopó-
:Iio corno um jogo não cooperativo em que o campo de estratégias de
cada participante é o conjunto dos reais não negativos. Um equi-
líbrio de Cournot é assim um equilíbrio de Nash.
Na discussão que se segue suporemos que L.(q.) seja con 1 1
tínua em todas as suas variáveis, côncava em ql' e que L.(q.) ten-1 1
do a menos infinito quando qi tende para o infinito (esta última
hipótese pode ser substituída pela de que cada empresa possua um
limite máximo de produção q., o que restringe o campo de estraté-1
gias de cada participante ao intervalo fechado o ~ q. ~ q.). 1 1
.53.
Com essas hip6teses, prova-se que existe pelo menos um equilíbrio
de Cournot.
e,
No caso de a função L.(q.) ser diferenciável: 1 1
aLo 1
aq. 1
= q.f'(Q) - C~(q.) + f(Q) 1 1 1
Num equilíbrio de Cournot deve-se ter:
aLo ~ O, se q. = q. 1 1 1
aq. = O, s.e O < q. < q. 1 1 1
~ O, se q. = O. 1
obviamente Q == ql+q2+···+q n·
Vejamos alguns exemplos:
Exercício 1: Um produto é fornecido por n empresas com
iguais curvas de custos C.(q.) = cq., e que se comportam como 0-111
ligopolistas de Cournot. A função demanda inversa é P= max{a-bQ;O}
sendo b > O a > c > O. Determj !'-':.(" os preços, qllê'!'". cidades produ-
zidas e lucros no equilíbrio.
Solução
A função L.(q.) == q.(a-bQ) - cq. é diferenciável, sendo: 111 1
aLo ].
aq. 1
= a-c-b(Q+q.) 1
É impossível: a) que nenhuma empresa produza quantida-
des positivas, pois, isso implicaria a-c-b(Q+qi) = a-c~O, contra
riamente à hipótese a > c > Oi b) que algumas empresas produzam
quantidades positivas e outras nada produzam, pois isso implica-
.54.
ria a-c-bQ ~ a-c-b(Q+q.) para algum q. > 0, o que implicaria b ~ 0, .11
também contrariamente à hipótese. Logo, todas as empresas produ-
zem quantidades positivas, e portanto:
a-c-bQ = bq. 1
Q, segue-se que:
Q =
p =
nq. = 1
a+nc
n+l
n
n+l
L. (q.) = (p-c) q. = 1 1 1
a-c
b
1
Todas as empresas produzem a mesma quantidade, o que
nao chega a ser surpreendente, já que todas elas possuem iguais
curvas de custos. Mais ainda, como os custos marginais sao cons-
tantes iguais a c, quando n tende para o infinito o preço tende
ao de p:;,':.i.líbrio compAtitivo p=c e não apenas o lucro de cada em-
preSd.
zero.
wa::> v , '.:"':::'-- .:!O co .. j U.H l.U uas empresas nL. (q.), converge 1 1
para
A suposição de que empresas com iguais curvas de custo
produzem quantidades iguais num equilíbrio de Cournot não necessª
riamente é verdadeira, como se depreende do exemplo abaixo.
Exercício 2: Um produto, cuja função demanda inversa é
p = max{lO-Q;O} é suprido por uma indústria com 31 empresas, to-
das elas com a mesma curva de custos:
q.+l 1
se
C(q.) = ° se q.=O 1 1
q.>O 1
• .55.
Achar o preço do produto, a produção de cada empresa e
o lucro de cada uma delas num equilíbrio de Cournot.
origem:
Solução: Notemos que a função lucro é descontínua na
L.(q.) = q.(lO-Q) 111
ql· - 1 = 9q.-q.Q -1 se q. > O 111
L.(q.) = O se q. = O. 111
Suponhamos que num equilíbrio de Cournot haja n empre-
sas com produção positiva e 3l-n empresas com produção zero
(O~ n ~ 31). Para as empresas com produção positiva deve-se ter:
aLo 1
aq. 1
= 9-Q-q. = O 1
Daí se segue, somando de 1 a n:
Q = nq. = 1
p = lO-Q =
9n
n+l
n+10
n+l
L.(q.) = (9-Q)ql·- l = 1 1
~
bi-(n~l)~
(n+l)2
Como qualquer empresa dispõe da opçao de nada produzir
e ficar com lucro zero, num equilíbrio de Cournot L.(q.) não pode 1 1
ser negativo. Daí se segue que o número de empresas com produção
positiva é menor ou igual a 8.
Designemos agora por Q a quantidade produzida pelas em-
presas. Dentro do conceito de equilíbrio de Cournot, uma empresa
com produção zero (e portanto com lucro zero) não deve poder con-
.56.
seguir aumentar seu lucro entrando no mercado com uma produção
positiva q, supondo que essa sua decisão não altere Q. Isto pos-
to, entrar no mercado com uma quantidade q implica rebaixar o pr~
ço do produto para p=lO-Q-q e obter um lucro:
L(q) = q(lO-Q-q) - q - 1 = _q2 + (9-Q) q - 1
Num equilíbrio de Cournot, essa expressa0 deve ser me-
nor ou igual a zero para qualquer q ~ O. Isso exige:
2 (9-Q) - 4 ~ O
ou seja, Q ~ 7. Tomando a expressa0:
Q = 9n
n+l
e lembrando que n é inteiro, conclui-se que, num equilíbrio de
Cournot, n ~ 4.
Daí se conclui que existem, no caso, múltiplos equilí-
b~jos de Cournot, com n=4, n=5, n=6, n=7, n=8, onde o tota1 prc-
duzido, o preço e o lucro de cada empresa com produç2.0 positiva
L.(q.) sendo indicados na tabela abaixo. 1 1
n Q p
4 36/5 14/5
5 45/6 15/6
6 54/7 16/7
7 63/8 17/8
8 8 2
L. (q. ) 1 1
56/25
45/36
32/49
17/64
O
.57.
A existência de equilíbrios com n=4, n=5 e n=6 sur-,
preende a primeira vista. Com efeito, em qualquer desses casos
alguma das 31-n empresas com produção zero poderia entrar no mer-
cado e conseguir um lucro positivo. O problema , e que, no oligo-
pÓlio de Cournot, cada empresa admite que as suas decisões de
produção não afetem as quantidades produzidas pelas demais empre-
sas, e isso leva uma empresa com produção zero a nao entrar no
mercado desde que n ~ 4. Sucede que essa suposição nao se rea-
lizai a produção de cada empresa em operação é qi = Q/n = 9/(n+l),
caindo quando uma nova empresa passa a produzir quantidades po-
sitivas.
O exemplo acima salienta a principal debilidade do mo-
delo de oligopólio de Cournot: ele parte de uma premissa de com-
portamento e chega à conclusão contrária. Na premissa, as empre-
sas supoem que as suas decisões de produção não afetem as das
concorrentes. Na conclusão, o que cada empresa decide afeta o
comportamento das demais.
Vejamos ago~a d~is exemplos onde as empresas possuem
1 · - '. ~ .~ ~. ~ d-um l.JULl.Ç lIIa)(1Tl".'::; :: (::lpa'--..Lu.uu~ ue pro uçao.
Exercício 3: Um produto, cuja curva de demanda inversa
é expressa por p = max{7-2QiO}, é suprido por três empresas, todas
elas com capacidade máxima de produção q. = 1, e com curvas de 1
custos Cl(ql) = ql' C2 (q2) = 2q2' C3 (q3) = 3q3· Determinar as quan
tidades produzidas, o preço e o lucro de cada empresa no equilí-
brio de Cournot.
Solução:
Os lucros das três empresas sao dados por:
.58.
LI (ql,q2,q3) ql(7-2ql-2q2-2q3)-ql 2 = = 6ql-2ql-2qlq2-2qlq3
L2 (ql,q2,q3) q2(7-2ql-2q2-2q3)-2q2 2 = = 5q2-2q2-2qlq2-2q2q3
L3 (ql,q2,q3) q3(7-2ql-2q2-2q3)-3q3 2
= = 4q3-2q3-2qlq3-2q2q3
Segue-se que:
aLI 6 4ql 2q2 2q3 = - - -
aql
aL 2 5 4q2 2ql 2q3 = - - -aq2
aL3 4 4q3 2ql 2q2 = - - -aq3
aL.
{: o, se q. = I
1
No equilíbrio deve-se ter 1 O, O I se < q. < aq.
1
1 O, se q. = O 1
Encontra-p~ ql=l. Q2=2/3, q3=1/6. Segue-se que p=10/3,
:". =8/9; L,
Exercício 4: O mercado de água mineral numa
suprido por n empresas com capacidade máxima de produção
região
q. 1
, e
=
= I (i=I,2, ... ,n) e que operam com custo zero. A demanda de , agua
mineral é dada por Q = 100/p. Achar a produção e o lucro de cada
empresa no equilíbrio de Cournot .
. ésima ' Solução: O lucro da 1 empresa e dado por:
O, se qi = O
100qi ------------, se qi > O
ql + ... +qn
.59.
Daí se conclui que nao interessa a nenhuma empresa dei-
xar de produzir alguma quantidade positiva. Isto posto,
Li (ql,q2,···,qn) é função crescente de qi' dadas as quantidades
produzidas pelos demais concorrentes. Portanto interessa a cada
empresa produzir o máximo permitido por sua capacidade. Isso
significa que, no equilíbrio de Cournot,ql = q2 = •••• = qn = 1 e
L = L = 1 2 = L = 100/n. n
Note-se que, no caso, o equilíbrio de Cournot é também
um equilíbrio de maxmin. Com efeito, designando por q. a produção ~
.ésima da ~ empresa e por Qi = Q-qi a de suas concorrentes:
L. (q. ,Q. ) = 100 ~ ~ ~
q. ~
q.+Q. ~ ~
sendo função decrescente de Qi e crescente de qi· Como O ~ ql ~ 1
e O ~ Q. ~ n-l: ~
max min
q. Q. ~ ~
L.(q.,Q.) = ~ ~ ~
100
n
.60.
·1.9) Jogos Cooperativos
Cuidemos agora dos jogos cooperativos, isto é, aqueles
em que os participantes podem comunicar-se antes do jogo, vincu-
lando-se por contratos e coalizões. Tais jogos podem comportar
várias especificações diferentes que serão estudadas ,
em cap1.tu-
los posteriores. Neste capítulo introdutório cuidaremos de um ú-
nico tipo, os chamados jogos cooperativos com utilidades transfe-
ríveis. Tais jogos permitem transferências de ganhos entre os
participantes e admitem que a transferência de urna sorna T do jo-
gador i para o jogador j aumente em T a utilidade de j e diminua
também em T a utilidade de i.
Especificamente, suponhamos um jogo com n participan-
tes e indiquemos por N o conjunto dos jogadores. Por hipótese, o
campo de estratégias de vários participantes
L2 (Xl
'X2
' .... ,xn
), ... , Ln (x l ,x2 ' .... ,xn ) são funções contínuas de
suas variáveis.
A teoria dos jogos cooperativos parte de n~;~ con-
'L..' • uas1.Cos:
a) o maxmin v. de cada jogador, isto é, o ganho que ele 1.
pode garantir para si quaisquer que sejam as estratégias esco-
lhidas pelos demais participantes. Designando por Yi o vetor das
estratégias dos demais jogadores, isto é, Yi = (xl' .... ,xi-l,x i + l '
, ••• ,X ), tem-se que: n
Logo:
v. = max 1. min
x. y. 1. 1.
= F.(x.,y.) 1. 1. 1.
F.(x.,y.) 1. 1. 1.
.61.
b) o valor v(N) do jogo, isto é, o ganho máximo conjun-
to que os participantes podem obter coordenando as suas decisões:
v(N) = n r
i=l L.(X1 ,···,X) ~ n
A existência do maxmin de cada jogador bem como do va-
lor do jogo é assegurada pelo fato de os campos de estratégia de
cada jogador serem compactos e os ganhos serem funções contínuas
das estratégias escolhidas.
Note-se que, se todos os jogadores escolherem uma combi-
naçao (xi,x2, ... ,x~) de estratégias de maxmin, o ganho de cada um
deles será maior ou igual a vi' isto é:
n Como r
i=l
Segue-se que:
Vl+V~+ ••. ~V ~ v(N) _;' n
Essa desigua~~~de leva à divisão dos jogos em dois gru-
pos:
a) jogos inessenciais:
b) jogos essenciais:
Nos jogos inessenciais nao há qualquer espaço para coo-
peraçao. Com efeito, nenhum jogador tem razoes para aceitar um
.62.
ganho inferior ao seu h.3xmin e a união de forças nao permite
que nenhum deles ganhe mais do que o maxmin. O , .
exerclclo 4 da
secçao anterior, o do mercado de água mineral, fornece um exemplo
típico de jogo inessencial. O lucro máximo que o conjunto dos n
produtores pode obter é igual a 100 e o maxmin de cada um deles
é igual a 100/n.
Concentremo-nos pois nos jogos essenciais de n pessoas.
É de se presumir que os ganhos sejam distribuídos de acordo com
dois princípios:
i) racionalidade individual: nenhum
menos do que seu maxmin v.; 1
jogador receberá
ii) racionalidade coletiva: o conjunto dos jogadores re-
ceberá o valor v(N) do jogo.
Isso dá lugar à definição de imputação. Num jogo de n
pessoas, urna imputação é um vetor n-dimensional u= (u"u2 , ... ,u ) _ n
tal que:
u. ~ V. 1 1
(i=1,2, ....• d
Em suma, urna imputação é urna distribuição do valor to-
tal do jogo entre os seus participantes e que garanta a cada um
deles um ganho não inferior ao seu maxmin. Os . ,.
prlnclplos de ra-
cionalidade individual e coletiva sugerem que a solução de um jo-
go cooperativo seja uma imputação. Sucede que isso é uma afirma-
tiva demasiado vaga, pois num jogo essencial há, por definição,
urna infinidade de imputações. Isto posto, parece importante es-
treitar o campo possível de candidaturas à solução de um jogo
cooperativo.
1---.63. I
Uma primeira idéia é que os participantes podem formar
coalizões cujo maxmin pode ser maior do que a soma dos maxmins
dos seus membros. Especificamente, definiremos coalizão como sen-
do qualquer subconjunto de N. Seja S uma coalizão nao vazia com
menos de n participantes. Indiquemos por qs o vetor cujas compo
nentes são as estratégias dos participantes de S e por qs o vetor
cujas componentes são as estratégias dos jogadores pertencentes a
N-S. Os ganhos dos participantes da coalizão podem ser expressos
sob a forma:
r icS
=
Isto posto, o maxmln da coalizão é:
v(S) = max min
Isto nos leva ~ definição de função característica do
jogo: trata-se de uma função real, definida no conjunto de partes
de N e que a cada coalizão associa o seu maxmin. Completa-r,", a
função característica de modo a que seu valor seja v{~j para a
coalizão global dos n participantes, e v(~) = O para a soaliz;"-·
vazia. Isto posto, é f~cil demonstrar que a função característica
é superaditiva, no sentido de que:
se S n T = ~ v(S u T) ~ v(S) + v(T)
Vejamos dois exemplos.
Exemplo 1: Tomemos o oligopólio do exercício 3 da secçao
anterior, onde a produção de cada empresa pode variar no interva
O ~ q. ~ 1 (i=1,2,3) e onde os lucros das empresas são dados 1
lo
por:
max ql
max q2
max q3
max (Ql,q2)
max (Ql,Q3)
max (q2;Q3)
Ll (ql,q2,q3) 2
2qlq2-2qlq3 = 6ql-2ql
L2 (ql,q2,q3) 2
2qlq2-2q2q3 = 5q2-2q2
L3 (ql,q2,q3) 2
- 2qlq3-2q2q3 = 4q3-2q3
Observando que O ~ q. ~ 1 para i=1,2,3, obtém-se: 1
min LI (ql,q2,q3) 2 0,5 = max 2ql-2ql =
(q2,q3) ql
min L2 (Ql,Q2,q3) 2 0,125 = max q2- 2q2 .-
(ql,q3) q2
min L3 (Ql,Q2,q3) 2 O = max 2q3 =
(ql,q2) q3
.64.
min Ll (ql,q2,Q3)+L2 (ql,Q2,q3) 2
= max 4ql+3q2-2(ql+q2) =2 (Ql,Q2) Q3
min Ll (Ql,Q2,Q3)+L3 (Ql,Q2,Q3) 2
= max 4ql+2Q3-2(Ql+q3) =2 Q2 (Ql,Q3)
a maximização do lucro total exigindo que as empresas coordenem a
produção tomando ql=l, q2=0,25, Q3=0. A função característica do
jogo é: v(~) = O, v(l) = 0,5, v(2) = 0,125, v(3) = O, v(l,2) = 2,
v(l,3) = 2, v(2,3) = 1,125, v(l,2,3) = 4,125.
.65.
Exemplo 2: O campo de estratégias de cada jogador num
jogo com três participantes é o intervalo fechado O ~ x. ~ 1 1
(i=1,2,3). Os ganhos são:
Note- se que se trata de um jogo de soma zero, já que a
soma dos ganhos dos três jogadores é identicamente nula. O curio-
, so e que, apesar disso, trata-se de um jogo essencial. Para cal-
cuIa r a função característica notemos que:
max mln Ll (x l ,x2 ,x 3 ) = max 2x -1 = 1 (x 2 ,x 3 ) 1
xl xl
max min L2
(xl
,x2 ,x3 ) = max 2x -2 = O (x l ,x3 )
2 x 2
x 2
max min L3
(xl
,x2 ,x3 ) = max -8+3x 3 = -5 x (x
l,x2 ) x 3 3
max min Ll(xl,x2,x3)+L2(xl,x2,x3) = max ~xl+3x2- '~= -"
(xl
,x 2 ) x 3 (x
l,x2 )
max mln Ll(xl,x2,x3)+L3(xl,x2,x3) = max -3x +2x -2=0 1 3 (x
l,x
3) x 2
(xl
,x 3 )
max min L2(x1,x2,x3)+L3(x1,x2,x3) max -x +x -2= -1 2 3 (x
2,x
3) x 2
(x2 ,x 3 )
Em suma, a função característica do jogo é v (~) =0 ,v( 1)=1,
v(2)=O, v(3)=-5, v(l,2)=5, v(l,3)=O, v(2,3)=-l, v(l,2,3)=0. No-
te-se que v(1)+v(2)+v(3) = -4 < v(1,2,3), o que prova que se tra-
ta de um jogo essencial.
.66.
Que a possibilidade de formar coalizões afeta o poder
de barganha dos participantes do jogo é imediato. Em princípio,
para que uma imputação possa considerar-se uma solução satisfató-
ria para um jogo cooperativo, nenhum grupo de participantes deve
ter incentivo a formar uma coalizão em separado capaz de aumentar
os ganhos de todos eles. Isso leva à definição de núcleo: tra-
ta-se do conjunto de imputações u=(u l ,u2 ' .... ,un ) tais que,
qualquer coalizão ~ se tenha:
L ie:S
u. 1
~ v(S)
Tomemos o oligopólio do exemplo 1. Indicando
(ul
,u2 ,u3 ) uma imputação pertencente ao núcleo, deve-se ter:
o que equivale a:
0,125 ~ u2
~ 2,125
° ~ u3·~ 2,125
para
por
Infelizmente, no exemplo em questão, o núcleo ainda é su
ficientemente amplo para deixar boa faixa de indeterminação quan-
to ao que seja a solução do jogo cooperativo. pior do que isso,
pode ocorrer o extremo oposto: o núcleo ser vazio. É o caso de
nosso exemplo 2, onde uma imputação pertencente ao núcleo deveria
- -------------------------
.67.
satisfazer às desigualdades correspondentes aos maxmins das coa-
lizões de dois jogadores:
as quais implicam u l +u 2+u3 ~ 2, e ao mesmo tempo obedecer
quação do jogo de soma zero u l +u2+u3 = O
, a e-
A possibilidade de o núcleo ser vazio (o que acontece
com jogos essenciais de soma constante) é um desafio para a teoria
dos jogos não cooperativos. Com efeito, em tais jogos há inevitá-
vel conflito entre racionalidade coletiva e racionalidade grupal.
Qualquer que seja a distribuição de resultados entre indivíduos,
sempre haverá um subgrupo cujos participantes poderiam melhorar
formando uma coalizão em separado e defendendo-se com a estraté-
gia de maxmin de subgrupo. Sucede que, num jogo essencial, ainda
assim é pr~~erível coopera~ 4 fechar-se em copas. Isso natural-
ment~ ~eva à busca 08 outros conceitos de solução para jogos não
cooperativos. Que ~ distribuição dos ganhos do jogo entre seus
participantes é o resultaêo de um processo de barganha é óbvio.
Como se realiza a barganha, eis o nó da questão.
Uma idéia simples parte do princípio de que o poder de
barganha de cada jogador resulta da sua capacldade de nao coope-
rar com os demais. Sem maiores ressalvas, essa idéia sugere que o
.ésimo 1 jogador tem o direi to de reinvidicar para si a sua con-
tribuição marginal v(N)-n(N-(i» para o valor do jogo. Sucede que
esse procedimento pode ser incompatível com o princípio de que o
bolo só pode ser dividido em fatias de soma igual ao todo. Assim,
.68.
no oligopólio do exem~10 1, as contribuições marginais das três
firmas, v(1,2,3)-v(1,2) = 3, v(1,2,3)-v(1,3) = 2,125 e v(1,2,3) -
-v(1,2) = 2,125 soma 7,25, excedendo o valor v(1,2,3) = 4,125. Já
no jogo de três pessoas soma zero do exemplo 2, a soma das con-
tribuições marginais (1 para o primeiro jogador, O para o segun-
do, -5 para o terceiro), é inferior ao valor do jogo.
Não é impossível, no entanto, dar coerência à idéia de
remuneração pelas contribuições marginais supondo que as coa1i-
zões se formem pelo ingresso sucessivo de participantes. Em suma,
ordenam-se os jogadores segundo uma permutação qualquer (i1,i2, ... ,
,i ) dos inteiros de 1 a n, atribuindo-se ao primeiro a remunera-n
ção v(i1 ), ao segundo a sua contribuição marginal v(i1,i2 )-v(i
1),
ao terceiro v(il,i2,i3)-v(il,i2)' etc .. O defeito óbvio de idéia
é que ele torna a remuneração de cada jogador dependente da ordem
de entrada em cena. Mas é possível remediá-lo, computando as con-
tribuições marginais em cada uma das n: possíveis ordens de en-
trada e computando-se a média aritmética. Com isso o valor do
jogo distribui-se entre seus parti~ipantes de acoc~o com os ape-
lidados valores de Shapley. ~~ +-.: Til' o dE' eXP:.I'plc. oligopólio
do exemplo 1:
Ordem de entrada Contribuições marginais 1ª empresa 2ª empresa 3ª empresa
(1,2,3)
(1,3,2)
(2,1,3)
(2,3,1)
(3,1,2)
(3,2,1)
Média (valor de Shap1ey)
0,5
0,5
1,875
3
2
3
1,8125
1,5
2,125
0,125
0,125
2,125
1,125
1,1875
2,125
1,5
2,125
1
O
O
1,1250
.69.
Descrita nesses termos, a solução de Shapley mais pare-
ce uma receita culinária do que um critério racional de distri-
buição de ganhos em jogos cooperativos. Na realidade é possível
chegar aos valores de Shapley por meio de um conjunto bastante
plausível de axiomas quanto ao que seja uma repartição equitati-
va de ganhos num jogo cooperativo. Apenas se trata de um crité-
rio de arbitramento com o qual os jogadores podem ou nao concor-
dar e que nada tem a ver com o processo de barganha. Em suma,
para que o jogo se solucione segundo os critérios de Shapley, , e
preciso que os participantes concordem em resolvê-lo pelos crité-
rios de Shapley.
Uma segunda linha, explorada por Nash, consiste em as-
, sociar o poder de barganha de cada jogador a credibilidade de
suas ameaças. O cerne da questão é que um jogador, ao ameaçar os
demais com a possibilidade de optar por uma estratégia nao coo-
perativa, nao apenas ameaça prejudicar os outros, mas também a si
próprio. Isto posto, a força da ameaça é tanto maior quanto maio-
res os prejuízos potenciais para t8J:~eiros e quanto menores os
prejuízos para o autor. Isso leva a um ponto ótimo de ameaça para
cada jogador.
Ilustremos a questão com um duopólio, onde os lucros
das duas firmas, com capacidades máximas de produção ql = q2 = I
sao:
Obs.: Se calcularmos este duopólio com ql = q2 = 2 então o lucro
total, maximizado conjuntamente, é v = 4,5, com ql = 1,5, q2 = O.
.70.
Se as duas firmas decidirem pela cooperaçao, o lucro
2 total LI (ql,q2} + L2 (ql,q2} = 6ql+5q2-2(ql+q2} será máximo para
ql=l e q2=O,25, com um valor v=4,125. Admitamos agora que o jogo
se desenvolva de acordo com as seguintes regras:
i} numa primeira etapa a primeira firma ameace produzir
qi e a segunda ameace produzir q2' cada qual sem conhecer a amea
ça da outra;
ii} num segundo lance se computem os lucros ui=LI (qi,q2}
e u 2=L 2 (qi,q2} caso se cumpram as estratégias de ameaça;
iii} num terceiro lance as duas empresas se decidam a cOQ
perar, dividindo salomonicamente entre si o ganho marginal v-u'-u' I 2
da cooperaçao, aceitando assim a imputação (u l ,u2 ) onde:
= u' + I
Dentro dessas regras, que podem ser deduzidas a partir
de axiomas tão plausíveis quanto os que levam os valores de Shapley, o
objetivo do primeiro jogador é escolher qi de modo a ~~~imizar
Ui-U2' o do segundo escolher q2 de modo a maximizar ,
U '-, \...a''''''' 2 ,,~. ~.. v
assim num jogo de duas pessoas-soma zero, onde o ganho do p,-imei-
ro jogador é igual a ui -u2 = LI (qi' q2) - L2 (qi' q2)' cuja solução
(que, como já se viu, é tanto um equilíbrio de Nash quanto um e-
quilíbrio de maxmin), define as estratégias ótimas de ameaça.
Estas últimas levam cada jogador a maximizar a diferença entre o
seu ganho e o do adversário, na fase inicial da barganha. Ou, e-
quivalentemente, a maximizar a diferença entre as perdas do adveK
sário e as suas próprias.
No exemplo numérico apresentado:
.71.
Ui-Ui 1 2
= 6q l_ 2q1 2 - (5q l_ 2qI 2) 1 1 2 2
Se continuássemos os cálculos da observação anterior, encontraríª
mos as estratégias ótimas de ameaça corno qi = 1,5, q2 = 1,25, das
quais resulta ui-u2 = 1,375, como no texto original. Mas a imputª
ção tem que ser calculada com v = 4,5, o que conduz a (ul ,u2 ) =
(2,9375;1,5625) . Os maxmins dos jogadores sao, como no texto ori-
ginal,
Ui min 2 2 0,5 = max 6ql-2ql-2qlq2 = max 2ql-2ql = 1
ql q2 ql
Ui 2 2 0,125. = max mln 5q2-2q2-2qlq2 = max q2- 2q2 =
2 q2 ql q2
Já os valores de Shapley, com o valor correto de v, sao:
o que leva às estratégias ótimas de ameaça qi = 1,0, q2 = l,O,das
quais resulta ui-u2 = 1,0. Segue-se que o equilíbrio do jogo, se
gund0 o modelo das estratégias ótimas de ameaça, é a imputação:
É interessante confrontar essa solução com a dos valo-
res de Shapley. Estes últimos pOderiam ser calculados pelas mes-
mas fórmulas desde que se tomasse ui e u 2 como sendo o maxmin dos
dois jogadores, ou seja:
Ui = max min 1
4ql-2q~ = 2
o que leva aos valores de Shapley (ul,u2) (2,5;1,625).
.72.
Uma terceira linha de análise tenta examinar mais a
fundo o processo de barganha, partindo de dois princípios:
i) num jogo essencial, toda imputação envolve um con-
flito distributivo, no sentido de que cada jogador tenta aumentar
seu quinhão no total à custa dos outros;
ii) nem todas as coalizões concebíveis podem funcionar
ao mesmo tempo, já que um mesmo indivíduo não pode ser membro de
duas coalizões distintas.
Este último ponto é da maior importância: se N é o con-
junto de jogadores, uma estrutura de coalizões é uma partição de
N, ou seja, uma decomposição de N em subconjuntos disjuntos dois
a dois. Assim, num jogo de três pessoas, é possível que estejam em
funcionamento: i) a coalizão global (1,2,3); ii) a estrutura de
coalizões (1,2) versus (3); iii) a estrutura (1,3) versus (2) ;
iv) a estrutura (2,3) versus (1); v) a estrutura (1), (2), (3) em
que cada jogador se fecha em copas. O que não é possível é a ope-
ração simultânea das coalizões (1,2) e (1,3).
TRtO PORt-J, o ~-~~=8SC de barganha é descrito nos se-
guintes ::2rmos: ii p~rte-se de uma imputação e de uma estrutura
de coalizões; ii) um jogador ou grupo de jogadores objeta , a im-
putação, ameaçando romper a estrutura de coalizões para formar u-
ma nova coalizão cujos participantes levem vantagem em relação à
imputação inicial; iii) os demais jogadores respondem com uma
contra-objeção, tentando manter o "status quo". Um equilíbrio se
alcança quando toda objeção puder ser neutralizada por uma con-
tra-objeção.
A título de ilustração, tomemos o jogo do exemplo 2, cu-
ja função característica é v(~)=O, v(l)=l, v(2)=O, v(3)=-5,v(1,2)=~
.73.
v(1,3)=0, v(2,3)=-1, v(1,2,3)=0.
Suponhamos que esteja funcionando a estrutura de coali-
zoes (1,2) versus (3). Como se trata de um jogo de soma zero, o
interesse da coalizão (1,2), é, inicialmente, maximizar o seu ga-
nho, tornando o ganho do terceiro jogador igual ao seu maximin
-5. Isto posto, o ponto de partida é um acerto de estratégias que
A etapa seguinte é a disputa entre os dois primeiros jQ
gadores pelo bolo uI + u 2 = 5. A objeção do primeiro jogador é a
meaçar deixar a coalizão (1,2) para formar a coalizão (1,3), au-
mentando o seu ganho para 5-x e o do terceiro jogador para -5+x.
A contra-objeção do segundo é ele próprio tomar a iniciativa de
romper a coalizão (1,2) para juntar-se com o terceiro na coalizão
(2,3), assegurando ao terceiro o ganho - 5+x e para si próprio o
saldo 4-x do valor da coalizão v( 2,3). Para que a contra-objeção
do segundo jogador neutralize a objeção do primeiro, , , e necessa-
rio e suficiente que, se 5-x for m?ior do que u l ' 4-~ seja maior
do que u 2 . Isso é o mesmo qu~ ~izer que u l -U 2 ~ 1.
Podemos agora inverter os papéis, tL~~sformando a con-
tra-objeção de 2 em objeção e vice-versa. Para que toda objeção
do segundo jogador seja ne~tralizada por uma contra-objeção do
primeiro, é necessário e suficiente que u l -u2 ~ 1.
Conclui-se que a disputa pelo bolo u l +u2 = 5 leva a
uI = 3, u 2 = 2. Nesse sentido, a imputação (3;2;-5) e a estrutura
de coalizões (1,2), (3) pode considerar-se uma solução do jogo.
Note-se que o jogo admite duas outras soluções: a impu
tação (3,0,-3) com a estrutura de coalizões (1,3), (2) e a impu-
.74.
tação (1,2,-3) com a estrutura de coalizões (1), (2,3).
Sob a ótica das objeções e contra-objeções, a existên
cia de um núcleo não vazio num jogo cooperativo tem um significa
do bem mais restrito do que parece à primeira vista: ela signifi
ca apenas que a coalizão global N é factível. Com efeito, se uma
imputação pertence ao núcleo, nao é possível levantar contra ela
nenhuma objeção, já que não é possível formar uma coalizão em que
todos os participantes ganhem mais do que na imputação original.
No reverso da medalha, um jogo cooperativo com núcleo
vazio deixa de ser um enigma. Trata-se apenas de um jogo onde a
coalizão global N não é factível. O que não impede que a coopera
ção possa ser alcançada por alguma partição de N em coalizões.
A descrição acima fornece uma idéia preliminar sobre o
que é a teoria dos jogos cooperativos em seu modelo mai~ simples,
o das utilidades transferíveis. Esse modelo não se aplica a inú
meros problemas práticos, quer porque a transferência de uma soma
T õe i para j não meça as variações de utilidades de i e :. q~cr
porque as próprias transferências podem ser proibidas ~como ge
ralmente ocorre nos oligopólios). Isso exige o estudo G~ formá~
hem mais complexas de jogos cooperativos.
1 ? ~. O R ( 1 NO ,-1 A G 1 C D D O C H O Q II [ H [ , [ R O O O )( O - F e r n a ri d O d p H O 1 a n d a B a r b o ti Antonio Snlnzar Pessoa Brand~o c Cl~vis de Faro - 1908 (~$gotnd~
126. PLANO CRUZADD: CONC[PÇ~O [ O ERRO DE POL1l1CA fISCAL - Rubens Penhn.Cy~nr - 1988
127. TAXA O[ JUROS rLUTUANTE VERSUS CORREÇ~O MO~[lAR1A DAS PRESTAÇ~E5 UMA COKPARAÇAo ~D CASO DO SAC [ lNFlAÇnO CONST~NT[- Clovis de faro - 1980
128. CAPiTULO 11 - MON[TARY CORRECTION ANO REAL IN1[REST ACCOUNTING - .Rubens PFnha Cysne - 1988
129. CAPi1ULO 111 - lNCOME ANDOEMANO POLICIES IN BRAZIL - Rubens Penhé Cysne - 1908
130. CAPíTULO IV - BRAZILIAN ECONOKY IN THE EIGHT]ES AND THE OEBl CRIS15 - Ruber.~ Penha Cysne - 19B8
131. lHE BRAZILIAN AGRICUL1URAL POLICY EXPERIENCE: RA1IONALE AND fUTUR[ D!REC1IONS - Antonio 5alazar Pessoa Brandio - 19B8
132. MORA7ÚRIA INTERNA, DivIDA PÚBLICA E JUROS REAIS - Maria Silvia BastoE M&rques e Sirgio Ribeiro de Costa Werlang - 19B8
133. CAPiTULO IX - TEORIA DO CRESCIMENTO ECON5MICO - Mario Henrique Sirroonsen - 1986
134.
135.
CONGELAMENTO COM ABONO SALARIAL GERANDO EXCESSO DE DEMANDA -- Joaquim Vieira Ferreira Levy e SÉrgio Ribeiro da Costa Wer1ang - 198
AS ORIGENS E CONSEQUtNCIAS DA INFLAÇ~O NA AMERICA LATINA -Fernando de Holanda Barbosa - 1988
136. A CONlA-CORRENTE DO GOVERNO - 1970-198B - Mario Henrique Simonsen - 1989
137. A REVIEW ON THE THEORV DF COMMON KNOWLED.GE - Sérgio Ribeiro da Costa Werlang - 19B9
l~B. MACROECONOMIA - Fernando de Holanda Barbosa - 1989 (esgot~do)
139. TEORIA DO BALANÇO DE PAGAMEN1DS: UMA ABORDAGEM SIMPLIFICADA -- Joio Luiz Tenreiro Barroso -1989
l~O. CONTABILIDADE COM JUROS ~EAIS - RUBENS DENHA CYSNE - 1989
1~1. "CREDIT RATIONING ANO THE PERMAti~~n INCOt.: :~":'0THESIS" - Vicente P.adrigal.
lommy Tan, Daniel Vicent, Sérgio Ribeiro da Costa ~~rlang - 1989
1~2. liA AMAZONIA BRASILEIRA".- Ney Coe de Oliveira - 1989
143. DESÁGIO DAS LFTs E A PROBABILIDADE IMPLICITA DE MORA'lCiRIA
Maria Silvia Bastos Marques e Sérgio Ribeiro da Costa Werlang - 1~
144. THE LDCDEBT PROBLEM: A GAME-THEORETICAL ANALYSIS
Mario Henrique Simonsen e Sérgio Ribeiro da Costa Werlang- 1989 •
145. ANALISE CONVEXA NO Rn - Mario Henrique Simonsen - 1989
146. A CONTROvERSIA MONETARISTA NO HEMISFERIO NORTE
Fernando de Holanda Barbosa - 1989
147. FtSCAL REFORM ANO STABILIZATtON: THE BRAZILtAN EXPERIENCE - Fernando de Holanda Bafbosa, Antônio Salazar Pessoa Brandão e Clovis de Faro - 1989
148. RETORNOS EM EDUCAÇ~O NO BRASIL: 1976-1986 Carlos Ivan Simonsen Leal e Sérgio Ribeiro J3. Costa Werlang - 1989
149. PREFERENCES, COMMON KNOWLEDGE, AND SPECULATIVE TRADE - James Dow, Vicente Madrigal, Sérgio Ribeiro da Costa Werlang - 1990
150. EDUCAÇ~O E DISTRIBUIÇ~O DE RENDA Carlos Ivan Sirnonsen Leal e Sérgio Ribeiro da Costa - 1990
151. OBSERVAÇÕES A MARGEN DO TRABALHO "A AMAZONIA BRASILEIRA"- - Ney Coe de Oliveira - 1990
152. PLANO COLLOR: UM GOLPE DE MESTRE CONTRA A INFLAÇ~O? - Fernando de Holanda Barbosa - 1990
153. O EFEITO DA TAXA DE JUROS E DA INCERTEZA SOBRE A CURVA DE PHILLIPS DA ECONOMIA BRASILEIRA - Ricardo de Oliveira Cavalcanti - 1990
154. PLANO COLLOR: CONTRA FACTUALIDADE E SUGEST.ÕES SOBRE A CONDUÇ~O DA POLíTICA MONETÂRIA-FISCAL - Rubens Penha Cysne - 1990
155. DEPÓSITOS DO TESOURO: NO BANCO CENTRAL OU NOS BANCOS COMERCIAIS? Rubens Penha Cysne - 1990
156. SISTEMA FINANCEIRO DE HABITAÇ~O: A QUEST~O DO DESEQUILíBRIO DO FCVS - Clovis de Faro - 1990
157. COMPLEMENTO DO FAScíNIO N2 151 DOS "ENSAIOS ECONOMICOS" (A AMAZONIA BRASILEIRA) - Ney Coe de Oliveira - 1990
158. POLíTICA MONETÂRIA 6TIMA NO COMBATE A INFLAÇ~O - Fernando de Holanda Barbosa - 1990
159. TEORtA DOS JOGOS - CONCEITOS BÂSICOS - Mario Henrique Sirnonsen -
- 1990 ._-- -----~
000055028
111111111111111111111111"11111111111