TEORIA n'!s CONCEITOS BÂ~ICOS

TEORIA n'!s JOGü3

CONCEITOS BÂ~ICOS

Mario Henrique Simonsen I

J- 1990 -

TEORIA DOS JOGOS

CONCEITOS BÁSICOS

1.1) Objetivo da Teoria dos Jogos

Como tomar decisões cujos resultados dependem de açoes

de terceiros é o que se procura analisar na teoria dos jogos.

Trata-se de um programa extremamente ambicioso, que levado às úl-

timas conseqüências ensinaria qualquer indivíduo a transformar-se

em campeao mundial de xadrez, a nivelar-se aos melhores profis-

A

sionais do poquer ou qualquer outro jogo de cartas, a solucionar

qualquer problema econômico, a jamais perder qualquer eleição e a

perpetuar-se como o maior general de todos os tempos. Com efeito,

não só o xadrez e o pôquer, mas também a tomada de decisões eco-

nômicas, as campanhas pOlíticas e a guerra sao jogos, no sentido

C2 que o resultado colhido por cada um nao depende apenas C~ SEüS

~~OP~, mas também das decisões de terceiros.

Não surpreende que, diante de um programa tão am0icio-

so, a teoria dos jogos seja um ramo altamente incompleto da mate-

mática aplicada. O ponto de partida foi um livro excepcionalmente

importante, o "Theory of Games and Economic Behavior" de John

von Neumann e Oskar Morgenstern, publicado em 1944, mas apenas um

ponto de partida. Quarenta anos de pesquisas enriqueceram a teo-

ria dos jogos com alguns resultados admiráveis, mas que ainda

deixam pelo menos três campos para muita análise.

.2.

Primeiro, a maioria dos jogos realmente interessantes

depa'ra-se com problemas ainda nao solucionados de computação, em-

bora muitas vezes se possa dizer algo sobre o seu resultado com

base em teoremas de existência. Como veremos no Capítulo 2, o

Teorema de Zermello assegura que o jogo de xadrez , e estritamente

determinado, no sentido de que urna e só uma das três seguintes

proposições é verdadeira: a) existe uma estratégia de ganho para

o jogador das peças brancas, qualquer que seja a estratégia das

pretas; b) existe uma estratégia que dá ganho às pretas qualquer

que seja a estratégia das brancas; c) qualquer que seja a estra-

tégia das brancas existe pelo menos uma outra que assegura , as

pretas o empate, e vice-versa. o problema é que, até agora, ne-

nhum computador conseguiu dissecar todas as estratégias ,

POSS1-

veis numa partida de xadrez. É isso que torna o xadrez tão exci-

tante quanto infantil o jogo da velha, ainda que ambos ,sejam ab-

solutamente equivalentes do ponto de vista do teorema de Zermello.

Segundo, e aí reside o ponto mais sutil da teoria dos

j~gos, o conceito de racionalidade nem sempre , e isento dI" ::.tlllbi-

qüidades. De um lado porque em mui tos casos surgem coY,fli tos en-

tre a noção de racionalidade individual e a de racionalic.:.'Ide co-

letiva. O exemplo clássico nesse sentido é o dilema dos prisio-

neiros, descrito mais adiante. De outro lado porque uma coisa , e

agir racionalmente diante de adversários ou colegas igualmente

racionais, outra agir racionalmente quando se põe em dúvida a ra-

cionalidade dos demais parceiros. Como veremos mais adiante, es-

se problema pode abalar seriamente a aplicabilidade prática do

principal conceito da teoria dos jogos não cooperativos, o de e-

quilíbrio de Nash.

I

I

.3.

Terceiro, muitos jogos admitem diferentes equilíbrios,

com resultados diferentes para os vários participantes. É de se

reconhecer que, nesses casos, o atual conhecimento sobre a teoria

deixa um campo de indeterminaç~o sobre o que seja decis~o racio-

nal em problemas de interdependência estratégica.

Apesar desses problemas ainda nao resolvidos, a teoria

dos jogos já avançou o bastante para dar importantes contribui-

ções a várias ciências, particularmente à economia. Tratemos,

pois, de estudá-la.

.4.

1.2) Conceitos Básicos

Genericamente um jogo é um conjunto de regras que esta-

belecem: i) o número de participantes; ii) as informações for-

necidas a cada participante; iii) as decisões permitidas a cada

participante; iv) os resultados (pay-offs) auferidos por cada

um dos participantes. Estes últimos podem depender exclusiva-

mente das decisõ8s tornadas pelos participantes (corno no jogo de

xadrez) ou também de fatores aleatórios (como no bridge ou no pô-

quer). O segundo caso reduz-se ao primeiro trazendo para o jogo

umparticipante adicional, a "natureza", mas com uma ressalva im-

portante: a natureza tem caprichos próprios, nem estando interes-

sada em ganhar nem em perder.

As regras dividem os jogos em dois tipos fundamentais,

os cooperativos e os nao cooperativos. No primeiro caso permitem-

-se coalizões entre os participantes sob a forma de contratos ir-

revogáveis e irretratáveis. Esses contratos podem ser de dois ti-

!"';.5 distintos, os que admitem pagamentos laterais entre os ;·:.rti-

cipantes, ( . -e os que prolbem tals pagamentos. No caso d~d jogos nao

cooperativos, é proibida qualquer comunicação entre os 0iferen-

tes jogadores, eliminando-se a possibilidade de contratos, amea-

ças explícitas ou coalizões. Em qualquer dos casos, uma estraté-

gia é um conjunto de decisões acessível a cada jogador.

Nos jogos nao cooperativos há urna categoria especial,

e que será analisada em pormenores no Capítulo 2, os jogos de ,

duas pessoas-soma zero. O que caracteriza esses jogos e que o

ganho de um é a perda do outro, como numa partida de xadrez.

Tais jogos, em tese, não abrem espaço a qualquer possibilidade de

cooperaçao, pois o interesse de um participante é diametralmente

.5.

oposto ao do outro. Também não geram a dúvida atroz que cerca a

teoria dos jogos não cooperativos: "o que acontecerá se meu par-

ceiro não se comportar racionalmente", pois o parceiro , e adver-

sário, e por isso mesmo quanto mais errar melhor.

A teoria presume que o jogo seja jogado , .

uma unlca vez.

Isso nao exclui a possibilidade de que um mesmo jogo seja re-

petido um número finito ou infinito de vezes, mas obriga a uma

reflexão muito importante: um superjogo, isto , e, um mesmo jogo

repetido n vezes, não é a mesma coisa do que n repetições inde-

pendentes do mesmo jogo. A diferença não é relevante no caso dos

jogos cooperativos, mas é fundamental no caso dos jogos nao coo-

perativos de soma variável, onde surge a possibilidade de cada

participante sinalizar aos demais o seu desejo de cooperar, des-

de que os demais façam o mesmo. Embora as regras do jogo lmpeçam

qualquer comunicação entre os participantes, a sinalização é pos-

sível na medida em que um jogador escolha estratégias que mos-

trem a sua disposição para cooperar enquanto os demais fizerem o

mesmo, e 8~ retaliar em caso contrário. Em jogos infinitamente

repet~~~~. ~ssa pnsFiLilid~~p ~p cooperação por vias indiretas se

demonstra por um fd:,.CSO teorema de Aumann. Essa é uma forte razão

para que se dedique especial atenção a essa classe de jogos.

.6.

1.3) Jogos na Forma Extensiva

Trataremos os jogos como uma sequencia de lances, cada

um decidido por um único participante. Isso permite descrever to

das as evoluções possíveis do jogo por meio de uma árvore de de

cisões, em que cada lance representa a transição de um vértice

para outro ao longo da árvore. O jogo diz-se finito ou infinito

conforme o número de vértices seja finito ou infinito. O fato de,

em alguns jogos, os participantes deverem fazer lances simultâ

neos concilia-se com essa descrição por um artifício simples: bas

ta transformar os lances anteriores em sequenciais, mas admitir

que cada participante desconheça os lances anteriores da sequen

cia.

Isso significa que a árvore de decisões decreve todas

as possíveis evoluções do jogo, mas não fornece a desc~ição com

pleta do jogo. Para completá-la é preciso especificar o que cada

participante conhece no momento de tomar suas decisões. Nesse

sentido, os jogos podem classificar-se em vários tipos, de acordo

com três critérios:

i) quanto ao conhecimento das regras do jOq0' os jo~~s

dizem-se de informação completa quando cada participante conhece:

a) o número de participantes do jogo; b) as decisões que qualquer

deles pode tomar; c) os pay-offs de todos os participantes. Se

algum desses elementos for desconhecido por algum participante, o

jogo diz-se de informação incompleta;

ii) quanto à memória: os jogos dizem-se de memória per

feita quando cada participante se lembra, a cada momento, de to

dos os lances que efetuou desde o início do jogo; de memória lm

perfeita, em caso contrário;

iii) quanto ao conhecimento da evolução do ioqo: um jogo

diz-se de- informação perfeita quando cada participante, ao efe-

.7.

tuar seus lances, conhece em que vértice da árvore se encontra o

jogo (a exemplo do xadrez); de informação imperfeita em caso con-

trário (a exemplo do pôquer).

Vejamos alguns exemplos:

A) NIM 2x2:

Estado Inicial: duas pilhas, cada urna com dois livros.

Número de Jogadores: 2.

Seqüência de Chamada: o jogador A é o primeiro a jogar, seguido

por B, e assim alternadamente.

Ações Permitidas: cada jogador deve retirar quantos livros quiser

ou puder, desde que pelo menos um, e desde que só mexa de

cada vez na mesma pilha. Se as duas pilhas contiverem o mesmo

número de livros, só é permitido mexer na pilha esquerda.

Fim do Jogo: quando o último livro for retirado.

Pay-offs: quem retirar o último livro paga um centavo ao outro.

Trata-se de um jogo de perfeita informação completa

(presumivelmente também de perf€::: ' ... a memória), 8 que se descreve

pela seguinte árvore (onde as l~~Ld~ em C~~_ v~rticc .iüdicam o

jogador a efetuar o próximo lance, se for o ~2S0, ,

e onde os ver-

tices com um retângulo em volta indicam as situações de fim de

jogo e o respectivo vencedor:

A (1,0)

IB!<o.Oll

o 8 o

É imediato que o segundo jogador pode vencer facilmente

pela seguinte regra: se, no lance inicial, A mandar o jogo para o

vértice BI' B responde mandando o jogo para A3 0 E se, no lance i

nicial, A mandar o jogo para B2 , B responde mandando o jogo para

B) Mini-porrinha

Estado Inicial: dois jogadores, A e B, com as maos vazias.

Primeiro Lance: A coloca na mao direita um palito de fósforo ou

dois, sem que B saiba de sua escolha.

Segundo Lance: B coloca na mão direita um ou dois palitos de fós-

foro, sem que A saiba da escolha.

Terceiro Lance: A escolhe um número inteiro que pode ser 2,3 ou 4.

Quarto Lance: B escolhe um inteiro de 2 a 4 diferente do escolhido por A.

Fim do Jogo: ambos abrem as respectivas mãos direitas e totalizam ,

o numero de palitos.

Pay-offs: o jogador que acertar o total (pelo terceiro ou pelo

quarto l~nce, recebe um d61ar do outro). Se ninguém acertar,

h? ..::mpate.

A árvore de Jogo apresenta-se a seguir, dentro das se-

guintes convençoes gráficas:

a) os vértices nos quatro primeiros , .

nlvelS indicam a

, . quem cabe o proxlmo lance;

b) os vértices I a 24 indicam as possíveis configura-

çoes finais do jogo;

c) as passagens de um vértice para outro indicam a es-

colha do jogador a quem cabe o lance: ou em termos de palitos de

fósforo a serem colocados na mao, ou em termos de palpite quanto

ao total de fósforos dos dois jogadores;

• .9.

d) abaixo dos vértices 1 a 24 indica-se o vencedor do

jogo (A, B ou empate = E).

5 6

~ B B B

4~ 1~ 21\3 19 20 21 22 23 24

A A B E B E B E A A E B B E A A E B E B E B A A

h diferença funda~ental entre a mini-porrinha e o Nim

2x2 8 que agora os iúqadores, ao efetuarem seus lances, não sabem

em que ~~rtice J~ ~rvore se encontram, o que caracteriza um jogo

de informação imperfeita. Ao efetuar o segundo lance, B nao sabe

se está em Bl ou em B2 . Ao efetuar o terceiro, A sabe se está

na sub-árvore que começa em BI ou na que começa em B2 , mas nao

dispõe de elementos que lhe permitam distinguir se o jogo está em

AloU A2 , no primeiro caso, ou em A3 ou A4 , no segundo. Do mesmo

modo, no quarto lance, B não dispõe de elementos para distinguir

se está no vértice Bi ou Bi+6. Isso, naturalmente, torna a mini

-porrinha um jogo mais interessante que o Nim 2x2.

, .10.

o dilema dos prisioneiros: Dois marginais, suspeitos de

um crime, são apanhados pela polícia e interrogados em celas

separadas. Cada um deles é abordado por um juiz, cujas ameaças e

promessas estão acima de qualquer suspeita, e que lhes diz: "con-

fesse o crime, colaborando com a justiça, em seu próprio interes-

se. Se ambos, você e seu parceiro, confessarem, cada qual pegará

seis anos de xadrez. Se um confessar e o outro nao, o primeiro só

pegará dois anos de cadeia, o outro dez cnos, . -corno punlçao pela

mentira. É possível que nenhum de vocês confesse e, nesse caso, a ,

pena sera de apenas quatro anos para cada um. Mas pense, pois seu

interesse é confessar".

A árvore do jogo é descrita abaixo, C indicando a con-

fissão, N a negação. Os números debaixo dos vértices terminais

indicam os pay-offs dos dois tratantes, o sinal menos lembrando

que quanto mais anos de cadeia, pior.

A

N

4

(-6;-6) (-2;-10) (-10;-2) (-4;-4)

o jogo pressupoe que o segundo prisioneiro, ao tornar

sua decisão de confessar ou não, nao saiba se se encontra no vér-

tice Bl ou B2 da árvore de decisões. No jogo em questão, isso nao

chega a ser muito relevante, p01S cada jogador dispõe de urna es-

tratégia dominante, isto é, que assegura maior pay-off qualquer

que seja a decisão do parceiro, pois a pena individual

confessando o crime do que negando. Com efeito, cada prisioneiro

, e menor

.11.

pensará com seus botões: se meu colega confessar, pegarei 6 anos

de cadeia se também confessar, 10 anos se negar minha culpa. Se

ele não confessar, pegarei só 2 anos confessando contra 4 se ne-

gar o crime. Logo, em qualquer hipótese, o melhor para mim é con-

fessar. O raciocínio vale quer o prisioneiro já conheça a deci-

sao do parceiro ou nao. Trata-se de um exemplo clássico de con-

flito entre racionalidade individual e coletiva. Se fosse permi-

tido um pacto irrevogável e irretratável entre os dois parceiros

do crime, o melhor para ambos seria não confessar e pegar apenas

quatro anos de xadrez. O interrogatório em celas separadas impede

esse pacto, e a racionalidade individual condena ambos a seis a-

nos de cadeia.

Os três jogos apresentados tipificam a variedade de

problemas que a teoria dos jogos pretende abordar. O Nim2x2 é um

jogo de duas pessoas-soma zero com perfeita informação. Trata-se

de um jogo infantil, no sentido de que a estratégia de ganho pode

ser descoberta sem maiores dores de cabeça, mas exceto quanto a

este l~J ~lmo aspecto (8s.:iencial, do ponto de vista prático), o jo-

go e 00 mesmu ~:ei'~ro que o xadrez. A mini-porrinha também , e um

jogo de duas pessoas-':'/;:'a zero, mas com a diferença de que nao

mais existe perfeita informação. Não existe nenhuma estratégia

que garanta a vitória incondicional de A ou de B. No entanto, co-

mo veremos no Capítulo 2, se o jogo for repetido várias vezes, há

uma estratégia favorável ao primeiro jogador dentro da lei dos

grandes números. Já o dilema dos prisioneiros ilustra um tercei-

ro tipo de jogo, de soma variável, onde a não cooperaçao gera a

dissonância entre racionalidade individual e coletiva. É de se

presumir que, em versão repetida, o dilema dos prisioneiros pro-

picie estratégias de cooperaçao indireta via sinalização.

....-------------------------------------------- --

.12.

At~ agora s~ exemplificamos jogos finitos. Há também

os infinitos e a sua descrição extensiva requer urna

mais abrangente do que sejam: a) urna árvore topológica;

conjunto de informações; c) urna estrat~gia. Antes de

essas definições, vale no entanto explorar a trajetória

definição

b) um

formular

heurís-

tica do conceito de estrat~gia e de jogo sob a forma normal.

.13.

1.4} Jogos matriciais e bi-matriciais

Cuidemos agora de um tipo particular de jogo de duas

pessoas, A e B: no primeiro lance, A escolhe um número inteiro de

I a m; no segundo, B escolhe um número inteiro de I a n, sem estar

informado da escolha de A. Indicando por i o inteiro escolhido

por A e por j o escolhido por B, o primeiro jogador recebe a .. , 1J

o segundo b ... Um tal jogo apelida-se bi-matricial, no sentido de 1J

que ele se descreve por um par de matrizes de pay-offs, onde as

linhas representam as possíveis estratégias de A, as colunas as

possíveis estratégias de B:

Estratégia de B Estratégia de A

BI B2 · ..... B n

AI (all;bll ) (a I2 ;bI2 ) · ..... (alnibln)

A2 (a 21 ;b21 ) (a 22 ;a22 ) · ..... (a 2n ib2n )

. . . . . . . . . . . . . . . . . . . . . . . ................ ~ . . . . . . . . . . . .

A (aml i b m1 .\ (a '-- ) (a ·b ) m2' ';n', · ..... m mn' mn - ------ --_.

No caso dos jogos de duas pessoas soma zero, b .. = -a .. , 1J 1J

tornando dispensável a explicitação da matriz dos pay-offs de B.

Nesse caso, para a descrição do jogo, basta apresentar a matriz

dos pay-offs do primeiro jogador. Esses são os apelidados "jogos

matriciais".

A importância dos jogos bi-matriciais decorre de que

todo jogo finito de duas pessoas pode representar-se como um jo-

go bi-matricial. Trata-se de um caso particular de um teorema

.14.

mais geral que será dpmonstrado ainda neste capítulo. Para tanto

basta entender claramente o que seja estratégia num jogo sob a

forma extensiva.

A idéia de estratégia é a de um plano de jogo. Em suma,

trata-se de urna sequencia completa de lances, até o fim do jogo,

cada um deles representando urna função do conjunto de informações

disponíveis e com valores permitidos pelas regras do jogo. Trate-

mos de apresentar na forma bi-matricial os jogos apresentados sob

a forma extensiva na secção anterior.

o caso do dilema dos prisioneiros é imediato, pois as

estratégias possíveis para cada jogador se resumem a confessar

(c) ou negar (N):

Estratégia de B Estratégia de A

C N

C (-E;-6) (-2;-10)

N (-10;-2) (-4;-4) - ~

A descrição acima supoe que o jogo se rc~lize com info~

maçao imperfeita, isto é, que A e B tenham que fazer suas esco

lhas ignorando a do parceiro. Se A fosse o primeiro a decidir e B

tivesse que fazer seu lance já conhecendo o de A, a descrição bi-

-matricial seria outra. A continuaria apenas com duas estraté-

gias, confessar ou não confessar. Mas B teria quatro estratégias

possíveis, funções da decisão de A: a) confessar quer A tenha

confessado ou negado; b) negar quer A tenha confessado ou nao;

c) negar se A tiver negado, confessar se A tiver confessado;

.15.

d) confessar se A tiver negado, negar se A tiver confessado.

Vejamos agora o caso do Nim. No primeiro lance, A pode

mandar o jogo para BI ou para B2 . Na primeira hipótese, o curso

do jogo independe de qualquer outra decisão de A. Na segunda, A

só tem mais de uma opção se o jogador B, no seu primeiro lance,

tiver mandado o jogo para A4. Nesse caso, A tanto pode mandar o

jogo para B4 quanto para B5. Em suma, A só dispõe de três estra

tégias, isto é, possíveis planos de jogo:

AI mandar o jogo para BI no primeiro lance;

AlI mandar o jogo para B2 no primeiro lance; posteriormente,

se B mandar o jogo para A4' mandar o jogo para B4 ;

AIII : mandar o jogo para B2 no primeiro lance; posteriormente,

se B tiver mandado o jogo para A4' mandar o jogo para BS.

, . Vejamos agora os posslvels planos para B. Se, inicial-

mente, A tiver mandado o jogo para BI' B pOderá mandar o jogo pa

ra A2 ou A~. Se A tiver mancado o jogo para B2' B poderá respon

der m~~dando o jogo ~dra A4' AS ou A6. Em qualquer das hipóteses,

a post0:-ior e\ic] "'·'.2n do jogo independe de qualquer decisão de B.

Isto posto, há seis e a~~Das seis estratégias para B:

BI BI -A2 ou B2-A4

BII

· : BI -A2 ou B2-AS

BIII : BI -A2 ou B2-A6

BIV BI

-A3 ou B2-A

4

BV BI -A3 ou B2-AS

BVI BI -A3 ou B2-A6

.16.

A primeira estratégia indicando "se r; jogo estiver em

B1 , mandá-lo para A2 , se estiver em B2 mandá-lo para A4"' e assim

por diante.

A representação matricial do jogo (com os pay-offs de

A) é a que se segue:

BI BII BIII BIV BV BVI

AI 1 1 1 -1 -1 -1

AlI -1 1 -1 -1 1 -1

AIII 1 1 -1 1 1 -1

A representação matricial confirma o que já se viu an

teriormente: B ganha o jogo escolhendo a estratégia BVI '

Cuidemos agora da mini-porrinha. A tem que tomar duas

~2cisões independentes: quantos palitos de fósforo

.. U\..lV e que número (2,3 ou 4) estimar para o total de p~:' ~ '::::::. Is-

to posto, há seis estratégias possíveis para A:

Estratégia Palitos na mao Total anunciado

AI 1 2

A2 1 3

A3 1 4

A4 2 2

AS 2 3

A6 2 4

.17.

Obviamente as estratégias A3 e A4 sa0 absolutamente es

túpidas, pois se A tem um só palito na mão o total nao pode ser

quatro, e se A tem dois palitos o total não pode ser dois. Acon-

tece que até agora nao estamos interessados em examinar se os

jogadores sao ou não inteligentes, mas apenas o que lhes é permi-

tido fazer.

Vejamos agora as estratégias de B. Elas se compoem de

dois passos também independentes. O primeiro consiste em escolher

quantos palitos esconder na mao. O segundo é um plano de respos-

ta ao total estimado por A, isto é, uma função f(x), definida e

com valores no conjunto (2;3;4), tal que f(x) F x. Há oito fun-

, . çoes posslvels dessa natureza. Corno B pode ter escondido um ou

dois palitos de fósforo, segue-se que há dezesseis possíveis

planos de jogo P?ra B:

Estratégia Palitos na mao f(2);f(3);f(4)

BI I (3 2 2)

B2 1 (3 2 3)

B3 I (~ 4 2)

B4 I (3 4 ~ ;

BS 1 (4 2 2)

B6 1 (4 2 3)

B7 I (4 4 2)

Ba 1 (4 4 3)

Bg 2 ( 3 2 2)

BIO 2 (3 2 3)

BII 2 (3 4 2)

Bl2 2 (3 4 3)

Bl3 2 (4 2 2)

.18.

Estratégia Palitos na mao f(2)if(3)if(4)

B14 2 (4 2 3)

BIS 2 (4 4 2)

B16 2 (4 4 3)

A matriz representativa da mini-porrinha (com os pay

-offs de A) é, pois,a seguinte:

B1 B2 B3 B4 BS B6 B7 BS B9 B

10 Bn B12 B13 B

14 BIS B16

AI 1 1 1 1 1 1 1 1 -1 -1 -1 -1 O O O O

A2 -1 -1 O O -1 -1 O O 1 1 1 1 1 1 1 1

A3 -1 O -1 O -1 O -1 O O -1 O -1 O -1 O -1

A4 -1 -1 -1 -1 O O O O O O O O -1 -1 -1 -1

AS 1 1 1 1 1 1 1 1 O O -1 -1 O O -1 -1

A6 O -1 O -1 O -1 O -1 1 1 1 1 1 1 1 1

.19.

l.S} Dominância, max~zn, equilíbrio de Nash

Analisemos agora os critérios de tomada racional de de-

cisões em jogos não cooperativos. A teoria gravita em torno de

três conceitos centrais, dominância, maxmin e equilíbrio de Nash.

Embora a discussão da presente secção se limite a jogos bi-matri-

ciais, a maioria dos resultados se estende naturalmente a casos

mais gerais.

Diz-se que uma estratégia S .. do jogador j domina a sua 1J

estratégia Skj quando, qualquer que seja a combinação de estra-

tégias dos demais jogadores, S .. lhe proporciona ganhos maiores 1J

ou iguais do que Skj' sendo estritamente maiores pelo menos para

alguma combinação de estratégias dos demais participantes do jo-

go. Especificamente, no caso de jogos bi-matriciais:

i) a estratégia A. do primeiro jogador domina a sua es-1

tratégia Ak quando a ij ~ a kj para j = 1,2, ... ,n, valendo a de-

sigualdade estrita para algum índice j;

ii) a estratégia B d0 segundo jogado~ domina a sua esr

tratégia B quando b. ~ b. V""l:ra 1 0- 1.:.> .... , m, valendo a de-s 1r 1S

sigualdade estrita para algum índice i.

A título de exemplo, no Nim 2x2 a estratégia AIII do

primeiro jogador domina a sua estratégia AlI. A estratégia BV1 do

segundo jogador domina qualquer outra de suas estratégias. No di-

lema dos prisioneiros, a estratégia "confessar" domina a estraté-

gia "negar" para ambos os participantes.

Um axioma fundamental estabelece que participantes ra-

cionais de jogos não cooperativos desprezam as estratégias domi

nadas. Isto posto, o que seja comportamento racional de um indi-

~-------------------------------------------~ ------

FUNDAÇÃO GETÚLIO VARG~ Riblioteca Mário Henrique Simoht~ri

víduo num jogo nao cooperativo é algo muito simples quando ele

dispõe de urna estratégia dominante, isto é, de urna estratégia que

domine todas as demais, tal corno BVI para o segundo jogador' no

Nim 2x2 e "confessar" no dilema dos prisioneiros. O indivíduo, no

caso, nao precisa preocupar-se em saber se os demais jogadores

são ou não racionais, pois isso não altera a sua escolha, que de-

ve recair sobre a estratégia dominante.

Infelizmente, na maioria dos jogos interessantes nao

existem estratégias dominantes para os jogadores. Isso nos leva

a dois outros conceitos bem mais controversos de comportamento

racional.

O primeiro é o de "maxmin". O "maxmin", para cada jo-

gador, é o ganho mínimo que ele pode assegurar para si, indepen-

dentemente das estratégias dos demais jogadores, escolhendo pru-

dentemente a sua estratégia. Em jogos bi-matriciais, o maximin de

A e B são expressos por:

VA = mêlÀ min a. i j 1j

• T = max m1n b . \In 1j ~ j 1

Urna estratégia que assegure ao jogador um ganho ,. .

m1n1-

mo igual ao seu maxmin é dita urna estratégia de maxmin. A títu-

lo de exemplo, no jogo bi-matricial abaixo:

(10;10) (-10;9)

(9;-10) (8;8)

.21.

Escolhendo a estratégia AI' o primeiro jogador, depen

dendo da opção do segundo, tanto pode ganhar 10 quanto -10; esco-

lhendo AlI' pode ganhar 9 ou 8. Isto posto, AlI é a estratégia do

maxmin para o primeiro jogador, garantindo-lhe um ganho pelo me

nos igual a 8. Do mesmo modo, BII é a estratégia de maxmin para o

segundo jogador.

A idéia de maxmin é a de açao tão prudente quanto pos-

sível, típica do jogador que teme enfrentar um bando de loucos.

Quando existe uma estratégia dominante, o jogo do maxmin é obvia-

mente racional, por força do seguinte:

Teorema 1.1:

Demonstração:

Uma estratégia dominante , e uma estratégia de

maxmin.

Suponhamos que, num jogo bi-matricial, o jogador A

disponha de uma estratégia dominante Ak. Então,por

definição:

Logo:

min j

a igualdade

VA =

~ a .. 1J

para

a kj ~ min j

valendo para

mln a kj = j

1 = 1,2, ... ,n.

a (i=l, 2, ... ,n) - I

i=k. Segue-se que:

max min a kj · i j

A existência de uma estratégia de maxmin em jogos fini

tos é trivial, e o fato de que uma estratégia dominante é uma es-

tratégia de maxmin demonstra-se facilmente em jogos bem mais ge

rais do que os bi-matriciais. O problema é que a recíproca não é

verdadeira: no jogo apresentado acima nem AlI nem BII são estratg

gias dominantes. Isto posto, associar racionalidade à escolha de

.22.

uma estratégia de maxmin, é supor que os jogadores Vlvam na re-

tranca do pessimismo. Em casos simples, como o da mini-porrinha,

essa retranca a nada leva, no sentido de que qualquer estratégia

possível é uma estratégia de maxmin, quer para A que para B. Ou

seja, ela pode condenar quem queira viver defensivamente ao pior

dos mundos.

Isso nos leva a um terceiro conceito fundamental da

teoria dos jogos não cooperativos, o de equilíbrio de Nash. Tra-

ta-se de uma combinação de estratégias, uma para cada participan-

te, tal que nenhum jogador possa aumentar seu ganho mudando unilateral

mente de estratégia. Em jogos bi-matriciais, trata-se de um par

(Ak,Br) de estratégias, uma para cada jogador, tal que:

( i= 1, 2, ... , m)

(j=1,2, ... ,n)

A idéia é uma extensão de uma construção econômica cláâ

sica e qu~ será descri ta m?.:Ls adiante, a de equilíbrio de Cournot

para S 01igop6lio, a~cesentada em 1838. Um equilíbrio de Nash

corresp8nde à ~a~~~~alidade dos participantes de um jogo não coo-

perativo num sentido ba~tante restrito: a de uma combinação de

estratégias que, se for orquestrada, não decepciona os partici

pantes, no sentido de que nenhum se arrepende da estratégia que

adotou.

O problema desse conceito de racionalidade , e que, por

hip6tese, os jogos não cooperativos nao obedecem ao comando de um

maestro. Mais ainda, a teoria supoe que o jogo s6 se jogue uma

única vez (no sentido de que um mesmo jogo repetido várias vezes

nao é o mesmo do que várias repetições independentes do mesmo jo-

go, como se verá na pr6xima secção). Isto posto, cabe indagar por

.23.

que jogadores racionais acertam na mosca um equilíbrio de Nash.

Num primeiro caso particular a resposta é simples, quan

do cada jogador dispõe de uma estratégia dominante, como no dile-

ma dos prisioneiros. Isso resulta do seguinte:

Teorema 1.2: Uma combinação de estratégias dominantes

num jogo bi-matricial é um equilíbrio de Nash.

Demonstração: Por hipótese, a kr ~ a ir , para i=1,2, ... ,m e

b kr ~ bkj

para j=1,2, ... ,n.

Num outro caso também é fácil associar racionalidade a

equilíbrio de Nash: aquele em que uma combinação de estratégias

de maxmin fornece um equilíbrio de Nash. Basta, aí, supor que ca-

da jogador seja prudente. Isso é o que ocorre em jogos de duas

pessoas-soma zero com um equilíbrio de Nash,conforme demonstra o:

Teorema 1.3:

Demonstração:

Seja [ao o] a matriz mxn de ganhos do jogador A num 1J

jogo de duas ppssoas-soma zero. Admitamos que o

par d0 estratégias (AkiBr) seja um equilíbrio de

~a~n. Então, indicando por vA e vB o maxmin de ca

da um ~~S jogadores:

= -v B

Por hipótese a kr ~ a ir (i=l, ... ,m) e

(j=l, ... ,n).

o que implica:

max i

ao 1r

, Como o jogo e de soma zero, b o o=-a o o,

1J 1J

(i=l, ... ,m) i (j=l, ... ,n)

= min j

·24.

Em suma, se o par de estratégias (Ak;~r) for um equili

brio de Nash, o elemento a kr da matriz de ganhos do jogador de A

ser~ um ponto de sela, isto é, um elemento mínimo na linha k e

m~ximo na coluna r. Daí se segue imediatamente que:

A título de exemplo, tomemos o jogo de duas pessoas-

-soma zero onde a matriz de ganhos do jogador A é:

BI BII

BIII

BIV BV B

IV

AI 3 O -2 1 -3 -4

AlI 3 2 O 1 1 1

AIII 8 -7 -1 O 9 -8

Basta que o jogador A seja prudente ou admita que B se-

ja ~'rudente para que escolha a estratégia AlI' Pelo mesmo é:. '9"1,

mento, o jogador B escolher~ BIII . Isto posto, chega-s2 ~mediata

mente ao equilíbrio de Nash (AII;BIII)'

Fora casos particulares como os acima apresentados, a

associação entre comportamento racional em jogos não cooperativos

e equilíbrio de Nash é problem~tica. Com efeito, para cada joga-

dor, escolher uma estratégia que leva a um tal equilíbrio ,

so , e

sinônimo de decisão ótima se lhe for assegurado que todos os de-

mais jogadores também escolherão estratégias conducentes a esse

equilíbrio. Ocorre que até no caso mais elementar dos jogos bi-

-matriciais não h~ como fornecer essa garantia, pois o jogador A

. escolhe uma linha e o jogador B uma coluna, cada qual ignorando a

·25.

decisão do parceiro.

Como primeiro exemplo sobre a fragilidade da associação

entre comportamento racional e equilíbrio de Nash, tomemos o jogo

. .. (+) bl.-matrl.cl.al:

(20;20) (-20;20)

(18;18) (16;16)

o único equilíbrio de Nash é a combinação de estratégia

(Al;B l ). Como Bl é a estratégia dominante para o segundo jogador,

A não hesitará em escolher AI se confiar cegamente na racionalid~

de do parceiro. Sucede que, no caso,se B escolher B2 ao invés de

Bl' nada terá a perder se A escolher AI' e pouco perderá se A es

colher A2 . Já para o jogador A, escolher AI será um desastre se

r: 0ptar por B2 . Não é de surpreender, nessas condições, ar:. .... A, que

+~m que tomar sua decisão sem conhecer a de R, opte pr I~ ~~traté-

gia de maxmin A2 .

o exemplo acima mostra o principal problema na associa-

çao entre comportamento racional e equilíbrio de Nash. Para al-

guns participantes do jogo, pode ser extremamente imprudente es-

colher estratégias conducentes a um tal equilíbrio sem a garantia

de que todos os demais jogadores façam o mesmo, o dilema do joga-

dor A no exemplo acima. A explicação convencional usada para as-

(+) Para identificar um equilíbrio de Nash num jogo bi-matricial, há uma regri Rrática muito simples: basta descobrir uma casa onde o ganho de A seja máximo na coluna e o de B máximo na linha.

.26.

sociar racionalidade pm jogos nao cooperativos a equilíbrio de

Nash consiste em engajar cada jogador num exercício mental. Cada

um veste não só a própria pele, mas também a dos parceiros, ,

so

parando a indagação sobre "eu penso que você pensa que eu penso

que você pensa" quando se chegar a urna combinação de estratégias na

qual ninguém possa lucrar mudando unilateralmente a sua decisão".

Infelizmente essa explicação nada explica, pois ela equivale a

postular que comportamento racional é acertar um equilíbrio àe

Nash na mosca. De resto, o exercício mental só faz sentido se se

admitir (o que é uma hipótese gratuita num jogo de informação im-

perfeita) que os demais parceiros se envolvam num exercício seme-

lhante.

, Quanto maior o numero de participantes de um jogo nao

cooperativo sem estratégias dominantes ou onde o equilíbrio de

Nash não corresponde a uma combinação de estratégias de maxmin,

mais temerário se torna escolher uma estratégia conducénte a um

tal equilíbrio sem a garantia de que os demais decidam da mesma

forma. Um exercício interessante jogo da metêoc da média.

N pessoas são convocadas a e2~rp.ver num ped?;o np. ,

naneI um nume-

ro real no intervalo fechado [O;l]. , por x. o numero e~

1

colhido pelo iésimo participante (que deve escoll1er xi desconhe

cendo a opção dos demais), computa-se a metade s da média:

s :; _1_

2N

N E

i:;l

o ganho de cada jogador sendo:

S. 1

i) 100 dólares, se xi :; s, isto é, se sua escolha ti

ver coincidido da metade da média;

ii) O, se x. > s, isto é, se sua escolha tiver ultrapas-1

sado metade da média;

iii) -100 dólares (perda) se

lha ficar abaixo da metade da m~dia.

X. 1

< s,

.27.

icto ~ se sua esco-

É fácil verificar que o único equilíbrio de Nash se al-

cança quando todos os jogadores escrevem zero no seu papelucho

individual. Se todos agirem dessa forma, cada qual ganhará 100

dólares. Sucede que basta que um jogador escreva um número acima

de zero para que quem tiver escolhido zero fique abaixo da m~-

dia e com isso perca 100 dólares, ao inv~s de ganhar a mesma

quantia. Isso ~ o suficiente para que agentes racionais, mas com

um mínimo de prudência, prefiram errar por excesso do que por

falta, já que o excesso nada lhes custa. É muito fácil testar es-

se jogo numa sala de aula com alunos pós-graduados de matemática,

engenharia ou economia. E, desde que se impeça qualquer comunica-

ção entre os participantes, como se supoe na teoria dos jogos nao

cooperativos, ~ muito improvável que se chegue imediatamente ao

equilíbrio de Nash.

Um terceiro exemplo em que a associação entre rac;ona-

lidade e equilíbrio de Nash ~ mais do que problemática, e forne-

cido pelo jogo bi-matricial:

(-20;-20) (15;-15)

(-15;15) (10;10)

primeiro muito bom para o jogador A mas muito ruim para o jogador

B e vice-versa. Como coordenar o jogo, eis um problema que trans-

.28.

cende a idéia de equilíbrio de Nash. Com efeito, se o primeiro

jogador tentar forçar o que lhe é o melhor equilíbrio de Nash,

jogando Ar' e o segundo agir da mesma forma jogando Br' o resul

tado será o pior dos mundos para ambos, com ganhos negativos

(-20;-20). O bom senso sugere que a melhor combinação para ambos

é (Arr;Brr ). Trata-se de uma combinação de estratégias de maxmin,

mas não de um equilíbrio de Nash.

A discussão precedente sublinha um ponto essencial:

salvo em casos especiais, o que seja comportamento racional num

jogo não cooperativo é um conceito ambíguo. A matemática, que

não tolera ambigüidades, explora amplamente as propriedades da-

quilo que se pode definir com precisão, um equilíbrio de Nash.

Resta apenas lembrar que o conceito de equilíbrio de Nash é o de

sabedoria a posteriori: uma combinação de estratégias que, termi-

nado o jogo, não deixa ninguém arrependido. Trata-se, ~e certo

modo, de uma associação espúria entre Aristóteles e Darwin, e que

qualifica como racional quem sobreviveu à seleção natural. E que

d8j~a sem resposta o que realmente constitui a indagação rel~~an

te: como agir no presente para escapar ao arrependimer.tv futuro.

.29.

1.6} Jogos repetidos

Cuidemos agora dos superjogos, isto é, dos jogos repe

tidos. Na presente secção analisaremos especificamente o seguin-

te super jogo: "um mesmo jogo bi-matricial é repetido p vezes; ao

final de cada etapa, cada participante torna conhecimento da es-

tratégia escolhida pelo outro. O ganho final de cada jogador , e a

média aritmética dos ganhos contabilizados em etapa".

A diferença entre o superjogo e p repetições indepen-

dentes do mesmo jogo está no conceito de estratégia, pelo menos

quando se supoe memória perfeita. De fato, há agora dois concei-

tos a distinguir, o de estratégia no superjogo e o de escolha em

cada jogada. Estratégia, no superjogo, é um plano de açao para

cada jogada, função da história até então conhecida do jogo.

Para esclarecer a questão, consideremos o jogo bi-matri

cial em que cada jogador dispõe de duas estratégias:

Consideremos o super jogo correspondente a dois lances

sucessivos desse jogo bi-matricial. No primeiro lance, é óbvio que

cada participante dispõe apenas de duas opções possíveis, ou

A2 para o primeiro, BI ou B2 para o segundo. No segundo lance, PQ

rém, cada jogador pode formular sua escolha em função do que ti-

ver ocorrido no primeiro. Isso aumenta, não de dois para quatro,

.30.

mas de dois para oito, o leque de estratégias de cada participante

do superjogo. De fato, os possíveis planos de A para o superjogo

sao agora:

Estratégia de A lQ lance 2Q lance, se no lQ B tiver escolhido

Bl B2

AI AI AI AI

AlI AI AI A2

AlII AI A2 AI

AIV AI A2

A2

~ A2 AI Ar

~I A2 Ar A2

~lI A2 A

2 AI

~lll A2

A2

A2

Da mesma maneira, os possíveis planos de jogo para B sao:

r Estratégia de B

I BI

BIl

BIll

Brv

BV

BVI

BVII

BVllI

12 lance 22 lance, se no lQ A ti~cr

.31.

Assim por exemplo, a combinação de e~tratégias (AIII,BV

)

implica as realizações (A l ,B2 ) no primeiro lance, (A2

,Bl

) no se

gundo. A combinação (AVI,BVII) leva às realizações (A2

,B2

) e

(A2 ,B l ), e assim sucessivamente. Com um pouco de paciência, é fá

cil verificar que os ganhos no superjogo em questão são dados por:

BI BII BIII BIV BV BVI BVII BVIII

AI a a e e e e b b

AlI a a e e h h 1- i

AIII f f g g e e b b

AIV f f g g h h i i

AV f h f h g i g 1-

~I f h f h j d j d

~II c j c j g i g 1-

AVIII c j c j j d j d

onS0:

a = (all;bll )

b = (a12 ;b12 )

c = (a 2l ;b2l )

d = (a 22 ;b22 )

e = (O,5(a ll+a12 ); O,5(bll +b12 »

f = (O,5(all+a 21 ); O,5(bll+b2l »

g = (O,5(a ll+a 22 ); O,5(b2l +b22 »

h = (O,5(a12+a 21 ); O,5(b12+b2l »

i = (O,5(a12+a 22 ); O,5(b12+b22 »

j = (O,5(a 2l+a 22 ); O,5(b2l+b22 »

.32.

Até que ponto é vantajoso para cada jogador condicio

nar cada lance à história conhecida do superjogo é questão a dis-

cutir. Em alguns casos a resposta é positiva, noutros negativa.

De qualquer forma, a especificação das estratégias no superjogo

cobre os dois tipos de comportamento. Assim, no exemplo apresen-

tado,as estratégias AI' AIV ' AV e AVIII do primeiro jogador (as

sim corno as correspondentes do segundo) estabelecem um comporta-

mento determinístico, no sentido de que as decisões do primeiro

jogador independem do que o parceiro resolver no primeiro lance.

Já as estratégias AlI' AIII , AVI e AVII tornam o segundo lance do

primeiro jogador dependente do primeiro lance do segundo.

Suponhamos que a combinação de estratégias (A , B ) r s

seja o único equilíbrio de Nash de um jogo bi-matricial. Tornemos

o super jogo correspondente a p lances consecutivos do jogo bi-ma-

tricial, cada participante (cuja memória se supõe perfeita) sendo

informado ao cabo de cada lance da escolha do outro. É claro que,

nesse caso, a combinação de estratégias (AR,BS ) onde AR e BS sig-,

n ~[icam escolher incondicionalmente A e B em todos os 12:"~ds e r s

~',.,., ~~'.lilíbr io de Nash do super jogo. Resta indagar se 1""" <=>y; stem

outros equilíbrios de Nash no super jogo em questão. Para t~~to,tº

memos o jogo bi-matricial:

(20;20)

(18;18)

(-20;20)

(16;16)

o único equilíbrio de Nash é (Al;B l ). Consideremos o

superjogo correspondente a dois lances consecutivos desse jogo

I

\

.33.

bi-matricial, os ganhos finais de cada participante sendo ,

a me-

dia aritm~tica dos ganhos contabilizados em cada lance. O super

jogo descreve-se, na forma estrat~gica, por:

Ar I (20; 20) 1I (20; 20) I (O; 20)

AlI [(20;20) 11(20;20) 1 (0;20)

(0;20) (0;20) (0;20) (-20;20) (-20;20)

(0;20) (-1;19) (-1;19) (-2;18) (-2;18)

Arrr (19;19) (19;19) (18;18) (18;18) (0;20) (0;20) (-20;20) (-20;20)

Arv (19;19) (19;19) (18;18) (18;18) (-1;19) (-1;19) (-2;18) (-2;18)

Av (19;19) (-1;19) 1(19;19)J (-1;19) (18;18) (-2;18) (18;18) (-2;18)

Avr (19;19) (-1;19) 1(19;19)1 (-1;19) (17;17) (16;16) (17;17) (16;16)

Avr (18;18) (17;17) (18;18) (17;17) 1(18;18)1 (-2;18) 1(18;18)1 (-2;18)

Avrrr (18;18) (17;17) (18;18) (17;17) (17;17) (16;16) (17;17) (16;16)

Para identificar os equilíbrios de Nash nessa bi-;,':..triz

8 x 8 basta aplicar o crit~rio pr~tico j~ enunciado e~ -~.~ de

rodap~; uma casa ~ equilíbrio de Nash se e somente se nem A ~udeL

!c61horar na coluna nem B puder melhorar na linha correspondente.

Encontram-se assim os oitos equilíbrios de Nash envolvidos

retângulos:

Equilíbrio Realizações em cada lance

(Al;B l )

(Al;B l )

(Al;Bl )

(Al;B l )

(Al;Bl )

em

.34.

Equilíbrio Realizações em cada lance

I!! 2!!

(Arr;B rr ) (Al;B l ) (Al;B l )

(Av;B rrr ) (A2 ;Bl

) (AI;B I )

(Avr;Brrr) (A2 ;Bl

) (AI;B I )

(Avrr;Bv ) (A2

;B2

) (AI;B l )

(Avrr;Bvrr) (A2

;B2

) (Al;B I )

Todos esses equilíbrios retratam s~bedoria a posteriori,

no sentido de que, dada a estratégia do parceiro, ninguém se ar-

repende do que fez. O exercício serve para mostrar corno a repeti-

ção de um jogo pode ampliar o número de equilíbrios de Nash.

Resta examinar corno cada um desses equilíbrios adere , a

noçao comum de racionalidade a priori. Para tanto, lembremos as

características do jogo bi-matricial (2x2) que deu origem ao su-

perjogo; i) B dispõe de urna e~tratégia dominante BI' mas pouco

tem a pc,-::er se escolher :8 2 ; ii) (AI;BI ) é o único equilíbrio de

Nash, jogar AI e o parceiro jogar

B2 ; iii) jogando A2 , c primeiro jogador deixa de ganhar se B

optar pela sua estratégia dominante BI ; mas defende-se com um sa

tisfatório maxmin caso B escolha B2 .

Isto posto, examinemos as estratégias de A e de B en-

volvidas nos oito equilíbrios de Nash no superjogo:

i) Ar: o primeiro jogador escolhe sempre a estratégia

AI' independentemente do que faça B no primeiro lance; trata-se

de uma opção temerária, caso B escolha B2 no primeiro lance;

.35.

ii) Arr: o primeiro jogador começa com AI' na suposição

de que o segundo opte pela estratégia dominante BI. Caso verifi

que que B agiu dessa forma, repete AI no segundo lance. Caso ob-

serve que, no primeiro lance, B escolheu B2 , passa no segundo , a

estratégia de maxmin A2 . Trata-se de uma estratégia sensata;

iii) AV: o primeiro jogador prudentemente toma a estraté-

gia de maxmin no primeiro lance, esperando com isso convencer o

adversário a escolher a estratégia dominante no segundo lance;

isso posto, joga AI no segundo lance. Trata-se de uma sinalização

algo arriscada, mas psicologicamente justifi6ável;

iv) Avr: no primeiro lance, o primeiro jogador caminha

prudentemente com a estratégia de maxmin A2 . No segundo passa pa

ra AloU repete A2 conforme o outro jogador tenha escolhido BI ou

B2 no primeiro lance;

v) Br: trata-se do modelo de comportamento racional pa

ra o segundo jogador, qual seja, optar pela sua estratégia domi-

nante;

vi) B1r

: e~0r~a nao se trate da estratégia dominante, B

pouco ~em a P0L~L- se adotá-la, ao invés de Br. A intenção é pu

nir o jogador A, caso 2~Le comece o primeiro lance com a estraté-

gia de maxmin: para tanto, B joga BI no primeiro lance e, no se

gundo, joga BI ou B2

conforme A tenha escolhido no primeiro lance

AloU A2

. Trata-se de uma estratégia psicologicamente compreensí

vel, ainda que fora do melhor padrão de comportamento racional;

vii) B1rr : trata-se de uma estranha variante da estraté-

gia Brr e que transforma a punição em pr~mio e vice-versa; B co-

meça com BI mas, no segundo lance, troca as bolas: premia A (e

possivelmente a si próprio) jogando BI , caso A, no primeiro lan

ce, tenha escolhido A2 , e vice-versa.

.36.

viii) BV: trata-se de um comportamento 0~tranho do segundo

jogador, que opta no primeiro lance pela estratégia dominada B2

;

ix) Bvrr: o segundo jogador se comporta de forma dupla

mente estranha, optando pela estratégia dominada no primeiro lan

ce, e reagindo à escolha de A no primeiro lance com o sistema de

prêmios e punições às avessas da estratégia Brrr.

Em SUffiu, dos oito equilíbrios de Nash, apenas as com-

binações (Arr;B r ) e (Arr;Brr ) envolvem comportamentos plausíveis

de ambos os jogadores. Nos outros seis, pelo menos um dos parti

cipantes se comporta de modo estranho. Já a combinação bem mais

atrativa ao senso comum (Avr;B r ) em que A é cauteloso e em que B

escolhe sempre a sua estratégia dominante não é um equilíbrio de

Nash.

Vejamos um outro exemplo, o do superjogo em dois lances

do jogo bi-matricial:

(-20;-20) (16;-16)

(-16;16) (10;10)

onde há dois equilíbrios de Nash conflitantes, (A l ;B 2 ) e (A2 ;B l )

o primeiro bom para A mas ruim para B, o segundo bom para B mas

ruim para A. O superjogo descreve-se pela bi-matriz 8 x 8:

.37.

Br Bn Brn Brv BV Bvr Bvn ~vrn

AI (-20j-20) (-20j-20) (-2j-18) (-2j-18) (-2j-18) ·(-2 j -18) 106j-16) 1 106j-16) I AlI (-20:-20) (-20j-20) (-2j-18) (-2j-18) 1 (Oj O) 1 (OjO) (13j-3) (13j-3)

AIII (-18j-2) (-18j-2) (-5j-5) (-5j-5) (-2j-18) (-2j-18) 06j-16) 06j-16)

AIV (-18j-2) (-18j-2) (-5j-5) (-5j-5) I(OjO) 1 (OjO) (13j-3) 03j-3)

AV (-18j-2) I( Oj O) 1 (-18j-2) I(Oj O) 1 (-5j-5) (13j-3) (OjO) (13j-3)

AVI (-18j-2) (OjO) (~18j-2) (OjO) (-3j 13) .<10j10) (-3j13) 00jl0)

AVII I (-16j 16) 1 (-3j 13) (-16j16) (-3j 13) (-5j-5) (13j-3) (-5j-5) (13j-3)

AVIII I (-16j16) 1 (-3j13) (-16j16) (-3j13) (-3j 13) (lOj 10) (-3j13) 00j10)

Os oito equilíbrios de Nash do superjogo realizam, nos

dois lances, os dois equilíbrios de Nash do jogo bi-matricial

(2x2), (AI

;B2

) ou (A2 ;Bl

) ou sucessiva ou alternadamente. O que

parece o compromisso sensato, a combinação de estrat~gids (A2 ;B 2 )

não ~ um equilíbrio de Nash do s .... J~erjogo.

Vale explorar algumas I,Toprieú~C~~ do super jogo corres-

pondente a duas jogadas sucessivas do mesmo jogo bi-matricial

m x n. No primeiro lance, o primeiro jogador escolhe a estrat~gia

r, o segundo a estrat~gia s; no segundo, o primeiro escolhe a es

trat~gia f(s), o segundo a estratégia g(r). Isto posto, uma es

trat~gia de A no superjogo ~ o par de números inteiros (rif(s».

Uma estrat~gia de B, o par (s,g(r». No caso, g(r) ~ uma função

definida no conjunto dos inteiros I a m e com valores no conjunto

dos inteiros· I a n; f(s) com domínio nos inteiros de I a n e com

valores nos inteiros I a m.

.38.

Suponhamos que o par de estrat~gias (r;f(s» (s;g(r) )

seja um equilíbrio de Nash do superjogo. Isso implica que, para

qualquer inteiro i de I a m, para qualquer inteiro j de I a n, e

para quaisquer funções de reação fi (s) e gl (r):

a rs a. 1S + a fl (s)g(i) (1)

( 2)

Particularizemos essas desigualdades tomando i=r e j=s.

Como as funções de reação podem ser escolhidas de modo a se ter

fi (s) igual a qualquer inteiro de I a m e gl (r) igual a qualquer

inteiro de I a n, segue-se, tomando i=r e j=s, que:

(p= I, ... , m)

(q= I, ... , n)

Isso significa que o equilíbrio de Nash do super jogo

realiza, n0 lance final, um 2quilíbrio de Nash do jogo bi-matri-

cial c .... :iginal, como ~_usinuam os dois exemplos acima discutidos.

J~ para o p~jmeiro lance, nao se pode assegurar que a

realização do equilíbrio de Nash no superjogo também seja um e-

quilíbrio de Nash do jogo bi-matricial. A razão, analiticamente

explicada pelas desigualdades (1) e (2), é que, ao alterar a es-

colha no primeiro lance, cada jogador pode levar o parceiro a al-

terar a escolha do segundo lance.

Não obstante, é possível obter uma desigualdade muito

importante quanto aos ganhos no primeiro lance. Designemos por:

WA af(s)g(r)

wB ::::: bf(s)g(r)

·39.

Corno foi visto, esses sao os ganhos correspondentes a

um equilíbrio de Nash do jogo bi-matricial simples. Observemos a-

gora que, qualquer que seja a função de reação g(i) do segundo ,

jogador a primeira jogada do primeiro, A pode escolher fI (s) de

modo a pelo menos lhe assegurar o seu maxm1n vA

. Do mesmo modo,

B pode escolher gl(r) de modo a garantir seu maxmin vB

. Isto pos

to, as desigualdades (1) e (2) levam a:

a + wA ~ a. + v A rs 1S (i=l, ... ,m)

(j=l, ... ,n)

Num caso particular, essas desigualdades levam a uma

conclusão extremamente importante, aquele em que todo equilíbrio

de Nash também é um equilíbrio de maxmin, no sentido de que

WA=vA e wB=vB . Nesse caso, pode-se assegurar que um equilíbrio de

Nash do superjogo realiza, desde o primeiro lance, um equilíbrio

de Nash do jogo matricial.

É fácil estp~0e~ a demonstração acima em duas direções:

do mesmo jogo de 2 para p,

sendo pu!;; inteiro p2sitivo. (Basta, para tanto, quebrar o super-

jogo em dois lances de um ~rimeiro jogo bi-matricial correspon-

dente ao primeiro lance, e um segundo correspondente aos p-l úl-

timos lances, e então raciocinar por indução finita); ii) esten-

dendo de 2 para N o número de jogadores. Conclui-se que, se qual-

quer equilíbrio de Nash é também um equilíbrio de maxmin, então o

superjogo, em matéria de equilíbrios de Nash, é equivalente, em

matéria de realizações, a p repetições independentes do mesmo jo-

. , go. Em suma, nesse caso, n1nguem tem o que ganhar condicionando

suas decisões à história conhecida do jogo.

,,----------------- -- -

.40.

o equilíbrio de Nash de um jogo bi-matricial é um equi

líbrio de maxmin em dois casos particulares: i) nos jogos em que

cada jogador dispõe de urna estratégia dominante; ii) nos jogos

de duas pessoas-sorna zero com ponto de sela. Isso leva à conclu-

sao de que, nesses casos, a repetição é incapaz de trazer novida-

des em matéria de equilíbrios de Nash.

No caso dos jogos de duas pessoas-sorna zero com ponto

de sela, a conclusão nada tem de surpreendente. Afinal, se, em ca-

da lance, A pode garantir um ganho mínimo vA e B um ganho mínimo

vB' sendo vA+vB=O, não há por que imaginar que a repetição do jogo

possa trazer qualquer novidade, quer o jogo seja repetido ,

um nu-

mero finito ou infinito de vezes. De fato, o único sentido da re-

petição é dar consistência prática ao conceito de estratégias

mistas em jogos matriciais sem ponto de sela, assunto de que tra-

taremos na próxima secção.

Já no caso do dilema dos prisioneiros, em que a estra-

tégia dominante é confessar, e conclusão é decepcionante. Com e-

feito, ~~ria de se p~ep~mir que a repetição levasse à cooperaçao.

Contuà~" corno '-.:~ .... rata de um jogo em que o equilíbrio de Nash

coincide com o de maxnl~ 1 1 , em qualquer equilíbrio de Nash do dile-

ma dos prisioneiros repetido um número finito de vezes, a apeli-

dada "estratégia de disparo", na qual nenhum confessa até ser in-

formado de que o parceiro confessou no lance anterior, confessan-

do daí por diante, é visivelmente superior ao "confessar sempre"

de qualquer equilíbrio de Nash. Apenas, no dilema dos prisionei

ros repetido um número finito de vezes, a estratégia de disparo

nao é equilíbrio de Nash. Da mesma forma, no jogo bi-matricial

com equilíbrios de Nash conflitantes:

.41.

(-20;-20) (16;-16)

(-16;16) (10;10)

A combinação prudente e cooperativa (A2 ;B 2 ) nao fornece

um equilíbrio de Nash se o jogo só for repetido um número finito

de vezes. A estratégia de disparo, no caso, seria A jogar A2

en

quanto B jogasse B2 e vice-versa, cada qual tratando de punir o

outro que tomasse a iniciativa de querer lucrar à custa do prejui

zo do outro.

Esse impasse leva ao estudo dos jogos nao cooperativos

repetidos por um número infinito de vezes. Aí sim, as estratégias

de disparo se transformam em equilíbrios de Nash. No dilema dos

prisioneiros, cada um nega até que o outro confesse, e daí por

diante confessa. A combinação dessas estratégias no jl':Jo infini-

tamente repetido é um equilíbric ~e Nash, par~ o.~uJio dos matemá-

ticos. E, cuja realização prát<"':d é a r"!..~. ~:cnciCt Ud racionalida-

de coletiva sobre a individual já q~e ninguém c~nfessa em qual-

quer lance do jogo. Na mesma linha, no jogo bi-matricial com e-

quilíbrios de Nash conflitantes anteriormente apresentado, a com-

binação de estratégias em que A escolhe A2 enquanto B escolher

B2 passando para AI quando B tiver escolhido Bl e vice-versa,

um equilíbrio de Nash do super jogo infinitamente repetido.

, e

Na realidade, a teoria dos jogos infinitamente repeti-

dos é bem mais consentânea com o comportamento do mundo real do , ,

que a dos jogos que acabam apos um numero finito de iterações. A

diferença resulta de que, no último caso, os participantes do jo-

.42.

go substituem a reputação pelo egoísmo na últim~ jogada. Por que

os mortais não agem dessa maneira descrita nos jogos finitamente

iterados, explica-se por tr~s razoes: a) ningu~m sabe o dia exa

to da morte; b) não falta quem creia na vida eterna; c) mesmo

os agnósticos podem querer deixar urna herança de honorabilidade e

reputação individual.

.43.

1.7) Estratégias mist3s

A análise precedente omitiu uma indagação essencial, a

existência de equilíbrios de Nash em jogos bi-matriciais. Infe-

lizmente tal existência não pode ser assegurada, pelo menos na

medida em que o jogo é descrito como "A escolhe uma linha e B u

ma coluna do par de matrizes." A título de exemplo, tomemos o jo

go bi-matricial:

(10;6)

(9;4)

(4;8)

(10;3)

Em qualquer das quatro casas do par de matrizes, ou A

pode melhorar mudando de coluna ou B pode aumentar seu ganho mu

dando de linha. Isso significa que nenhuma das quatro combinações

possíveis de estratégias puras ~ um equilíbri 0 de Nash.

Na mesma linha, tomem02 o jogo d~ ~~ns pessoas-soma ze

ro, onde os ganhos do primeiro jogador são dados por:

1

-1

-1

1

A matriz em questão nao possui nenhum ponto de sela,

1-.44.

isto é, um elemento que seja ao mesmo tempo mínimo de linha ,

e ma-

ximo de coluna. O que seja comportamento racional, no caso, , e uma

questão insolúvel, no sentido de que A pensará com seus botões:

IIse eu escolher AI o melhor para meu adversário será escolherB2

;

mas se ele optar por B2 , melhor para mim será escolher A2 ; nesse

caso, a melhor escolha de meu adversário será Bl , e aí o melhor

para mim é voltar para AllI. B enfrenta o mesmo dilema.

Para contornar o problema, von Neumann inventou o con-

ceito de estratégia mista, como tal entendida uma distribuição

de probabilidades no conjunto das estratégias puras. Para ilus-

trar a questão, comecemos com os jogos bi-matriciais 2 x 2, do

tipo:

'-------

Se A escolhe AI com probabilidade l-x e A2 com probabi-

lidade x (O ~ x ~ 1) e se B escolhe Bl com probabilidade l-y e

B2

com probabilidade y (O ~ y ~ 1), tem-se um

cujas possíveis realizações sao:

(Al;B l ) com probabilidade (l-x)(l-y)

(Al ;B 2 ) com probabilidade (l-x)y

(A 2 ;B l ) com probabilidade x(l-y)

(A 2 ;B 2 ) com probabilidade xy

jogo aleatório,

• .45.

Isto posto, os ganhos esperados de A e B sao:

w(A) = (l-x)(l-y)all + (l-x)y a 12 + x(l-y) a 21 + xy a22

w(B) = (l-x)(l-y)bll

+ (l-x)y b12

+ x(l-y) b21

+ xy b22

Um equilíbrio de Nash é agora uma combinação de estra

tégias mistas, uma para cada jogador, tal que nem A possa aumen

tar seu ganho espêrado modificando unilateralmente x, nem B possa

aumentar seu ganho esperado modificando unilateralmente y. No ca

so de jogos bi-matriciais com apenas duas estratégias puras para

cada jogador é fácil calcular o equilíbrio de Nash com estraté

gias mistas.

Com efeito, tomemos as derivadas parciais:

FA(y) dw(A)

(1-y)(a21

-all ) + y(a22

-a12

) . = = dX

FB(X) dw(B)

(l-x) (b12-bll ) + x(b22-b21 ) = = dy

Num equilíbrio de Nash deve-se ter simultane~illente:

? O; se x = O

= O; se O < x < 1

O; se x = 1 ~

~ O; se y = O

= O; se O < Y < 1

<: O; se y = 1

No caso particular dos jogos bi-matriciais com apenas

duas estratégias puras para cada jogador, a existência de um

equilíbrio de Nash com estratégias mistas prova-se trivialmente.

Com efeito, das duas uma:

• .46.

a) pelo menos um jogador dispõe de urna estratégia domi-

nante: nesse caso, há um equilíbrio de Nash com estratégias pu-

ras (que são casos particulares de estratégias mistas), construí-

do da seguinte forma: i) o jogador que dispõe de estratégia domi-

nante escolhe essa estratégia; ii) presumida essa escolha, o ou-

tro jogador toma a estratégia que lhe dê o maior ganho possí-

vel;

b) nenhum jogador dispõe de uma estratégia dominante:

nesse caso, (a21-all)(a22-a12) < O e (b12-bll)(b22-b21) < O. Sg

gue-se que FA(O)FA(l) < O e FB(O)FB(l) < O. Como as funções

FA(y) e FB(X) são lineares, e portanto contínuas, existem x€(O;l)

e i€(O;l) tais que FA(y) = FB(x) = o. Os valores de x e y sao ex-

pressos, no caso por:

x = y =

Assim, por exemplo, no jogo bi-matricial já apres:,:õ·::é'd·:):

(10;6) (4;8)

(9;4) (10;3)

obtém-se x = 2/3, y = 1/7. No equilíbrio de Nash com estraté-

gias mistas,o primeiro jogador escolhe lotericamente as estraté

gias AloU A2

com probabilidades (1/3; 2/3), o segundo mistura

B e B com probabilidades (6/7; 1/7). Nesse equilíbrio, os ga-. 1 2

nhos esperados são:

64 w(A} = ;

7 w(B} = 14

3

·47.

Qual o significado prático do conceito de estratégia

mista, eis uma questão que dá panos para mangas. À primeira vista,

parece uma temeridade o jogador A misturar as estratégias para

obter um ganho esperado de 64/7, mas com o risco de ganhar apenas

4 (se se realizar a combinação de estratégias (Al ;B 2 }), ao . , lnves

de se ater à estratégia do maxmin,que lhe assegura um ganho pelo

menos igual a 9 = 63/7. Há duas escapatórias, cada qual com os

seus problemas.

A primeira, na linha de von Neumann e Morgenstern, con-

siste em admitir que os ganhos de cada jogador sejam medidos em

termos de utilidades e não em termos de pagamentos efetivos. As

utilidades transformam os pagamentos por meio de funções. que hie-

rarquizam as preferências de cada indivíduo diante de problemasde

escolha envolvendo risco, conforme se verá no Capítulo IV. Dentro

da t80ria, o objetivo de cada participante do jogo é o de maxirni·

zar a utilidade esperada, dadas as escolhas estratégic?~ dos de-

mais participantes. Isso dá pleno suporte à idéia de ~qtratés:~

mista. Surgem, no entanto, dois outros problemas. Primeiro, salvo

para os indivíduos indiferentes ao risco, a utilidade da média

nao é a média das utilidades. Isso torna bem mais complexa a teo-

ria dos jogos repetidos. Além do mais, em jogos nao repetidos,

torna-se essencial lembrar que jogos de duas pessoas - soma zero

não necessariamente são jogos de soma de utilidade zero. (Esse

é um ponto, aliás, muito importante, e que explica por que os po

bres não costumam jogar pôquer com os milionários).

A outra escapatória consiste em admitir que os jogos

sejam repetidos muitas vezes, e que a sabedoria das estratégias

.48.

mistas encontre abrigo na lei dos grandes números. o problema , e

que,· como se viu na secção anterior, um mesmo jogo repetido n ve-

zes não necessariamente equivale a n repetições independentes do

mesmo jogo. De qualquer forma, a idéia pode ser defendida pois,

como já se viu, a repetição de um equilíbrio de Nash no jogo for

nece um equilíbrio de Nash no superjogo.

Em qualquer hipótese, o conceito de estratégia mista

fornece uma pista para o que seja comportamento racional em jogos

onde não existem sequer equilíbrios de Nash com estratégias pu-

ras, como no caso da mini-porrinha.

Voltando ao caso dos jogos bi-matriciais com apenas

duas estratégias para cada participante, vale sublinhar um ponto

fundamental: é possível que existam, ao mesmo tempo, equilíbrios

de Nash com estratégias puras e equilíbrios de Nash com estraté-

gias mistas. A título de exemplo, voltemos ao jogo bi-matricial:

(-20;-20) (15;-15)

(-15;15) (10;10)

Há dois equilíbrios de Nash com estratégias puras

(Al

;B2

) e (A2

;Bl). Além do mais, como nenhum dos jogadores dis

põe de uma estratégia dominante, há um equilíbrio com estratégias

mistas, cada jogador combinando as suas duas estratégias com pro-

babilidades (1/2; 1/2), e obtendo ganhos esperados wA=wB=-5/2.

.49.

o conceito de estrat~gia mista se e3~ende naturalmente

para os jogos bi-matriciais com m estrat~gias puras para o pri-

meiro jogador e n para o segundo. Para tanto definamos o simplexo

k-l k fundamental S do R como sendo o conjunto dos vetores do

Rk com coordenadas nao negativas e de soma igual a 1:

k-l I S = {(Pl"" ,Pk) Pl ~ Oi •• • Pk ~ Oi Pl+'" .+Pk = I}

Uma estrat~gia mista primeiro jogador ,

para o e um vetor

E: m-l estrat~gia mista segundo jogador p S , uma para o um vetor

E: n-l Indicando p' a matriz lxm transposta da matriz q S • por co-

luna p, os ganhos esperados de cada jogador, combinando as estra-

t~gias puras de acordo com os vetores de probabilidade p e q, se-

rão dados por:

m w(A) = L

i=l

m w(B) = L

i=l

n L

j=l

n L

j=l

a .. p.q. 1.J 1. J

b .. p.q. 1.J 1. 1.

=

=

p'Aq

p'Bq

Isto posto, um equilíbrio de Nash define-se ,_._--UlT''''

combinação de estrat~gias (poiqo)' uma para cada jogador, --:"ll q,-le

nénhum deles possa aumentar seu ganho mudando unilateralmente de

e&trat~gia, isto ~, tal que:

p' Aq ~ P Aq o o o para

p' Bq ~ p' Bq o o o para

todo

todo

m-l p E: S

n-l q E: S

Note-se que um equilíbrio de Nash com estrat~gias pu

ras ~ tamb~m um equilíbrio de Nash no campo das estrat~gias mis-

tas. Com efeito, se a combinação (Ar,Bs) ~ um equilíbrio de Nash

no campo restrito das estratégias puras:

a rs ~ a.

1S

~ b . rJ

(i=l, .... ,m)

(j=l, .... ,n)

.50.

m .ésima Indicando por e i o vetor do R cuja 1 coordenada é

igual a 1 e as demais iguais a zero, e por f. o vetor do Rn J

cuja

.ésima d ' . J coor enada e 19ual a 1 e as demais iguais a zero, as desi-

gualdades acima equivalem a:

e' Af ~ e! Af r s 1 s

e " B f ~ e' B f . r s r J

(i=l, .... ,m)

(j=l, .... ,n)

Daí se segue que se p = (Pl' .... 'Pm) , e um vetor do

m-l S , isto é, um vetor com coordenadas não negativas e soma 1:

p.e'AF ~ p.e!Af 1 r s 1 1 S

(i=l, .•... ,m)

e por~anto, somando para i de 1 a m:

a = e'Af ~ p'Af rs r s s

Do mesmo modo se conclui que:

= e'Bf > e'Bq r s r

para qualquer q E Sn-l.

Do ponto de vista analítica, a mágica do conceito de e~

tratégia mista é que ele transforma o conjunto de estratégias de

cada jogador num subconjunto convexo e compacto do Rk

(o inteiro

k podendo variar de um jogador para outro). Com isso, consegue-se

provar a existência de pelo menos um equilíbrio de Nash não ape-

nas para jogos bi-matriciais, mas para jogos bem mais gerais de n

.51.

pessoas. Cuidaremos do assunto no Capítulo 3. A demonstração , e

bem mais sofisticada do que a acima apresentada para jogos bi-ma-

triciais com apenas duas estratégias para cada jogador, exigindo

a substituição da aritmética simples pelo teorema de Kakutani.

.52.

1.8) O Oligopólio de Cournot

Corno se disse anteriormente, a idéia de equilíbrio de

Nash num jogo não cooperativo é urna extensão do modelo de oligo-

pólio desenvolvido por Cournot em seu "Recherches sur les princi-

pes Mathématiques de la Théorie des Richesses" publicado em 1838.

Vale apresentar esse modelo.

Cournot admite um mercado onde n empresas concorram pa-

ra a produção de um produto homogêneo, onde a curva de demanda

inversa é p = f (Q), sendo Q o total das quantidades vendidas pe-

las n empresas por unidade de tempo. Designando por qi a quantidª , .

d d 'd 1 .eSlma 'd d e a pro UZl a pe a 1 empresa por unl a e de tempo, por

C.(q.) o custo de produção dessa quantidade e supondo que as quaQ 1 1

tidades vendidas sejam iguais às produzidas, o lucro da .ésima 1 e~

presa será dado por:

L. (q.) = pq. - C. (q.) = q.f(ql+q2+ ... +q ) - C. (q.) 1 1 111 1 n 1 1

A hipótese de Cournot é que cada empresa escolha 0_ de

modo a maximizar o seu lucro tornando corno dadas as G'-.ctntidades

produzidas pelas concorrentes. Isso equivale a tratar o 0]igopó-

:Iio corno um jogo não cooperativo em que o campo de estratégias de

cada participante é o conjunto dos reais não negativos. Um equi-

líbrio de Cournot é assim um equilíbrio de Nash.

Na discussão que se segue suporemos que L.(q.) seja con 1 1

tínua em todas as suas variáveis, côncava em ql' e que L.(q.) ten-1 1

do a menos infinito quando qi tende para o infinito (esta última

hipótese pode ser substituída pela de que cada empresa possua um

limite máximo de produção q., o que restringe o campo de estraté-1

gias de cada participante ao intervalo fechado o ~ q. ~ q.). 1 1

.53.

Com essas hip6teses, prova-se que existe pelo menos um equilíbrio

de Cournot.

e,

No caso de a função L.(q.) ser diferenciável: 1 1

aLo 1

aq. 1

= q.f'(Q) - C~(q.) + f(Q) 1 1 1

Num equilíbrio de Cournot deve-se ter:

aLo ~ O, se q. = q. 1 1 1

aq. = O, s.e O < q. < q. 1 1 1

~ O, se q. = O. 1

obviamente Q == ql+q2+···+q n·

Vejamos alguns exemplos:

Exercício 1: Um produto é fornecido por n empresas com

iguais curvas de custos C.(q.) = cq., e que se comportam como 0-111

ligopolistas de Cournot. A função demanda inversa é P= max{a-bQ;O}

sendo b > O a > c > O. Determj !'-':.(" os preços, qllê'!'". cidades produ-

zidas e lucros no equilíbrio.

Solução

A função L.(q.) == q.(a-bQ) - cq. é diferenciável, sendo: 111 1

aLo ].

aq. 1

= a-c-b(Q+q.) 1

É impossível: a) que nenhuma empresa produza quantida-

des positivas, pois, isso implicaria a-c-b(Q+qi) = a-c~O, contra

riamente à hipótese a > c > Oi b) que algumas empresas produzam

quantidades positivas e outras nada produzam, pois isso implica-

.54.

ria a-c-bQ ~ a-c-b(Q+q.) para algum q. > 0, o que implicaria b ~ 0, .11

também contrariamente à hipótese. Logo, todas as empresas produ-

zem quantidades positivas, e portanto:

a-c-bQ = bq. 1

Q, segue-se que:

Q =

p =

nq. = 1

a+nc

n+l

n

n+l

L. (q.) = (p-c) q. = 1 1 1

a-c

b

1

Todas as empresas produzem a mesma quantidade, o que

nao chega a ser surpreendente, já que todas elas possuem iguais

curvas de custos. Mais ainda, como os custos marginais sao cons-

tantes iguais a c, quando n tende para o infinito o preço tende

ao de p:;,':.i.líbrio compAtitivo p=c e não apenas o lucro de cada em-

preSd.

zero.

wa::> v , '.:"':::'-- .:!O co .. j U.H l.U uas empresas nL. (q.), converge 1 1

para

A suposição de que empresas com iguais curvas de custo

produzem quantidades iguais num equilíbrio de Cournot não necessª

riamente é verdadeira, como se depreende do exemplo abaixo.

Exercício 2: Um produto, cuja função demanda inversa é

p = max{lO-Q;O} é suprido por uma indústria com 31 empresas, to-

das elas com a mesma curva de custos:

q.+l 1

se

C(q.) = ° se q.=O 1 1

q.>O 1

• .55.

Achar o preço do produto, a produção de cada empresa e

o lucro de cada uma delas num equilíbrio de Cournot.

origem:

Solução: Notemos que a função lucro é descontínua na

L.(q.) = q.(lO-Q) 111

ql· - 1 = 9q.-q.Q -1 se q. > O 111

L.(q.) = O se q. = O. 111

Suponhamos que num equilíbrio de Cournot haja n empre-

sas com produção positiva e 3l-n empresas com produção zero

(O~ n ~ 31). Para as empresas com produção positiva deve-se ter:

aLo 1

aq. 1

= 9-Q-q. = O 1

Daí se segue, somando de 1 a n:

Q = nq. = 1

p = lO-Q =

9n

n+l

n+10

n+l

L.(q.) = (9-Q)ql·- l = 1 1

~

bi-(n~l)~

(n+l)2

Como qualquer empresa dispõe da opçao de nada produzir

e ficar com lucro zero, num equilíbrio de Cournot L.(q.) não pode 1 1

ser negativo. Daí se segue que o número de empresas com produção

positiva é menor ou igual a 8.

Designemos agora por Q a quantidade produzida pelas em-

presas. Dentro do conceito de equilíbrio de Cournot, uma empresa

com produção zero (e portanto com lucro zero) não deve poder con-

.56.

seguir aumentar seu lucro entrando no mercado com uma produção

positiva q, supondo que essa sua decisão não altere Q. Isto pos-

to, entrar no mercado com uma quantidade q implica rebaixar o pr~

ço do produto para p=lO-Q-q e obter um lucro:

L(q) = q(lO-Q-q) - q - 1 = _q2 + (9-Q) q - 1

Num equilíbrio de Cournot, essa expressa0 deve ser me-

nor ou igual a zero para qualquer q ~ O. Isso exige:

2 (9-Q) - 4 ~ O

ou seja, Q ~ 7. Tomando a expressa0:

Q = 9n

n+l

e lembrando que n é inteiro, conclui-se que, num equilíbrio de

Cournot, n ~ 4.

Daí se conclui que existem, no caso, múltiplos equilí-

b~jos de Cournot, com n=4, n=5, n=6, n=7, n=8, onde o tota1 prc-

duzido, o preço e o lucro de cada empresa com produç2.0 positiva

L.(q.) sendo indicados na tabela abaixo. 1 1

n Q p

4 36/5 14/5

5 45/6 15/6

6 54/7 16/7

7 63/8 17/8

8 8 2

L. (q. ) 1 1

56/25

45/36

32/49

17/64

O

.57.

A existência de equilíbrios com n=4, n=5 e n=6 sur-,

preende a primeira vista. Com efeito, em qualquer desses casos

alguma das 31-n empresas com produção zero poderia entrar no mer-

cado e conseguir um lucro positivo. O problema , e que, no oligo-

pÓlio de Cournot, cada empresa admite que as suas decisões de

produção não afetem as quantidades produzidas pelas demais empre-

sas, e isso leva uma empresa com produção zero a nao entrar no

mercado desde que n ~ 4. Sucede que essa suposição nao se rea-

lizai a produção de cada empresa em operação é qi = Q/n = 9/(n+l),

caindo quando uma nova empresa passa a produzir quantidades po-

sitivas.

O exemplo acima salienta a principal debilidade do mo-

delo de oligopólio de Cournot: ele parte de uma premissa de com-

portamento e chega à conclusão contrária. Na premissa, as empre-

sas supoem que as suas decisões de produção não afetem as das

concorrentes. Na conclusão, o que cada empresa decide afeta o

comportamento das demais.

Vejamos ago~a d~is exemplos onde as empresas possuem

1 · - '. ~ .~ ~. ~ d-um l.JULl.Ç lIIa)(1Tl".'::; :: (::lpa'--..Lu.uu~ ue pro uçao.

Exercício 3: Um produto, cuja curva de demanda inversa

é expressa por p = max{7-2QiO}, é suprido por três empresas, todas

elas com capacidade máxima de produção q. = 1, e com curvas de 1

custos Cl(ql) = ql' C2 (q2) = 2q2' C3 (q3) = 3q3· Determinar as quan

tidades produzidas, o preço e o lucro de cada empresa no equilí-

brio de Cournot.

Solução:

Os lucros das três empresas sao dados por:

.58.

LI (ql,q2,q3) ql(7-2ql-2q2-2q3)-ql 2 = = 6ql-2ql-2qlq2-2qlq3

L2 (ql,q2,q3) q2(7-2ql-2q2-2q3)-2q2 2 = = 5q2-2q2-2qlq2-2q2q3

L3 (ql,q2,q3) q3(7-2ql-2q2-2q3)-3q3 2

= = 4q3-2q3-2qlq3-2q2q3

Segue-se que:

aLI 6 4ql 2q2 2q3 = - - -

aql

aL 2 5 4q2 2ql 2q3 = - - -aq2

aL3 4 4q3 2ql 2q2 = - - -aq3

aL.

{: o, se q. = I

1

No equilíbrio deve-se ter 1 O, O I se < q. < aq.

1

1 O, se q. = O 1

Encontra-p~ ql=l. Q2=2/3, q3=1/6. Segue-se que p=10/3,

:". =8/9; L,

Exercício 4: O mercado de água mineral numa

suprido por n empresas com capacidade máxima de produção

região

q. 1

, e

=

= I (i=I,2, ... ,n) e que operam com custo zero. A demanda de , agua

mineral é dada por Q = 100/p. Achar a produção e o lucro de cada

empresa no equilíbrio de Cournot .

. ésima ' Solução: O lucro da 1 empresa e dado por:

O, se qi = O

100qi ------------, se qi > O

ql + ... +qn

.59.

Daí se conclui que nao interessa a nenhuma empresa dei-

xar de produzir alguma quantidade positiva. Isto posto,

Li (ql,q2,···,qn) é função crescente de qi' dadas as quantidades

produzidas pelos demais concorrentes. Portanto interessa a cada

empresa produzir o máximo permitido por sua capacidade. Isso

significa que, no equilíbrio de Cournot,ql = q2 = •••• = qn = 1 e

L = L = 1 2 = L = 100/n. n

Note-se que, no caso, o equilíbrio de Cournot é também

um equilíbrio de maxmin. Com efeito, designando por q. a produção ~

.ésima da ~ empresa e por Qi = Q-qi a de suas concorrentes:

L. (q. ,Q. ) = 100 ~ ~ ~

q. ~

q.+Q. ~ ~

sendo função decrescente de Qi e crescente de qi· Como O ~ ql ~ 1

e O ~ Q. ~ n-l: ~

max min

q. Q. ~ ~

L.(q.,Q.) = ~ ~ ~

100

n

.60.

·1.9) Jogos Cooperativos

Cuidemos agora dos jogos cooperativos, isto é, aqueles

em que os participantes podem comunicar-se antes do jogo, vincu-

lando-se por contratos e coalizões. Tais jogos podem comportar

várias especificações diferentes que serão estudadas ,

em cap1.tu-

los posteriores. Neste capítulo introdutório cuidaremos de um ú-

nico tipo, os chamados jogos cooperativos com utilidades transfe-

ríveis. Tais jogos permitem transferências de ganhos entre os

participantes e admitem que a transferência de urna sorna T do jo-

gador i para o jogador j aumente em T a utilidade de j e diminua

também em T a utilidade de i.

Especificamente, suponhamos um jogo com n participan-

tes e indiquemos por N o conjunto dos jogadores. Por hipótese, o

campo de estratégias de vários participantes

L2 (Xl

'X2

' .... ,xn

), ... , Ln (x l ,x2 ' .... ,xn ) são funções contínuas de

suas variáveis.

A teoria dos jogos cooperativos parte de n~;~ con-

'L..' • uas1.Cos:

a) o maxmin v. de cada jogador, isto é, o ganho que ele 1.

pode garantir para si quaisquer que sejam as estratégias esco-

lhidas pelos demais participantes. Designando por Yi o vetor das

estratégias dos demais jogadores, isto é, Yi = (xl' .... ,xi-l,x i + l '

, ••• ,X ), tem-se que: n

Logo:

v. = max 1. min

x. y. 1. 1.

= F.(x.,y.) 1. 1. 1.

F.(x.,y.) 1. 1. 1.

.61.

b) o valor v(N) do jogo, isto é, o ganho máximo conjun-

to que os participantes podem obter coordenando as suas decisões:

v(N) = n r

i=l L.(X1 ,···,X) ~ n

A existência do maxmin de cada jogador bem como do va-

lor do jogo é assegurada pelo fato de os campos de estratégia de

cada jogador serem compactos e os ganhos serem funções contínuas

das estratégias escolhidas.

Note-se que, se todos os jogadores escolherem uma combi-

naçao (xi,x2, ... ,x~) de estratégias de maxmin, o ganho de cada um

deles será maior ou igual a vi' isto é:

n Como r

i=l

Segue-se que:

Vl+V~+ ••. ~V ~ v(N) _;' n

Essa desigua~~~de leva à divisão dos jogos em dois gru-

pos:

a) jogos inessenciais:

b) jogos essenciais:

Nos jogos inessenciais nao há qualquer espaço para coo-

peraçao. Com efeito, nenhum jogador tem razoes para aceitar um

.62.

ganho inferior ao seu h.3xmin e a união de forças nao permite

que nenhum deles ganhe mais do que o maxmin. O , .

exerclclo 4 da

secçao anterior, o do mercado de água mineral, fornece um exemplo

típico de jogo inessencial. O lucro máximo que o conjunto dos n

produtores pode obter é igual a 100 e o maxmin de cada um deles

é igual a 100/n.

Concentremo-nos pois nos jogos essenciais de n pessoas.

É de se presumir que os ganhos sejam distribuídos de acordo com

dois princípios:

i) racionalidade individual: nenhum

menos do que seu maxmin v.; 1

jogador receberá

ii) racionalidade coletiva: o conjunto dos jogadores re-

ceberá o valor v(N) do jogo.

Isso dá lugar à definição de imputação. Num jogo de n

pessoas, urna imputação é um vetor n-dimensional u= (u"u2 , ... ,u ) _ n

tal que:

u. ~ V. 1 1

(i=1,2, ....• d

Em suma, urna imputação é urna distribuição do valor to-

tal do jogo entre os seus participantes e que garanta a cada um

deles um ganho não inferior ao seu maxmin. Os . ,.

prlnclplos de ra-

cionalidade individual e coletiva sugerem que a solução de um jo-

go cooperativo seja uma imputação. Sucede que isso é uma afirma-

tiva demasiado vaga, pois num jogo essencial há, por definição,

urna infinidade de imputações. Isto posto, parece importante es-

treitar o campo possível de candidaturas à solução de um jogo

cooperativo.

1---.63. I

Uma primeira idéia é que os participantes podem formar

coalizões cujo maxmin pode ser maior do que a soma dos maxmins

dos seus membros. Especificamente, definiremos coalizão como sen-

do qualquer subconjunto de N. Seja S uma coalizão nao vazia com

menos de n participantes. Indiquemos por qs o vetor cujas compo

nentes são as estratégias dos participantes de S e por qs o vetor

cujas componentes são as estratégias dos jogadores pertencentes a

N-S. Os ganhos dos participantes da coalizão podem ser expressos

sob a forma:

r icS

=

Isto posto, o maxmln da coalizão é:

v(S) = max min

Isto nos leva ~ definição de função característica do

jogo: trata-se de uma função real, definida no conjunto de partes

de N e que a cada coalizão associa o seu maxmin. Completa-r,", a

função característica de modo a que seu valor seja v{~j para a

coalizão global dos n participantes, e v(~) = O para a soaliz;"-·

vazia. Isto posto, é f~cil demonstrar que a função característica

é superaditiva, no sentido de que:

se S n T = ~ v(S u T) ~ v(S) + v(T)

Vejamos dois exemplos.

Exemplo 1: Tomemos o oligopólio do exercício 3 da secçao

anterior, onde a produção de cada empresa pode variar no interva

O ~ q. ~ 1 (i=1,2,3) e onde os lucros das empresas são dados 1

lo

por:

max ql

max q2

max q3

max (Ql,q2)

max (Ql,Q3)

max (q2;Q3)

Ll (ql,q2,q3) 2

2qlq2-2qlq3 = 6ql-2ql

L2 (ql,q2,q3) 2

2qlq2-2q2q3 = 5q2-2q2

L3 (ql,q2,q3) 2

- 2qlq3-2q2q3 = 4q3-2q3

Observando que O ~ q. ~ 1 para i=1,2,3, obtém-se: 1

min LI (ql,q2,q3) 2 0,5 = max 2ql-2ql =

(q2,q3) ql

min L2 (Ql,Q2,q3) 2 0,125 = max q2- 2q2 .-

(ql,q3) q2

min L3 (Ql,Q2,q3) 2 O = max 2q3 =

(ql,q2) q3

.64.

min Ll (ql,q2,Q3)+L2 (ql,Q2,q3) 2

= max 4ql+3q2-2(ql+q2) =2 (Ql,Q2) Q3

min Ll (Ql,Q2,Q3)+L3 (Ql,Q2,Q3) 2

= max 4ql+2Q3-2(Ql+q3) =2 Q2 (Ql,Q3)

a maximização do lucro total exigindo que as empresas coordenem a

produção tomando ql=l, q2=0,25, Q3=0. A função característica do

jogo é: v(~) = O, v(l) = 0,5, v(2) = 0,125, v(3) = O, v(l,2) = 2,

v(l,3) = 2, v(2,3) = 1,125, v(l,2,3) = 4,125.

.65.

Exemplo 2: O campo de estratégias de cada jogador num

jogo com três participantes é o intervalo fechado O ~ x. ~ 1 1

(i=1,2,3). Os ganhos são:

Note- se que se trata de um jogo de soma zero, já que a

soma dos ganhos dos três jogadores é identicamente nula. O curio-

, so e que, apesar disso, trata-se de um jogo essencial. Para cal-

cuIa r a função característica notemos que:

max mln Ll (x l ,x2 ,x 3 ) = max 2x -1 = 1 (x 2 ,x 3 ) 1

xl xl

max min L2

(xl

,x2 ,x3 ) = max 2x -2 = O (x l ,x3 )

2 x 2

x 2

max min L3

(xl

,x2 ,x3 ) = max -8+3x 3 = -5 x (x

l,x2 ) x 3 3

max min Ll(xl,x2,x3)+L2(xl,x2,x3) = max ~xl+3x2- '~= -"

(xl

,x 2 ) x 3 (x

l,x2 )

max mln Ll(xl,x2,x3)+L3(xl,x2,x3) = max -3x +2x -2=0 1 3 (x

l,x

3) x 2

(xl

,x 3 )

max min L2(x1,x2,x3)+L3(x1,x2,x3) max -x +x -2= -1 2 3 (x

2,x

3) x 2

(x2 ,x 3 )

Em suma, a função característica do jogo é v (~) =0 ,v( 1)=1,

v(2)=O, v(3)=-5, v(l,2)=5, v(l,3)=O, v(2,3)=-l, v(l,2,3)=0. No-

te-se que v(1)+v(2)+v(3) = -4 < v(1,2,3), o que prova que se tra-

ta de um jogo essencial.

.66.

Que a possibilidade de formar coalizões afeta o poder

de barganha dos participantes do jogo é imediato. Em princípio,

para que uma imputação possa considerar-se uma solução satisfató-

ria para um jogo cooperativo, nenhum grupo de participantes deve

ter incentivo a formar uma coalizão em separado capaz de aumentar

os ganhos de todos eles. Isso leva à definição de núcleo: tra-

ta-se do conjunto de imputações u=(u l ,u2 ' .... ,un ) tais que,

qualquer coalizão ~ se tenha:

L ie:S

u. 1

~ v(S)

Tomemos o oligopólio do exemplo 1. Indicando

(ul

,u2 ,u3 ) uma imputação pertencente ao núcleo, deve-se ter:

o que equivale a:

0,125 ~ u2

~ 2,125

° ~ u3·~ 2,125

para

por

Infelizmente, no exemplo em questão, o núcleo ainda é su

ficientemente amplo para deixar boa faixa de indeterminação quan-

to ao que seja a solução do jogo cooperativo. pior do que isso,

pode ocorrer o extremo oposto: o núcleo ser vazio. É o caso de

nosso exemplo 2, onde uma imputação pertencente ao núcleo deveria

- -------------------------

.67.

satisfazer às desigualdades correspondentes aos maxmins das coa-

lizões de dois jogadores:

as quais implicam u l +u 2+u3 ~ 2, e ao mesmo tempo obedecer

quação do jogo de soma zero u l +u2+u3 = O

, a e-

A possibilidade de o núcleo ser vazio (o que acontece

com jogos essenciais de soma constante) é um desafio para a teoria

dos jogos não cooperativos. Com efeito, em tais jogos há inevitá-

vel conflito entre racionalidade coletiva e racionalidade grupal.

Qualquer que seja a distribuição de resultados entre indivíduos,

sempre haverá um subgrupo cujos participantes poderiam melhorar

formando uma coalizão em separado e defendendo-se com a estraté-

gia de maxmin de subgrupo. Sucede que, num jogo essencial, ainda

assim é pr~~erível coopera~ 4 fechar-se em copas. Isso natural-

ment~ ~eva à busca 08 outros conceitos de solução para jogos não

cooperativos. Que ~ distribuição dos ganhos do jogo entre seus

participantes é o resultaêo de um processo de barganha é óbvio.

Como se realiza a barganha, eis o nó da questão.

Uma idéia simples parte do princípio de que o poder de

barganha de cada jogador resulta da sua capacldade de nao coope-

rar com os demais. Sem maiores ressalvas, essa idéia sugere que o

.ésimo 1 jogador tem o direi to de reinvidicar para si a sua con-

tribuição marginal v(N)-n(N-(i» para o valor do jogo. Sucede que

esse procedimento pode ser incompatível com o princípio de que o

bolo só pode ser dividido em fatias de soma igual ao todo. Assim,

.68.

no oligopólio do exem~10 1, as contribuições marginais das três

firmas, v(1,2,3)-v(1,2) = 3, v(1,2,3)-v(1,3) = 2,125 e v(1,2,3) -

-v(1,2) = 2,125 soma 7,25, excedendo o valor v(1,2,3) = 4,125. Já

no jogo de três pessoas soma zero do exemplo 2, a soma das con-

tribuições marginais (1 para o primeiro jogador, O para o segun-

do, -5 para o terceiro), é inferior ao valor do jogo.

Não é impossível, no entanto, dar coerência à idéia de

remuneração pelas contribuições marginais supondo que as coa1i-

zões se formem pelo ingresso sucessivo de participantes. Em suma,

ordenam-se os jogadores segundo uma permutação qualquer (i1,i2, ... ,

,i ) dos inteiros de 1 a n, atribuindo-se ao primeiro a remunera-n

ção v(i1 ), ao segundo a sua contribuição marginal v(i1,i2 )-v(i

1),

ao terceiro v(il,i2,i3)-v(il,i2)' etc .. O defeito óbvio de idéia

é que ele torna a remuneração de cada jogador dependente da ordem

de entrada em cena. Mas é possível remediá-lo, computando as con-

tribuições marginais em cada uma das n: possíveis ordens de en-

trada e computando-se a média aritmética. Com isso o valor do

jogo distribui-se entre seus parti~ipantes de acoc~o com os ape-

lidados valores de Shapley. ~~ +-.: Til' o dE' eXP:.I'plc. oligopólio

do exemplo 1:

Ordem de entrada Contribuições marginais 1ª empresa 2ª empresa 3ª empresa

(1,2,3)

(1,3,2)

(2,1,3)

(2,3,1)

(3,1,2)

(3,2,1)

Média (valor de Shap1ey)

0,5

0,5

1,875

3

2

3

1,8125

1,5

2,125

0,125

0,125

2,125

1,125

1,1875

2,125

1,5

2,125

1

O

O

1,1250

.69.

Descrita nesses termos, a solução de Shapley mais pare-

ce uma receita culinária do que um critério racional de distri-

buição de ganhos em jogos cooperativos. Na realidade é possível

chegar aos valores de Shapley por meio de um conjunto bastante

plausível de axiomas quanto ao que seja uma repartição equitati-

va de ganhos num jogo cooperativo. Apenas se trata de um crité-

rio de arbitramento com o qual os jogadores podem ou nao concor-

dar e que nada tem a ver com o processo de barganha. Em suma,

para que o jogo se solucione segundo os critérios de Shapley, , e

preciso que os participantes concordem em resolvê-lo pelos crité-

rios de Shapley.

Uma segunda linha, explorada por Nash, consiste em as-

, sociar o poder de barganha de cada jogador a credibilidade de

suas ameaças. O cerne da questão é que um jogador, ao ameaçar os

demais com a possibilidade de optar por uma estratégia nao coo-

perativa, nao apenas ameaça prejudicar os outros, mas também a si

próprio. Isto posto, a força da ameaça é tanto maior quanto maio-

res os prejuízos potenciais para t8J:~eiros e quanto menores os

prejuízos para o autor. Isso leva a um ponto ótimo de ameaça para

cada jogador.

Ilustremos a questão com um duopólio, onde os lucros

das duas firmas, com capacidades máximas de produção ql = q2 = I

sao:

Obs.: Se calcularmos este duopólio com ql = q2 = 2 então o lucro

total, maximizado conjuntamente, é v = 4,5, com ql = 1,5, q2 = O.

.70.

Se as duas firmas decidirem pela cooperaçao, o lucro

2 total LI (ql,q2} + L2 (ql,q2} = 6ql+5q2-2(ql+q2} será máximo para

ql=l e q2=O,25, com um valor v=4,125. Admitamos agora que o jogo

se desenvolva de acordo com as seguintes regras:

i} numa primeira etapa a primeira firma ameace produzir

qi e a segunda ameace produzir q2' cada qual sem conhecer a amea

ça da outra;

ii} num segundo lance se computem os lucros ui=LI (qi,q2}

e u 2=L 2 (qi,q2} caso se cumpram as estratégias de ameaça;

iii} num terceiro lance as duas empresas se decidam a cOQ

perar, dividindo salomonicamente entre si o ganho marginal v-u'-u' I 2

da cooperaçao, aceitando assim a imputação (u l ,u2 ) onde:

= u' + I

Dentro dessas regras, que podem ser deduzidas a partir

de axiomas tão plausíveis quanto os que levam os valores de Shapley, o

objetivo do primeiro jogador é escolher qi de modo a ~~~imizar

Ui-U2' o do segundo escolher q2 de modo a maximizar ,

U '-, \...a''''''' 2 ,,~. ~.. v

assim num jogo de duas pessoas-soma zero, onde o ganho do p,-imei-

ro jogador é igual a ui -u2 = LI (qi' q2) - L2 (qi' q2)' cuja solução

(que, como já se viu, é tanto um equilíbrio de Nash quanto um e-

quilíbrio de maxmin), define as estratégias ótimas de ameaça.

Estas últimas levam cada jogador a maximizar a diferença entre o

seu ganho e o do adversário, na fase inicial da barganha. Ou, e-

quivalentemente, a maximizar a diferença entre as perdas do adveK

sário e as suas próprias.

No exemplo numérico apresentado:

.71.

Ui-Ui 1 2

= 6q l_ 2q1 2 - (5q l_ 2qI 2) 1 1 2 2

Se continuássemos os cálculos da observação anterior, encontraríª

mos as estratégias ótimas de ameaça corno qi = 1,5, q2 = 1,25, das

quais resulta ui-u2 = 1,375, como no texto original. Mas a imputª

ção tem que ser calculada com v = 4,5, o que conduz a (ul ,u2 ) =

(2,9375;1,5625) . Os maxmins dos jogadores sao, como no texto ori-

ginal,

Ui min 2 2 0,5 = max 6ql-2ql-2qlq2 = max 2ql-2ql = 1

ql q2 ql

Ui 2 2 0,125. = max mln 5q2-2q2-2qlq2 = max q2- 2q2 =

2 q2 ql q2

Já os valores de Shapley, com o valor correto de v, sao:

o que leva às estratégias ótimas de ameaça qi = 1,0, q2 = l,O,das

quais resulta ui-u2 = 1,0. Segue-se que o equilíbrio do jogo, se

gund0 o modelo das estratégias ótimas de ameaça, é a imputação:

É interessante confrontar essa solução com a dos valo-

res de Shapley. Estes últimos pOderiam ser calculados pelas mes-

mas fórmulas desde que se tomasse ui e u 2 como sendo o maxmin dos

dois jogadores, ou seja:

Ui = max min 1

4ql-2q~ = 2

o que leva aos valores de Shapley (ul,u2) (2,5;1,625).

.72.

Uma terceira linha de análise tenta examinar mais a

fundo o processo de barganha, partindo de dois princípios:

i) num jogo essencial, toda imputação envolve um con-

flito distributivo, no sentido de que cada jogador tenta aumentar

seu quinhão no total à custa dos outros;

ii) nem todas as coalizões concebíveis podem funcionar

ao mesmo tempo, já que um mesmo indivíduo não pode ser membro de

duas coalizões distintas.

Este último ponto é da maior importância: se N é o con-

junto de jogadores, uma estrutura de coalizões é uma partição de

N, ou seja, uma decomposição de N em subconjuntos disjuntos dois

a dois. Assim, num jogo de três pessoas, é possível que estejam em

funcionamento: i) a coalizão global (1,2,3); ii) a estrutura de

coalizões (1,2) versus (3); iii) a estrutura (1,3) versus (2) ;

iv) a estrutura (2,3) versus (1); v) a estrutura (1), (2), (3) em

que cada jogador se fecha em copas. O que não é possível é a ope-

ração simultânea das coalizões (1,2) e (1,3).

TRtO PORt-J, o ~-~~=8SC de barganha é descrito nos se-

guintes ::2rmos: ii p~rte-se de uma imputação e de uma estrutura

de coalizões; ii) um jogador ou grupo de jogadores objeta , a im-

putação, ameaçando romper a estrutura de coalizões para formar u-

ma nova coalizão cujos participantes levem vantagem em relação à

imputação inicial; iii) os demais jogadores respondem com uma

contra-objeção, tentando manter o "status quo". Um equilíbrio se

alcança quando toda objeção puder ser neutralizada por uma con-

tra-objeção.

A título de ilustração, tomemos o jogo do exemplo 2, cu-

ja função característica é v(~)=O, v(l)=l, v(2)=O, v(3)=-5,v(1,2)=~

.73.

v(1,3)=0, v(2,3)=-1, v(1,2,3)=0.

Suponhamos que esteja funcionando a estrutura de coali-

zoes (1,2) versus (3). Como se trata de um jogo de soma zero, o

interesse da coalizão (1,2), é, inicialmente, maximizar o seu ga-

nho, tornando o ganho do terceiro jogador igual ao seu maximin

-5. Isto posto, o ponto de partida é um acerto de estratégias que

A etapa seguinte é a disputa entre os dois primeiros jQ

gadores pelo bolo uI + u 2 = 5. A objeção do primeiro jogador é a

meaçar deixar a coalizão (1,2) para formar a coalizão (1,3), au-

mentando o seu ganho para 5-x e o do terceiro jogador para -5+x.

A contra-objeção do segundo é ele próprio tomar a iniciativa de

romper a coalizão (1,2) para juntar-se com o terceiro na coalizão

(2,3), assegurando ao terceiro o ganho - 5+x e para si próprio o

saldo 4-x do valor da coalizão v( 2,3). Para que a contra-objeção

do segundo jogador neutralize a objeção do primeiro, , , e necessa-

rio e suficiente que, se 5-x for m?ior do que u l ' 4-~ seja maior

do que u 2 . Isso é o mesmo qu~ ~izer que u l -U 2 ~ 1.

Podemos agora inverter os papéis, tL~~sformando a con-

tra-objeção de 2 em objeção e vice-versa. Para que toda objeção

do segundo jogador seja ne~tralizada por uma contra-objeção do

primeiro, é necessário e suficiente que u l -u2 ~ 1.

Conclui-se que a disputa pelo bolo u l +u2 = 5 leva a

uI = 3, u 2 = 2. Nesse sentido, a imputação (3;2;-5) e a estrutura

de coalizões (1,2), (3) pode considerar-se uma solução do jogo.

Note-se que o jogo admite duas outras soluções: a impu

tação (3,0,-3) com a estrutura de coalizões (1,3), (2) e a impu-

.74.

tação (1,2,-3) com a estrutura de coalizões (1), (2,3).

Sob a ótica das objeções e contra-objeções, a existên

cia de um núcleo não vazio num jogo cooperativo tem um significa

do bem mais restrito do que parece à primeira vista: ela signifi

ca apenas que a coalizão global N é factível. Com efeito, se uma

imputação pertence ao núcleo, nao é possível levantar contra ela

nenhuma objeção, já que não é possível formar uma coalizão em que

todos os participantes ganhem mais do que na imputação original.

No reverso da medalha, um jogo cooperativo com núcleo

vazio deixa de ser um enigma. Trata-se apenas de um jogo onde a

coalizão global N não é factível. O que não impede que a coopera

ção possa ser alcançada por alguma partição de N em coalizões.

A descrição acima fornece uma idéia preliminar sobre o

que é a teoria dos jogos cooperativos em seu modelo mai~ simples,

o das utilidades transferíveis. Esse modelo não se aplica a inú

meros problemas práticos, quer porque a transferência de uma soma

T õe i para j não meça as variações de utilidades de i e :. q~cr

porque as próprias transferências podem ser proibidas ~como ge

ralmente ocorre nos oligopólios). Isso exige o estudo G~ formá~

hem mais complexas de jogos cooperativos.

1 ? ~. O R ( 1 NO ,-1 A G 1 C D D O C H O Q II [ H [ , [ R O O O )( O - F e r n a ri d O d p H O 1 a n d a B a r b o ti Antonio Snlnzar Pessoa Brand~o c Cl~vis de Faro - 1908 (~$gotnd~

126. PLANO CRUZADD: CONC[PÇ~O [ O ERRO DE POL1l1CA fISCAL - Rubens Penhn.Cy~nr - 1988

127. TAXA O[ JUROS rLUTUANTE VERSUS CORREÇ~O MO~[lAR1A DAS PRESTAÇ~E5 UMA COKPARAÇAo ~D CASO DO SAC [ lNFlAÇnO CONST~NT[- Clovis de faro - 1980

128. CAPiTULO 11 - MON[TARY CORRECTION ANO REAL IN1[REST ACCOUNTING - .Rubens PFnha Cysne - 1988

129. CAPi1ULO 111 - lNCOME ANDOEMANO POLICIES IN BRAZIL - Rubens Penhé Cysne - 1908

130. CAPíTULO IV - BRAZILIAN ECONOKY IN THE EIGHT]ES AND THE OEBl CRIS15 - Ruber.~ Penha Cysne - 19B8

131. lHE BRAZILIAN AGRICUL1URAL POLICY EXPERIENCE: RA1IONALE AND fUTUR[ D!REC1IONS - Antonio 5alazar Pessoa Brandio - 19B8

132. MORA7ÚRIA INTERNA, DivIDA PÚBLICA E JUROS REAIS - Maria Silvia BastoE M&rques e Sirgio Ribeiro de Costa Werlang - 19B8

133. CAPiTULO IX - TEORIA DO CRESCIMENTO ECON5MICO - Mario Henrique Sirroonsen - 1986

134.

135.

CONGELAMENTO COM ABONO SALARIAL GERANDO EXCESSO DE DEMANDA -- Joaquim Vieira Ferreira Levy e SÉrgio Ribeiro da Costa Wer1ang - 198

AS ORIGENS E CONSEQUtNCIAS DA INFLAÇ~O NA AMERICA LATINA -Fernando de Holanda Barbosa - 1988

136. A CONlA-CORRENTE DO GOVERNO - 1970-198B - Mario Henrique Simonsen - 1989

137. A REVIEW ON THE THEORV DF COMMON KNOWLED.GE - Sérgio Ribeiro da Costa Werlang - 19B9

l~B. MACROECONOMIA - Fernando de Holanda Barbosa - 1989 (esgot~do)

139. TEORIA DO BALANÇO DE PAGAMEN1DS: UMA ABORDAGEM SIMPLIFICADA -- Joio Luiz Tenreiro Barroso -1989

l~O. CONTABILIDADE COM JUROS ~EAIS - RUBENS DENHA CYSNE - 1989

1~1. "CREDIT RATIONING ANO THE PERMAti~~n INCOt.: :~":'0THESIS" - Vicente P.adrigal.

lommy Tan, Daniel Vicent, Sérgio Ribeiro da Costa ~~rlang - 1989

1~2. liA AMAZONIA BRASILEIRA".- Ney Coe de Oliveira - 1989

143. DESÁGIO DAS LFTs E A PROBABILIDADE IMPLICITA DE MORA'lCiRIA

Maria Silvia Bastos Marques e Sérgio Ribeiro da Costa Werlang - 1~

144. THE LDCDEBT PROBLEM: A GAME-THEORETICAL ANALYSIS

Mario Henrique Simonsen e Sérgio Ribeiro da Costa Werlang- 1989 •

145. ANALISE CONVEXA NO Rn - Mario Henrique Simonsen - 1989

146. A CONTROvERSIA MONETARISTA NO HEMISFERIO NORTE

Fernando de Holanda Barbosa - 1989

147. FtSCAL REFORM ANO STABILIZATtON: THE BRAZILtAN EXPERIENCE - Fernando de Holanda Bafbosa, Antônio Salazar Pessoa Brandão e Clovis de Faro - 1989

148. RETORNOS EM EDUCAÇ~O NO BRASIL: 1976-1986 Carlos Ivan Simonsen Leal e Sérgio Ribeiro J3. Costa Werlang - 1989

149. PREFERENCES, COMMON KNOWLEDGE, AND SPECULATIVE TRADE - James Dow, Vicente Madrigal, Sérgio Ribeiro da Costa Werlang - 1990

150. EDUCAÇ~O E DISTRIBUIÇ~O DE RENDA Carlos Ivan Sirnonsen Leal e Sérgio Ribeiro da Costa - 1990

151. OBSERVAÇÕES A MARGEN DO TRABALHO "A AMAZONIA BRASILEIRA"- - Ney Coe de Oliveira - 1990

152. PLANO COLLOR: UM GOLPE DE MESTRE CONTRA A INFLAÇ~O? - Fernando de Holanda Barbosa - 1990

153. O EFEITO DA TAXA DE JUROS E DA INCERTEZA SOBRE A CURVA DE PHILLIPS DA ECONOMIA BRASILEIRA - Ricardo de Oliveira Cavalcanti - 1990

154. PLANO COLLOR: CONTRA FACTUALIDADE E SUGEST.ÕES SOBRE A CONDUÇ~O DA POLíTICA MONETÂRIA-FISCAL - Rubens Penha Cysne - 1990

155. DEPÓSITOS DO TESOURO: NO BANCO CENTRAL OU NOS BANCOS COMERCIAIS? Rubens Penha Cysne - 1990

156. SISTEMA FINANCEIRO DE HABITAÇ~O: A QUEST~O DO DESEQUILíBRIO DO FCVS - Clovis de Faro - 1990

157. COMPLEMENTO DO FAScíNIO N2 151 DOS "ENSAIOS ECONOMICOS" (A AMAZONIA BRASILEIRA) - Ney Coe de Oliveira - 1990

158. POLíTICA MONETÂRIA 6TIMA NO COMBATE A INFLAÇ~O - Fernando de Holanda Barbosa - 1990

159. TEORtA DOS JOGOS - CONCEITOS BÂSICOS - Mario Henrique Sirnonsen -

- 1990 ._-- -----~

000055028

111111111111111111111111"11111111111

TEORIA n'!s CONCEITOS BÂ~ICOS

Documents