Top Banner
Teor´ ıa de los juegos y de las decisiones Guillaume Haeringer [email protected] Curso acad´ emico: 2003–2004
95

Apuntes Teoria de Juegos

Nov 14, 2015

Download

Documents

rsrobinsuarez

Libro guía para la solución de problemas en teoría de juegos.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • Teora de los juegos y de lasdecisiones

    Guillaume Haeringer

    [email protected]

    Curso academico: 20032004

  • ii

  • Contenido

    1 Introduccion 21.1 Para que sirven estos apuntes? . . . . . . . . . . . . . . . . . 21.2 Errores comunes . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2.1 Juegos en forma normal . . . . . . . . . . . . . . . . . 21.2.2 Juegos en forma extensiva . . . . . . . . . . . . . . . . 4

    1.3 Libros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2 Juegos Estaticos con informacion completa 72.1 Elementos y definicion de un juego . . . . . . . . . . . . . . . 72.2 Juegos en forma normal . . . . . . . . . . . . . . . . . . . . . 7

    2.2.1 Notaciones . . . . . . . . . . . . . . . . . . . . . . . . . 82.2.2 Algunas cosas importantes . . . . . . . . . . . . . . . . 9

    2.3 Estrategias estrictamente dominadas . . . . . . . . . . . . . . 102.3.1 Estrategias dominadas pero no estrictamente . . . . . . 112.3.2 Estrategias dominantes . . . . . . . . . . . . . . . . . . 12

    2.4 El equilibrio de Nash . . . . . . . . . . . . . . . . . . . . . . . 122.4.1 Ejemplo: competicion electoral . . . . . . . . . . . . . 162.4.2 Estrategias puras/mixtas . . . . . . . . . . . . . . . . . 182.4.3 Utilidad esperada . . . . . . . . . . . . . . . . . . . . . 192.4.4 Calcular los equilibrios de Nash en estrategias mixtas . 212.4.5 Dibujar los equilibrios de Nash . . . . . . . . . . . . . 22

    2.5 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.5.1 El dilema de los prisioneros . . . . . . . . . . . . . . . 302.5.2 La batalla de los sexos . . . . . . . . . . . . . . . . . . 302.5.3 El juego de las monedas . . . . . . . . . . . . . . . . . 332.5.4 El dupolio de Cournot . . . . . . . . . . . . . . . . . . 33

    3 Juegos secuenciales 373.1 Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    3.1.1 Nodos de decisiones y estrategias . . . . . . . . . . . . 383.1.2 El equilibrio de Nash . . . . . . . . . . . . . . . . . . . 42

  • CONTENIDO iv

    3.2 La induccion hacia atras . . . . . . . . . . . . . . . . . . . . . 453.3 Ejemplo: El duopolio de Stackelberg . . . . . . . . . . . . . . 473.4 Equilibrio perfecto en subjuegos . . . . . . . . . . . . . . . . . 483.5 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.5.1 El juego del ciempies . . . . . . . . . . . . . . . . . . . 533.5.2 Un juego con mas de un equilibrio perfecto en subjue-

    gos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.6 Equivalencia entre juegos en forma normal y juegos secuenciales 593.7 Informacion imperfecta . . . . . . . . . . . . . . . . . . . . . . 64

    4 Juegos repetidos 694.1 Juegos repetidos finitamente . . . . . . . . . . . . . . . . . . . 69

    4.1.1 Ejemplo: el dilema de los prisioneros repetido 2 veces . 704.1.2 Juegos con suma cero . . . . . . . . . . . . . . . . . . . 714.1.3 El min-max . . . . . . . . . . . . . . . . . . . . . . . 734.1.4 El max-min y los juegos repetidos . . . . . . . . . . . . 774.1.5 Ejemplo: la batalla de los sexos repetido 2 veces . . . . 784.1.6 El equilibrio de Nash . . . . . . . . . . . . . . . . . . . 794.1.7 El equilibrio perfecto en subjuegos . . . . . . . . . . . 83

    4.2 Juegos repetidos infinitamente . . . . . . . . . . . . . . . . . . 844.2.1 Descuento . . . . . . . . . . . . . . . . . . . . . . . . . 844.2.2 Ganancia media . . . . . . . . . . . . . . . . . . . . . . 854.2.3 Ganancia factible . . . . . . . . . . . . . . . . . . . . . 864.2.4 Equilibrio de Nash . . . . . . . . . . . . . . . . . . . . 874.2.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 89

  • Captulo 1

    Introduccion

    1.1 Para que sirven estos apuntes?

    Espero que estos apuntes os ayudaran para aprender y entender los elementosde la teora de juegos que se estudiaran durante este curso. Es importante desaber que estos apuntes no reemplazan las clases. Aqu he puesto definiciones,teoremas y algunos ejemplos. Por cierto, es muy probable que en la clasesvoy a contar mas que lo que esta en estos apuntes. Ademas, muchos de losejemplos que hemos visto, o que vamos a ver en la clase no estan en losapuntes.

    1.2 Errores comunes

    He intentado en estos apuntes de explicar con mucho cuidado ciertos concep-tos. Sin embargo, en el examen hay errores muy frecuentes. Aqu he listadounas de ellas.

    1.2.1 Juegos en forma normal

    Cuando se calcula las probabilidades de un equilibrio de Nash en es-trategias mixtas, si encuentras probabilidades negativas o mayor que1, has hecho algo malo en los calculos. Un error comun es el siguiente:

    uj(a) = uj(b)

    . . . 2q + 3 3q = 1 5q = 2 q = 5

    2.

  • 3 1.2 Errores comunes

    El error esta en el ultimo paso. De 5q = 2 se tiene que deducir q = 2/5,y no q = 5/2.

    Cuando tienes que hallar los equilibrios de Nash en estrategias puras ymixtas por un lado, y dar una representacion grafica de los equilibrios(es decir, dibujar las funciones de mejor respuesta) teneis que tener elmismo numero de equilibrios.

    Por ejemplo, si en un juego ves que hay 3 equilibrios de Nash (2 enestrategias puras y uno en estrategias mixtas) cuando haces los calculos,en el grafico debes encontrar tres puntos en los que las funciones demejor respuesta se cruzan.

    Otro ejemplo: si no hay equilibrio en estrategias puras y solo hay unoen estrategias mixtas, en el grafico las funciones de mejor respuesta secruzan solo una vez (y no 3 veces como unos estudiantes a veces lohacen).

    Tambien, cuando se dibujan las funciones de mejor respuesta muchosestudiantes olvidan que si las funciones se tocan en las esquinas los puntos de coordinadas (0, 0), (1, 0), (0, 1) y (1, 1) eso quieredecir que se cruzan. Por ejemplo, en la Figura 2.8 en la pagina 29las funciones se tocan y por tanto se cruzan, en las esquinas (0, 0) y(1, 1).

    El hecho de que una estrategia domina a otra estrategia es distinto(aunque relacionado) del hecho que una estrategia es una mejor re-spuesta. La dominacion de una estrategia no se refiere a las estrategiasutilizadas por los demas jugadores. Pero el concepto de mejor re-spuesta siempre se refiere a las estrategias utilizadas por los demasjugadores.

    Un resultado deseable no es necesariamente un equilibrio. Vease porejemplo el dilema de los prisioneros: Hablar para los dos jugadores esun resultado deseable pero el equilibrio es que los dos eligen Callarse.

    Otro manera de ver un equilibrio de Nash. Cogemos un juegocon dos jugadores, i y j. Para que el perfil (si, sj) sea un equilibriotenemos que tener eso:

    (i) Cogemos si y buscamos una (o la) mejor respuesta de j. Si noobtenemos sj, entonces (si, sj) no puede ser un equilibrio de Nash.

  • Introduccion 4

    Pero el echo de obtener sj tampoco significa que tenemos un equi-librio de Nash. Para que sea un equilibrio de Nash, tenemos queobtener eso:

    (ii) Cogemos sj y buscamos una (o la) mejor respuesta de i. Si noobtenemos sj, entonces (si, sj) no puede ser un equilibrio de Nash.En el caso contrario, (si, sj) es un equilibrio de Nash (porque yahemos verificado que (i) esta cierto).

    1.2.2 Juegos en forma extensiva

    Una accion de un jugador es lo que hace en un nodo. Una estrategiaes una lista de acciones para cada nodo de decision.

    Un conjunto de informacion puede contener 2, 3 (o mas) nodos dedecision. Si en un nodo de un conjunto de informacion un jugador eligeuna accion, deber ser el caso que elige la misma accion en los otrosnodos de decision del mismo conjunto de informacion.

    Cuando tienes que trabajar con un juego secuencial, hacer la lista delos conjuntos de informacion / nodos de decision de los jugadores puedeayudar a entender las estructura de las estrategias de los jugadores.

    Por ejemplo, si un jugador tiene 4 nodos de decision, cualquier estrate-gia de este jugador contiene 4 elementos: cada elemento describe unaaccion para cada nodo.

    1.3 Libros

    Aqu hay una lista de libros que pueden ayudar. Sin embargo, todo esta hechopara que estos apuntes y una presencia regular en la clase son suficientes parapreparar el examen.

    Binmore, K.G., Teora de Juegos,, Mc Graw Hill 1994. Dixit, A., Nalebuff, B., Pensar Estrategicamente, A. Bosch ed. 1992. Gibbons, R., Un Primer Curso de Teora de Juegos , A. Bosch ed.1993.

    Kreps, D.M., Curso de Teora Microeconomica, McGraw-Hill 1995. Rasmusen, E., Juegos e informacion. Introduccion a la Teora de Jue-gos, McGraw Hill 1995.

  • 5 1.3 Libros

    Vega Redondo F., Economa y juegos, teora y aplicaciones, A. Bosched. 1999.

    Los libros de Vega Redondo y de Gibbons son los mas adaptados paraesta asignatura.

  • Introduccion 6

  • Captulo 2

    Juegos Estaticos coninformacion completa

    Un juego estatico con informacion completa se llama un juego en formanormal. En los juegos en forma normal los jugadores eligen sus estrategiasde manera simultanea, de forma que cada jugador elige su estrategia sin saberque estrategias han elegido los demas jugadores.

    En los captulos 3 y 4 vamos a estudiar juegos en los que los jugadorespueden elegir sus acciones sabiendo las estrategias elegidas por los demas.

    2.1 Elementos y definicion de un juego

    Un juego esta definido por los elementos siguientes:

    Un conjunto de jugadores N = {i, j, k . . . , n}; Para cada jugador i N un conjunto de estrategias Si;, Para cada perfil de estrategias, es decir, para cada coleccion posiblede estrategias de manera que especificamos una estrategia para cadajugador, una funcion que especfica la ganancia de cada jugador.

    2.2 Juegos en forma normal

    En general representamos un juego en forma normal con una matriz. Porejemplo, podemos tener el juego siguiente:

    c da 3, 1 100, 52b 5, 4 2,3

  • Juegos estaticos 8

    En este juego tenemos dos jugadores, i y j. El conjunto de estrategiasdel jugador i es {a, b} y el del jugador j es {c, d}. Es decir, el jugador i eligeentre las lineas de la matriz y el jugador j elige entre las columnas.

    En los juegos en forma normal siempre supondremos que eljugador i es el que elige entre las lineas y el jugador j el que eligeentre las columnas.

    Si el jugador i elige la estrategia a y el jugador j elige la estrategia dentonces la ganancia del jugador i es 100 y la del jugador j es 52.

    En general, las ganancias de un jugador h se nota uh, y si los jugadoresutilizan el perfil s = (s1, s2, . . . , sn) la ganancia del jugador h es:

    uh(s) = uh(s1, s2, . . . , sn) . (2.1)

    A veces queremos hacer la comparacion entre dos perfiles s = (s1, s2, . . . , sn)y s = (s1, s

    2, . . . , s

    n) en los que las estrategias de todos los jugadores son

    iguales salvo la estrategia del jugador i. Es decir, para todos los jugadoresdistintos del jugador i la estrategia en el perfil s es la misma que la estrategiaen el perfil s, y para el jugador i su estrategia en el perfil s es distinta de suestrategia en el perfil s:

    j 6= i, sj = sj ,si 6= si .

    Si tenemos dos perfiles s y s que satisfacen estas condiciones escribimosque s es el perfil obtenido con la estrategia si y las estrategias en el perfil sde los jugadores distintos del jugador i:

    s = (si, si) , (2.2)

    donde

    si = (s1, . . . , si1, si+1, . . . , sn) , (2.3)

    es decir, si es la coleccion de las estrategias de todos los jugadores salvo eljugador i.

    2.2.1 Notaciones

    Cuando dibujamos un juego en forma normal, siempre se supondra que eljugador que elige las lineas es el jugador i, y el jugador que elige las columnases el jugador j. Cuando escribimos las ganancias, la primera cifra es la deljugador i, y la segunda es la del jugador j. As, si cogemos el juego siguiente:

  • 9 2.2 Juegos en forma normal

    c da 2, 10 1,2b 3, 7 0, 15

    El jugador elige entre a y b, Si = {a, b} y el jugador j elige entre c y d,Sj = {c, d} . Si los jugadores juegan el perfil (b, c) la ganancia de i es 3 (y no7) y la del jugador j es 7 (y no 3).

    Ahora que tenemos una notacion, aqu hay un ejercicio para ver si erescapaz de adivinar como se lee el juego siguiente, con 3 jugadores: i, j y k:

    L R L RU 3, 5, 0 1, 2, 10 U 8, 7, 4 13,1, 9D 100, 60,80 6, 19, 21 D 89,6, 74 20, 42, 15

    W E

    Los conjuntos de estrategias son: Si = {U,D}, Sj = {L,R} y Sk ={W,E} .

    Si los jugadores juegan el perfil (U,R,E) las ganancias de i, j y k sonrespectivamente 13, 1 y 9. Con el perfil (D,R,W ) tenemos entonces:ui(D,R,W ) = 6, uj(D,R,W ) = 19, uk(D,R,W ) = 21 .

    2.2.2 Algunas cosas importantes

    Un juego en forma normal se representa, en general, con una tabla. Esolo podemos hacer cada vez que los jugadores tienen un numero finito deestrategias. Por ejemplo, la tabla siguiente representa un juego.

    c da 1, 0 100,200b 3, 7 0, 10

    La tabla resume todo:

    El conjunto de jugadores: un jugador elige la lineas (lo llamamos eljugador i) y otro las columnas (lo llamamos el jugador j).

    Para cada jugador un conjunto de estrategias, Si = {a, b} y Sj{c, d}. Para cada perfil de estrategias, (a, c), (a, d), (b, c) o (n, d) podemossaber cuales son las ganancias de los jugadores.

    Siempre se supone que los jugadores suelen mirar a sus ganan-cias. Eso quiere decir que cuando i tendra que elegir su estrategia solo miraraa sus ganancias. Es un poco como si, para i, el juego fuese:

  • Juegos estaticos 10

    c da 1 100b 3 0

    y para el jugador j el juego fuese:

    c da 0 200b 7 10

    2.3 Estrategias estrictamente dominadas

    Una estrategia si para un jugador i esta estrictamente dominada por otraestrategia si si para cualquiera estrategia jugada por los demas jugadores,la ganancia de i con la estrategia si es estrictamente mas grande que laestrategia si:

    si ui(si, si) > ui(si, si) . (2.4)Cogemos por ejemplo el juego siguiente:

    c da 3, 1 10, 2b 2, 4 2, 1

    En este juego, para el jugador i la estrategia b esta estrictamente dom-inada por la estrategia a. Con la estrategia a, el jugador i gana 3 o 10,depende de la estrategia jugada por el jugador j. Pero con la estrategia b eljugador i solo gana 2 o 2.

    Para el jugador j, no hay una estrategia que domina a la otra. Si eljugador i elige la estrategia a, el jugador prefiere la estrategia d, pero siel jugador i elige la estrategia b la estrategia preferida del jugador j es laestrategia c.

    Con este juego, podemos decir que el jugador i nunca va a elegir la es-trategia b. Entonces, es como si el juego fuera:

    c da 3, 1 10, 2

    Lo que hemos hecho es la eliminacion de una estrategia estrictamentedominada. Pero en este nuevo juego, elegir la estrategia c nunca es optimopara el jugador j. Es decir, aparece una nueva estrategia estrictamente domi-nada, la estrategia d. Entonces, podemos eliminarla, lo que nos llega al juegosiguiente:

  • 11 2.3 Estrategias estrictamente dominadas

    da 10, 2

    Lo que acabamos de hacer se llama la eliminacion reiterada de lasestrategias estrictamente dominadas.

    El hecho de eliminar las estrategias estrictamente dominadas nos permiteeliminar estrategias que son improbables, es decir, nunca va a ser el casoque los jugadores van a utilizar estas estrategias. Eso es muy practico porquenos permite de simplificar juegos que pueden ser muy complicados.

    2.3.1 Estrategias dominadas pero no estrictamente

    Existe otro concepto de dominacion entre las estrategias pero mas debil. Paraun jugador, puede existir una estrategia que le da, a veces, una gananciaestrictamente mayor que otra estrategia, pero un unos casos (es decir, conunos perfiles de estrategias de los demas jugadores) tiene una ganancia igual.En este caso, tenemos una relacion de dominacion entre las estrategias, peroesta relacion no es estricta.

    Definicion 1 Para un jugador i, la estrategia si domina, pero no estric-tamente, a la estrategia si si tenemos:

    , si Si ui(si, si) ui(si, si) , (2.5)con una igualdad estricta para al menos un perfil si.

    Por ejemplo, sea G el juego siguiente,

    d e fa 2, 1 10, 2 7, 2b 2, 4 2, 1 7, 1c 2, 4 2, 1 1,3

    Para el jugador i, la estrategia a domina, pero no estrictamente, a laestrategia b. Cuando j juega e, i gana estrictamente mas con a que conb. Pero cuando j juega d o f , i tiene la misma ganancia con a que con b.Entre las estrategias a y b solo hay un perfil del otro jugador con el quei gana mas. Es suficiente par obtener una relacion de dominacion entre ay b. Tambien tenemos que la estrategia a domina a la estrategia c, peroen este caso hay dos perfiles posibles para el jugador j con los que i tieneuna ganancia estrictamente mas mayor jugando a que jugando c. Estas dosestrategias son e y f .

    Al igual que las estrategias estrictamente dominadas, las estrategias dom-inadas, pero no estrictamente, se pueden eliminar de forma repetida. Sin

  • Juegos estaticos 12

    embargo, este proceso de eliminacion reiterada puede llevar resultados dis-tintos segun el orden con el que hemos hecho la eliminacion reiterada. Si soloeliminamos las estrategias estrictamente dominadas el orden de eliminacionno influye sobre el resultado final.

    2.3.2 Estrategias dominantes

    Cuando encontramos una estrategia que domina a cualquiera otra estrate-gia, esta estrategia se llama estrategia dominante. Del mismo modo quepara la dominacion, hacemos la diferencia entre una estrategia estrictamentedominante y una estrategia dominante pero no estrictamente.

    Si una estrategia domina estrictamente a todas las otras estrategias, en-tonce esta estrategia se llama estrictamente dominante.

    Pero, si la estrategia domina pero no estrictamente a unas estrategias,entonces es una estrategia dominante pero no estrictamente.

    Por ejemplo, consideramos el juego siguiente:

    d e fa 4, 1 7, 3 45, 2b 2, 1 7, 4 4,1c 1, 0 2, 1 1,3

    Para el jugador i, la estrategia a es una estrategia dominante pero noestrictamente. Domina estrictamente a la estrategia c pero de manera noestricta a la estrategia b.

    Para el jugador j, la estrategia e es una estrategia estrictamente domi-nante. Domina estrictamente a las estrategias d y f .

    2.4 El equilibrio de Nash

    Uno de los conceptos fundamentales en la teora de los juegos es el equilibriode Nash. Este concepto hace la hipotesis de que los jugadores, al decidir siquieren cambiar de estrategia, suponen que los demas jugadores no cambiande estrategia. Eso se llama la conjetura de Nash. Por ejemplo, supongamosque tenemos el perfil s = (s1, . . . , sn) y que el jugador i quiere ver si puedeobtener una ganancia mayor jugando otra estrategia. La conjetura de Nashconsiste en el hecho de compara los perfiles (si, si) y (si, si): entre estosdos perfiles solo cambia la estrategia del jugador i.

    Definicion 2 Un perfil s = (s1, s2, . . . , sn) es un equilibrio de Nash si:

    , i, , si 6= si, ui(si, si) ui(si, si) . (2.6)

  • 13 2.4 El equilibrio de Nash

    As pues, un perfil de estrategias es un equilibrio de Nash si para cadajugador, cualquiera otra estrategia le da una ganancia igual o menor. Dichode otra manera, cada jugador no puede encontrar otra estrategia que le dauna ganancia estrictamente mayor.

    El concepto del equilibrio de Nash esta asociado con el concepto demejorrespuesta. Supongamos que tenemos el perfil de estrategias s = (s1, . . . , sn).Para un jugador i, su mejor respuesta cuando los demas jugadores utilizan elperfil si es la estrategia que maximiza su ganancia. Por supuesto, podemostener mas de una mejor respuesta.

    As pues, un perfil de estrategias es un equilibrio de Nash si la estrate-gia de cada jugador es una mejor respuesta contra las estrategias de losdemas jugadores. Una estrategia de un jugador es una mejor respuesta si noexiste otra estrategia para este jugador que da a este jugador una gananciaestrictamentemas grande sin cambiar las estrategias de los otros jugadores.Por ejemplo, en el juego siguiente:

    c da 4, 1 1, 1b 6,4 2, 1

    la estrategia b es la mejor respuesta del jugador i cuando el jugador j elige laestrategia c. Si el jugador i elige la estrategia a las estrategias c y d son ambasmejores respuestas para el jugador j, pero si el jugador i elige la estrategia bsolo d es una mejor respuesta del jugador j.

    En el juego anterior solo el perfil (a, d)) es un equilibrio de Nash. Todos losotros perfiles no son equilibrios de Nash. Por ejemplo, si los jugadores eligenel perfil (a, c) el jugador i no utiliza una mejor respuesta. Entonces, decimosque el jugador i desva y utiliza la estrategia b en lugar de la estrategia a.

    El perfil (b, c) tampoco es un equilibrio de Nash porque la estrategia c noes la mejor respuesta del jugador j cuando i utiliza la estrategia b.

    Una manera sencilla de buscar un equilibrio de Nash es de coger unaestrategia de un jugador. Por ejemplo, supongamos que solo tenemos dosjugadores, y cogemos el jugador i y su estrategia si. Luego, tenemos quebuscar la o las mejores respuestas de j cuando i juega si. Sea sj la mejorestrategia de j. Ahora que tenemos la mejor respuesta de j, sj, buscamosla mejor respuesta de i cuando j juega la estrategia sj. Supongamos quesolo hay una mejor respuesta, si . Si tenemos si = s

    i , entonces tenemos un

    equilibrio de Nash, el perfil (si, sj), que es lo mismo que el perfil (si , sj) dado

    que si = s: es la misma estrategia.Si encontramos que si 6= si, entonces el perfil (si, sj) no es un equilibrio

    de Nash: si no es una mejor respuesta de i contra la estrategia sj del jugadorj.

  • Juegos estaticos 14

    Por ejemplo, cogemos el juego siguiente:

    c da 10, 8 3, 5b 6,1 2, 4

    Primero miramos a un equilibrio de Nash:

    (i) Cogemos la estrategia c.

    (ii) La mejor respuesta de i es a.

    (iii) Ahora, supongamos que i juega la estrategia encontrada en el apartado(ii), a.

    (iv) La mejor respuesta de j cuando i juega a es c.

    (v) Verificamos si la estrategia encontrada en el apartado (iv) es la mismaque la estrategia inicial la del aparatado (i). Entonces, (a, c) es unequilibrio de Nash. Hemos salido de c

    Ahora, cogemos un perfil que no es un equilibrio de Nash:

    (i) Cogemos la estrategia d.

    (ii) La mejor respuesta de i es a.

    (iii) Ahora, supongamos que i juega la estrategia encontrada en el apartado(ii), a.

    (iv) La mejor respuesta de j cuando i juega a es c.

    (v) Podemos ver que la estrategia inicial, del apartado (i), d, es distinta dela estrategia del apartado (iv), c. Entonces, (d, a) no es un equilibriode Nash.

    En general, este proceso es muy practico para buscar los equilibrios deNash. En la lineas siguientes, la notacion

    si jsj

    significa que si i juega si entonces la estrategia mejor respuesta de j es sj, y

    la notacionsi

    jsj

    ksk

    significa que si i juega si entonces la estrategia mejor respuesta de j es sj, y

    si j juega sj entonces la estrategia mejor respuesta de k es sk.Cogemos ahora el juego siguiente:

  • 15 2.4 El equilibrio de Nash

    d e fa 3, 1 10, 2 7, 2b 2, 4 2, 1 7, 1c 1, 4 2, 1 1,3

    Estrategia de i Mejor respuesta de j Mejor respuesta de ia e a

    f ab d ac d a

    Tabla 2.1: Mejores respuestas cuando salimos de una estrategia de i.

    Lo importante aqu es de verificar si la estrategia en la primera columnaes la misma que la estrategia en la ultima columna. Podemos ver que siemprellegamos a la estrategia a. Entonces, los unicos candidatos para un equilibriode Nash es cuando a es la estrategia de i. Si salimos de a, podemos ver quehay dos caminos para volver a la estrategia a: por e o por f (la segundacolumna). Entonces, (a, e) y (a, d) son equilibrios de Nash.

    Ahora, miramos lo que pasa si salimos de una estrategia del jugador j.La lista de las mejores respuestas y de las mejores respuestas a las mejoresrespuestas esta en la tabla 2.2

    Estrategia de j Mejor respuesta de i Mejor respuesta de jd a e

    fe a e

    ff a e

    fb d

    Tabla 2.2: Mejores respuestas cuando salimos de una estrategia de j.

    Por ejemplo, si j juega f , i tiene dos mejores respuestas, a o b. Si ijuega a, entonces la mejor respuesta de j es e o f . Entonces, ya tenemos unequilibrio de Nash: (a, f). Si i juega b, la mejor respuesta de j es d, lo quees distinto de la estrategia de origen, f . Entonces, (b, f) no es un equilibriode Nash.

    Con las tablas 2.1 y 2.2 podemos obtener facilmente todos los equilibriosde Nash. En este juego solo hay dos equilibrios, (a, e) y (a, f).

  • Juegos estaticos 16

    Importante: En este juego, hemos podido encontrar todas los equilibriosde Nash con solo una de las dos tablas, la tabla 2.1 o la tabla 2.2, es decir,saliendo de las estrategias de i o de j. Sin embargo, podemos tener un juegocon el que necesitamos las dos tablas. En cualquier caso, hacer las dos tablaspermite de verificar. . . por si a caso. . .

    2.4.1 Ejemplo: competicion electoral

    Consideramos dos candidatos polticos, A y B, que compiten. El objeto dela campana electoral es de hacer una propuesta para una inversion en unedificio publico (una biblioteca, una piscina, etc.) Para este edificio se puedegastar entre 0 y 1e. Tambien suponemos que hay un numero infinito devotantes, y cada votante tiene un nivel de inversion preferido. Cada votantevota para el candidato que propone un nivel de inversion mas cerca de sunivel ideal. Por ejemplo, si el candidato A propone de invertir pA = 0, 3eyel candidato B propone de invertir pB = 0, 8e, el votante cuyo nivel ideal esinvertir 0, 4eva a votar para el candidato B.

    La distribucion de los votantes segun sus niveles ideales de inversion esuniforme entre 0 y 1. Ademas, se supone que a los candidatos solo les interesaganar. Las ganancias para los candidatos se resumen as:

    El que gana tiene una utilidad de 1,

    El que pierde tiene una utilidad de 1,

    Si hay empate, los dos candidatos tienen una ganancia de 0.

    Por ejemplo, si A propone pA = 0, 4e y B propone 0, 7e tenemos:

    Todos los votantes cuyos niveles ideales estan entre 0 y 0, 4 votan paraA, por lo cual A ya tiene al menos el 40% de los votos.

    Todos los votantes cuyos niveles ideales estan entre 0, 7 y 1 votan paraB, por lo cual B ya tiene al menos el 30% de los votos (30% = (1 0, 7) 100).

    Todos los votantes cuyos niveles ideales estan entre 0, 4 y 0, 55 votanpara A. Estos votantes representan el 15% de los votantes.

    Todos los votantes cuyos niveles ideales estan entre 0, 55 y 0, 7 votanpara B. Estos votantes representan el 15% de los votantes.

  • 17 2.4 El equilibrio de Nash

    Entonces, A tiene el 55% = 40%+15% de los votos y B tiene el 30%+15%de los votos. A gana la eleccion y su ganancia es 1 y B pierde y su gananciaes 1.

    El unico equilibrio de Nash de este juego es cuando pA =12y pB =

    12.

    Ya podemos verificar que este perfil es un equilibrio de Nash. Con esteperfil, hay empate, por lo cual los dos candidatos tienen una ganancia de 0.

    Si A desva y propone pA < 12 .Entonces A tiene (pA +

    12(pB pA)) 100% de los votos: los votantes

    entre 0 y pA votan para A, es decir el pA 100% de los votantes, ytambien todos los votantes cuyos niveles de inversion ideales son entrepA y PB y que son mas cerca de pA que de pB, es decir el

    12(pBpA)100

    de los votantes. De forma mas compacta, A tiene el 12(pA+pB)100%

    de los votos. Dado que pB =12, y que pA 12 .Entonces A tiene (1pA+ 12(pApB))100% de los votos: los votantesentre pA y 1 votan para A, es decir el 1 pA 100% de los votantes, ytambien todos los votantes cuyos niveles de inversion ideales son entrepB y PA y que son mas cerca de pA que de pB, es decir el

    12(pApBA)

    100 de los votantes. De forma mas compacta, A tiene el (1 12(pA +

    pB)) 100% de los votos. Dado que pB = 12 , y que pA > 12 , tenemosque 1

    2(pA+pB)100 > 50%, por lo cual (1 12(pA+pB))100 < 50% .

    Entonces, A pierde y tiene una ganancia igual a 1, o sea que A noquiere desviar.

    Podemos hacer lo mismo para el candidato B (solo hay que reemplazarB por A y A por B) y llegamos a la misma conclusion: B no quiere desviar.Entonces, el perfil (pA =

    12, pB =

    12) es un equilibrio de Nash.

    Ahora nos falta demostrar que no podemos encontrar un equilibrio deNash en el que hay un candidato que elige una propuesta que sea distintadel 1

    2.

    Supongamos que por ejemplo el candidato B elige un pB (que llamamos elpB inicial), de manera que pB >

    12. Vamos a buscar la mejor respuesta de

    A, y de este buscar la mejor respuesta de B y comprobar que es distinta del pBinicial. Con un pB >

    12, la mejor respuesta de A consiste en elegir cualquiera

    propuesta entre 1 pB y pB. Solo se necesita que 1 pB < pA < pB . As, Apuede ganar y obtener una ganancia de 1. Si A elige pA = 1 pB o pA = pB,tiene una ganancia de 0 y si elige un pA de manera que 0 < pA < 1 pB opB < pA entonces A pierde, por lo cual tiene una ganancia de 1.

  • Juegos estaticos 18

    Sea pA una mejor respuesta de A. Es facil de ver que la mejor respuestade B debe estar estrictamente entre 1 pA y pA (o entre pA y 1 pA segunque pA >

    12o pA

    12este perfil no puede ser un equilibrio de Nash. Podremos encontrar

    un pA que es mejor respuesta de A contra pB pero pB no sera mejor respuestade B contra cualquier pA que podremos encontrar.

    El caso cuando PB >12es similar, y tambien cuando pA 6= 12 . Entonces,

    no existe equilibrio de Nash cuando al menos uno de los dos candidatos eligenuna propuesta que sea distinta del 0, 5e.

    2.4.2 Estrategias puras/mixtas

    En los juegos que hemos visto en las secciones anteriores siempre hemosutilizado las estrategias puras de los jugadores. Las estrategias puras eranlas estrategias a, b, d, etc.

    Cuando describimos los conjuntos de estrategias en un juego siempre nosreferimos a las estrategias puras.

    Sin embargo, podemos tener el caso que los jugadores utilizan una mez-cla de estrategias, es decir, que un jugador utiliza unas estrategias conciertas probabilidades. Por ejemplo, podemos decir que el jugador i juega laestrategia a con una probabilidad 1

    3y la estrategia b con una probabilidad 2

    3.

    En este caso, decimos que el jugador i utiliza una estrategia mixta.

    Definicion 3 Una estrategia mixta es una distribucion de probabilidades so-bres una estrategias puras.

    Entonces, una estrategia pura tambien es una estrategia mixta: hay unaprobabilidad 1 de jugar la estrategia pura y una probabilidad 0 de jugarcualquiera otra estrategia.

    Las estrategias mixtas se deben entender as: son planes estrategicos deun jugador antes de jugar. Jugar la estrategia a con una probabilidad 1/3y la estrategia b con una probabilidad 2/3 no es de hacer un tercio de ay dos tercios de b, pero quiere decir que hay una probabilidad de 1/3 queel jugador juegue la estrategia a y una probabilidad de 2/3 que el jugadorjuegue la estrategia b. Por ejemplo, por la manana una persona compra aveces un periodico, y otras veces no lo compra. Al salir de casa hay unaprobabilidad que compre un periodico y una probabilidad que no compreperiodico. Decir que jugar una estrategia mixta es semejante a jugar unamezcla de las acciones correspondientes podra decir que una persona compra

  • 19 2.4 El equilibrio de Nash

    10 paginas de un periodico, sin comprar el resto. Esta claro que eso no tienesentido.

    Observacion 1 Una estrategia pura es tambien una estrategia mixta. Si unjugador tiene por ejemplo dos estrategias puras, a y b, jugar la estrategiaa es, por definicion, jugar una estrategia pura. Pero tambien se puede vercomo una estrategia mixta:

    Jugar a con una probabilidad 1, Jugar b con una probabilidad 0.

    Para no equivocarse, cada vez que hablaremos de estrategia mixta se tendraque entender que es una estrategia que no es una estrategia pura.

    2.4.3 Utilidad esperada

    Como calcular las ganancias de los jugadores si uno utiliza una estrategiamixta? El principio es muy simple y consiste en calcular la esperanza de laganancia de los jugadores.

    Cogemos por ejemplo el juego siguiente:

    c da 4, 1 1, 1b 2,4 2, 1

    Supongamos que el jugador i utiliza la estrategia mixta siguiente:

    Jugar a con una probabilidad 13

    Jugar b con una probabilidad 23

    y el jugador j utiliza la estrategia c.Entonces, el jugador i gana:

    4 con una probabilidad 12(con el perfil (a, c))

    2 con una probabilidad 12(con el perfil (b, c))

    y el jugador j gana:

    1 con una probabilidad 12(con el perfil (a, c))

    -4 con una probabilidad 12(con el perfil (b, c))

  • Juegos estaticos 20

    Entonces, la ganancia esperada del jugador i es:

    Eui = 4 13+ 2 2

    3=

    8

    3, (2.7)

    y la ganancia esperada del jugador j es:

    Euj = 1 13 4 2

    3= 7

    3. (2.8)

    Si el jugador j juega tambien una estrategia mixta, por ejemplo c conuna probabilidad 1/4 y d con una probabilidad 3/4, entonces tenemos quelos jugadores juegan:

    El perfil (a, c) con una probabilidad 13 14= 1

    12,

    El perfil (b, c) con una probabilidad 23 14= 2

    12,

    El perfil (a, d) con una probabilidad 13 34= 3

    12,

    El perfil (b, d) con una probabilidad 23 34= 6

    12,

    En este caso, las ganancias esperadas de los jugadores son:

    Eui =1

    12ui(a, c) +

    2

    12ui(b, c) +

    3

    12ui(a, d) +

    6

    12ui(b, d)

    =1

    124 +

    2

    122 +

    3

    12(1) + 6

    12(2) = 7

    12

    Euj =1

    12uj(a, c) +

    2

    12uj(b, c) +

    3

    12uj(a, d) +

    6

    12uj(b, d)

    =1

    121 +

    2

    121 +

    3

    12(4) + 6

    121 =

    312

    El hecho de poder utilizar estrategias mixtas nos permite de obtener unresultado muy importante, demonstrado por primera vez por John Nash:

    Teorema 1 Si G es un juego donde el conjunto de estrategias de cada ju-gador contiene un numero finito de estrategias puras, entonces, siempre existeal menos un equilibrio de Nash.

    Tambien tenemos estos resultados:

    Proposicion 1 En un juego en forma normal con n jugadores, con los con-juntos de estrategias puras S1, . . . , Sn, funciones de ganancias, u1, . . . , un, sila eliminacion reiterada de las estrategias estrictamente dominadas eliminatodas las estrategias menos el perfil s = (s1, . . . , s

    n), entonces el perfil s

    esel unico equilibrio de Nash del juego.

  • 21 2.4 El equilibrio de Nash

    Proposicion 2 En un juego en forma normal con n jugadores, con los con-juntos de estrategias puras S1, . . . , Sn, funciones de ganancias, u1, . . . , un,si el perfil s = (s1, . . . , s

    n) es un equilibrio de Nash, entonces sobrevive la

    eliminacion reiterada de las estrategias estrictamente dominadas.

    2.4.4 Calcular los equilibrios de Nash en estrategiasmixtas

    Sea G un juego y s = (s1, . . . , sn) un perfil de estrategias que es un equilib-

    rio de Nash en el que el jugador i juega una estrategia mixta (que no es unaestrategia pura). Sea (s1i , s

    2i ) el soporte de la estrategia mixta de i, s

    i . El

    soporte de una estrategia mixta es el conjunto de todas las estrategias purasque forman parte de la estrategia pura. Por ejemplo, si i tiene tres estrate-gias puras, s1i , s

    2i y s

    3i , pero su estrategia mixta consiste en utilizar solo las

    estrategias s1i y s2i , entonces el soporte de su estrategia mixta es (s

    1i , s

    2i ).

    Sea p la probabilidad que i juegue s1i en su estrategia mixta si (la estrate-

    gia del equilibrio de Nash) y 1 p la probabilidad que i juegue s2i . Vamosa demonstrar que en este caso, las estrategias s1i y s

    2i tambien son mejores

    respuestas de i contra la estrategia si.Primero demonstramos que el jugador gana lo mismo con s1i que con s

    2i

    cuando los demas jugadores juegan si. Para facilitar las cosas supongamosque si es un perfil de estrategias puras. Supongamos que eso es falso.Entonces, i gana mas con una estrategia, por ejemplo s1i , que con la otra, s

    2i ,

    es decir,ui(s

    1i , s

    i) > ui(s

    2i , s

    i) . (2.9)

    Pero si al equilibrio de Nash i juega s1i con una probabilidad p y s2i con

    una probabilidad 1 p, la ganancia de i al equilibrio de Nash es:ui(s

    i , s

    i) = pui(s

    1i , s

    i) + (1 p)ui(s2i , si) . (2.10)

    Supongamos ahora que i juega la estrategia pura s1i . Entonces, su gananciase puede escribir as:

    ui(s1i , s

    i) = pui(s

    1i , s

    i) + (1 p)ui(s1i , si) . (2.11)

    Si calculamos la diferencia entre las ecuaciones (2.11) y (2.10) tenemos:

    ui(s1i , s

    i) ui(si , si) = ui(s1i , si) + (1 p)ui(s1i , si)

    ui(s1i , si) + (1 p)ui(s2i , si)= (1 p)ui(s1i , si) + (1 p)ui(s2i , si)= (1 p)(ui(s1i , si) ui(s2i , si)) .

  • Juegos estaticos 22

    Por la ecuacion (2.9) podemos ver que el resultado es siempre estrictamentepositivo, por lo cual i gana estrictamente mas con la estrategia pura s1i quecon la estrategia mixta si . Entonces, el perfil s

    no sera un equilibrio deNash (i quiere desviar y jugar solo la estrategia pura s1i ). Pero sabemos ques es un equilibrio de Nash y, por lo tanto, la hipotesis que hemos echo (igana mas con s1i que con s

    2i cuando los demas juegan si) es falsa. Ahora,

    es facil de ver que si ui(s1i , si) = ui(s

    2i , si) entonces tenemos

    ui(s1i , si) = ui(s

    2i , si) = ui(s

    i , si) . (2.12)

    Es decir, las ganancias de i jugando la estrategia mixta o jugando s1i o jugandos2i son iguales.

    Dos estrategias (o mas) son mejores respuestas si no hay otra estrategiaque dan una ganancia estrictamente mas y si las ganancias son iguales. Si laestrategia s1i o la estrategia s

    2i dan a i la misma ganancia que la estrategia

    mixta del equilibrio de Nash, entonces estas estrategias son tambien mejoresrespuestas.

    Eso no significa que tenemos tambien un equilibrio de Nash en el que ijuega la estrategia pura s1i o la estrategia pura s

    2i . Eso es porque si i juega

    con una de estas estrategias puras podemos tener un jugador j cuya mejorrepuesta no es sj (su estrategia en el equilibrio de Nash s), aunque i gana lomismo con s1i o con s

    2i que con la estrategia mixta.

    Tambien podemos ver que cualquiera estrategia mixta de i en la queutiliza las estrategias s1i y s

    2i es mejor respuesta en contra del perfil s1. Sea

    p la probabilidad que i juegue la estrategia s1i y 1 p la probabilidad que ijuegue la estrategia s2i . Entonces la ganancia esperada de i es:

    Eui = pui(s1i , s

    i) + (1 p)ui(s2i , si) (2.13)

    Pero porque ui(s1i , s

    i) = ui(s

    2i , s

    i) = ui(s

    i , s

    i), tenemos entonces

    Eui = pui(si , s

    i) + (1 p)ui(si , si) = ui(si , si) . (2.14)

    2.4.5 Dibujar los equilibrios de Nash

    Para dibujar los equilibrios de Nash utilizamos las funciones de mejor re-spuesta. Para eso, utilizamos dos ejes, uno que representa la mejor respuestade i, y otro la mejor respuesta de j. Hay que recordarse que la mejor re-spuesta de j (o de i) consiste en coger una estrategia de i (o de j) y buscarcual es la mejor, o las mejores estrategias de j (o de i). Vamos a dibujarlos equilibrios de Nash solo cuando cada jugador tiene dos estrategias puras.En la observacion 1 hemos visto que una estrategia pura es tambien una

  • 23 2.4 El equilibrio de Nash

    estrategia mixta. Entonces, todas las estrategias de i (o de j) se puedencaracterizar mediante la p (o la q) que es la probabilidad con la que i (o j)juegue su primera estrategia pura. Por ejemplo, p = 0 es jugar la primerestrategia pura con una probabilidad 0 y, por tanto, significa que i juega susegunda estrategia pura con una probabilidad 1, es decir, juega una estrate-gia mixta. Por ejemplo, supongamos que tenemos el juego siguiente (sin lasganancias):

    c dab

    Si cogemos una estrategia de i, es decir un p entre 0 y 1, podemos sabermirando a las ganancias de j cuales son sus mejores respuestas. Entonces,dibujar la funcion de mejor respuesta de j consiste en dibujar una curva quepor cada p entre 0 y 1 nos da un q, lo cual indica la estrategia eligida por jcuando i juega la estrategia que corresponde a este valor de p. Hacemos elmismo para el jugador j. As pues, el objetivo es de obtener dos curvas, unapara i y una para j en el grafico de la Figura 2.1.

    0 1

    1

    p

    pi

    Figura 2.1: Ejes para la representacion grafica de las mejores respuestas

    Con este grafico podemos visualizar cualquier perfil de estrategias. Porejemplo, el punto con coordinadas (1, 1) es el perfil en el que el jugador ijuega a con una probabilidad 1 y b con una probabilidad 0. Es decir, i juegala estrategia pura a. Del mismo modo, podemos ver que en este punto jjuega la estrategia pura c. Entonces, tenemos lo siguiente:

    (0, 0) corresponde al perfil (b, d)

  • Juegos estaticos 24

    (1, 0) corresponde al perfil (a, d)

    (0, 1) corresponde al perfil (b, c)

    (1, 1) corresponde al perfil (a, c)

    (x, y) con 0 < x < 1 y 0 < y < 1 es un perfil con estrategias mixtas enel que los dos jugadores utilizan una estrategia mixta (que no es unaestrategia pura).

    Estos perfiles estan en representados en la Figura 2.2.

    0(b, d)t

    1

    (a, d)t

    1 (b, c)t (a, c)tp

    p

    Figura 2.2: Ubicacion de distintos perfiles de estrategias

    Supongamos que tenemos un juego con dos jugadores y dos estrategiaspuras cada uno. Vamos a ver que podemos dibujar los equilibrios de Nashen un espacio con dos ejes. Cogemos por ejemplo el juego siguiente:

    c da 4, 2 1, 1b 3, 0 2, 5

    Este juego tiene dos equilibrios de Nash en estrategias puras: (a, c) y(b, d). Tambien tiene un equilibrio de Nash en estrategias mixtas. Sea p laprobabilidad con la que i juegue la estrategia pura a en el equilibrio de Nashen estrategias mixtas y q la probabilidad con la que j juegue la estrategiapura c en el equilibrio de Nash en estrategias mixtas. Tenemos

    p =5

    6q =

    1

    2.

  • 25 2.4 El equilibrio de Nash

    De momento, no vamos a calcular las probabilidades p y q de esteequilibrio, donde p es la probabilidad que i juegue a y q la probabilidadque j juegue c.

    Sin embargo, ya sabemos que si el jugador j juega la estrategia mixtaentonces esta indiferente entre jugar c o d (vease la seccion 2.4.4). Entonces,si i juega su estrategia mixta del equilibrio de Nash, jugar c, d o la estrategiamixta del equilibrio q son mejores respuestas de j. Pero tambien cualquieraestrategia mixta en la que juega c con una probabilidad q, y q es cualquieracifra entre 0 y 1 (no necesariamente igual a q). Si si es la estrategia mixtade i al equilibrio de Nash, entonces tenemos cuando que la ganancia esperadade j cuando juega una estrategia mixta con cualquier q es:

    Euj(si , q) = quj(s

    i , c) + (1 q)uj(si , d). (2.15)

    Pero sabemos (vease la seccion 2.4.4) que con si tenemos

    uj(si , c) = uj(s

    i , d). (2.16)

    Por lo cual tenemos:

    Euj(si , q) = quj(s

    i , c) + (1 q)uj(si , c) = uj(si , sj). (2.17)

    Eso quiere decir que si queremos saber cual es la mejor respuesta de jen funcion de la estrategia de i, es decir, en funcion del p que i ha elegido,podemos deducir que si p = p entonces cualquiera estrategia mixta de j esuna mejor respuesta. Dicho de otra manera, que j juegue c, d la estrategiamixta con q la probabilidad de jugar c o cualquiera q entre 0 y 1 siendo laprobabilidad de jugar c, eso no cambia nada: cualquiera estrategia de j le dala misma ganancia, porque i juega la estrategia mixta del equilibrio de Nash.

    Entonces, si i juega la estrategia mixta en la que la probabilidad de jugara es p, cualquiera estrategia mixta o pura de j es una mejor respuesta. Siqueremos dibujar la mejor respuesta de j cuando p = p obtendramos lalinea vertical del la Figura 2.3 en la pagina siguiente.

    Ahora nos falta saber que pinta tiene la mejor respuesta de j cuandop 6= p. Para hacer eso, lo mas sencillo es de coger una estrategia pura de i.Por ejemplo, supongamos que i juega la estrategia b. En este caso la mejorrespuesta de j es de coger la estrategia d. Entonces, lo que tenemos quehacer es:

    Localizar en el dibujo el punto de coordinadas que corresponde al perfil(b, d). Este punto es (0, 0).

    Dibujar una recta horizontal que va de (0, 0) hasta la recta verticalque hemos dibujado antes (en la Figura 2.3 en la pagina siguiente).Obtenemos el grafico de la Figura 2.4 en la pagina siguiente.

  • Juegos estaticos 26

    0 1

    1

    p

    pp 5

    6

    Figura 2.3: Mejor respuesta de j cuando p = p.

    0 1

    1

    p

    pp = 5

    6

    Figura 2.4: Mejor respuesta de j segunda etapa

  • 27 2.4 El equilibrio de Nash

    Ahora, para completar necesitamos saber lo que pasa si p > 56. Para ello,

    cogemos la estrategia de i cuando p = 1, es decir, cuando i juega la estrategiapura a. Si i juega a, la mejor respuesta de j es de jugar c, es decir, q = 1.Entonces, lo que tenemos que hacer es:

    Localizar en el dibujo el punto de coordinadas que corresponde al perfil(a, c). Este punto es (1, 1).

    Dibujar una recta horizontal que va de (1, 1) hasta la recta verticalque hemos dibujado antes (en la Figura 2.3 en la pagina anterior).Obtenemos el grafico de la Figura 2.5.

    0 1

    1

    p

    pp = 5

    6

    Figura 2.5: Mejor respuesta de j.

    Las dos lineas horizontales que acabamos de dibujar se pueden deducir delcalculo. Cuando i juega la estrategia mixta del equilibrio de Nash el jugadorj esta indiferente entre sus dos estrategias puras. Cada de sus estrategiasda una ganancia distinta segun la estrategia (que sea distinta de su estrate-gia mixta del equilibrio) elegida por i. Entonces, si i utiliza una estrategiadistinta de su estrategia mixta del equilibrio el jugador j va a preferir unaestrategia pura mas que la otra. Entonces, solo nos falta saber para que valorde pi el jugador j prefiere la estrategia c y para que valor de pi el jugador jprefiere la estrategia d.

    El jugador j prefiere jugar c si la ganancia esperada jugando c es mayor,estrictamente, que su ganancia esperada jugando d. Es decir, cuando:

    Euj(p, c) > Euj(p, d) 2p+ 0(1 p) > 1p+ 5(1 p) , (2.18)donde el perfil (p, c) significa que j juega la estrategia pura c y i una estrategiamixta en la que juega a con una probabilidad p, cuyo valor tenemos que

  • Juegos estaticos 28

    buscar (es decir, p es distinto de 56). La solucion de la ecuacion (2.18) es

    cuando p > 56. Eso quiere decir que si p > 5

    6la mejor respuesta de j es de

    jugar c, la estrategia pura que consiste en elegir q = 1. Es por ello que enla Figura 2.5 tenemos una linea horizontal que va del punto de coordinadas(56, 1) hasta el punto de coordinadas (1, 1). Del mismo modo podemos calcular

    los valores de p con los que el jugador j prefiere jugar d en lugar de c o decualquiera estrategia mixta. Para ello tenemos que solucionar la ecuacionsiguiente:

    Euj(p, c) < Euj(p, d) 2p+ 0(1 p) < 1p+ 5(1 p) . (2.19)La solucion de la ecuacion (2.19) es cuando p < 5

    6. Eso quiere decir que si

    p < 56la mejor respuesta de j es de jugar d, la estrategia pura que consiste

    en elegir q = 0. Es por ello que en la Figura 2.5 tenemos una linea horizontalque va del punto de coordinadas (5

    6, 0) hasta el punto de coordinadas (0, 0).

    Ahora dibujamos la funcion de mejor respuesta de i. Ya sabemos que alequilibrio de Nash en estrategias mixtas el jugador j juega la estrategia purac con una probabilidad 1

    2. Entonces, cuando q = q = 1

    2, el jugador i esta

    indiferente entre cualquiera estrategia: todas sus estrategias le dan la mismaganancia, por lo cual todas sus estrategias son mejores respuestas. Es decir,cualquier valor de p es una mejor respuesta. Entonces, si q = 1

    2, la curva de

    la mejor respuesta de i es una linea horizontal que va del punto (0, 12) hasta

    el punto (1, 12). Esta linea esta representada con la linea discontinuada en la

    Figura 2.6.

    0 1

    1

    q

    pp = 5

    6

    q = 12

    Figura 2.6: Mejor respuesta de i cuando q = 12.

    Si j juega c, es decir, si q = 1, entonces i juega a, es decir p = 1. Entonces,podemos dibujar una recta que va del punto (1, 1) hasta la recta horizontalque acabamos de dibujar. Obtenemos la Figura 2.7 en la pagina siguiente.

  • 29 2.4 El equilibrio de Nash

    0 1

    1

    q

    pp = 5

    6

    q = 12

    Figura 2.7: Mejor respuesta de i segunda etapa.

    Si j juega una estrategia que corresponde a un q < 12, para saber que

    pinta tiene la mejor respuesta de i cogemos el caso cuando q = 0, es decircuando j juega la estrategia pura d. En este caso la mejor respuesta de ies de jugar b, es decir p = 0. Obtenemos as el punto de coordinadas (0, 0).Para obtener el dibujo completo solo falta dibujar una linea vertical entre(0, 0) y la recta horizontal que hemos dibujado en la Figura 2.6 en la paginaanterior. Eso esta dibujado en la Figura 2.8.

    0 1

    1

    q

    pp = 5

    6

    q = 12

    Figura 2.8: Mejor respuesta de i.

    Podemos ver que las funciones de mejor respuesta de i y de j se cruzantres veces. Cada vez que se cruzan tenemos un equilibrio de Nash. De estostres equilibrios de Nash hay dos que estan ubicados en las esquinas, los

  • Juegos estaticos 30

    puntos de coordinadas (0, 0) y (1, 1): son los dos equilibrios en estrategiaspuras. El equilibrio con coordinadas (5

    6, 12) es el unico equilibrio de Nash en

    estrategias mixtas.As pues, dibujar las funciones de mejor respuesta nos permite comprobar

    el numero de los equilibrios de Nash y sus naturalezas (en estrategias puraso mixtas).

    2.5 Ejemplos

    En esta seccion vamos a ver ejemplos de juegos donde hay un equilibrio deNash en estrategias puras y juegos donde los unicos equilibrios de Nash soncon estrategias mixtas.

    2.5.1 El dilema de los prisioneros

    Hablar CallarseHablar 2, 2 0, 5

    Callarse 5, 0 1, 1

    En este juego solo hay un equilibrio de Nash: (Callarse,Callarse). Esteperfil es el unico equilibrio de Nash porque es el unico perfil que sobrevive ala eliminacion de las estrategias estrictamente dominadas: para cada jugadorla estrategia Hablar esta estrictamente dominada por la estrategia Callarse.

    En este juego, la estrategia Callarse es siempre la mejor respuesta parael jugador i. Entonces, sea lo que sea la estrategia elegida por j (pura omixta, cualquier valor de q), la mejor respuesta de i consiste en elegir p = 0.Entonces, si dibujamos la mejor respuesta de i obtenemos la Figura 2.9 enla pagina siguiente.

    Para el jugador j tenemos lo mismos: sea lo que sea la estrategia elegidapor i (pura o mixta, cualquier valor de p), la mejor respuesta de j consisteen elegir q = 0. Entonces, si dibujamos la mejor respuesta de j obtenemosla Figura 2.10 en la pagina siguiente.

    Por cierto, la funciones de mejor respuesta solo se cruzan una vez, lo quees compatible con el hecho de que solo hay un equilibrio de Nash.

    2.5.2 La batalla de los sexos

    A BA 2, 1 0, 0B 0, 0 1, 2

  • 31 2.5 Ejemplos

    0 1

    1

    q

    p

    Figura 2.9: Mejor respuesta de i en el dilema de los prisioneros

    0 1

    1

    q

    p

    Figura 2.10: Mejor respuesta de i y j en el dilema de los prisioneros

  • Juegos estaticos 32

    En este juego hay dos equilibrios en estrategias puras: (A,A) y (B,B) yun equilibrio en estrategias mixtas. Ahora vamos a calcular el equilibrio enestrategias mixtas.

    Sea p la probabilidad con la que el jugador i juegue la estrategia A, y1 p la probabilidad con que el jugador i juegue la estrategia B. Entonces,la ganancia esperada del jugador j es:

    Euj(A) = 1 p+ 0 (1 p) = p , (2.20)Si utiliza la estrategia A, y

    Euj(B) = 0 p+ 2 (1 p) = 2 (1 p) , (2.21)Si utiliza la estrategia B.

    El jugador j utiliza una estrategia mixta entre A y B si esta indiferenteentre la estrategia A y B, es decir, si su ganancia esperada cuando juega Aes la misma que su ganancia esperada cuando juega B (vease el ejercicio 7en las hojas de ejercicio que he dada en diciembre). Eso es el caso si pi es lasolucion de:

    p = 2(1 p) p = 23. (2.22)

    Es decir, si i juega A con una probabilidad p = 23el jugador j esta indiferente

    entre jugar a y jugar B. Del mismo modo podemos calcular el q con el que eljugador i esta indiferente entre jugarA y jugarB, con q siendo la probabilidadcon la que el jugador j juegue A.

    La ganancia esperada del jugador i si juega A es:

    Eui(A) = 2 q + 0 (1 q) = 2q , (2.23)y si utiliza la estrategia B es

    Eui(B) = 0 q + 1 (1 q) = 1 (1 q) , (2.24)Entonces tenemos Eui(A) = Eui(B) si:

    2q = 1 q q = 13. (2.25)

    Entonces, el tercero equilibrio de Nash es cuando:

    El jugador i juega A con una probabilidad 13y B con una probabilidad

    23,

    El jugador j juega A con una probabilidad 23y B con una probabilidad

    13.

  • 33 2.5 Ejemplos

    2.5.3 El juego de las monedas

    Tenemos dos jugadores, i y j, y cada uno debe elegir entre Cara o Cruz. Silos dos hacen la misma eleccion el jugador i da 1 euro al jugador j. Entonces,la ganancia de i es 1 y la del jugador j es 1. Si los jugadores no hacen lamisma eleccion es al reves: el jugador j da un euro al jugador i. Entonces,el juego es:

    Cara CruzCara 1, 1 1,1Cruz 1,1 1, 1

    Es facil de ver que en este juego no hay equilibrio de Nash en estrategiaspuras. El unico equilibrio de Nash es en estrategias puras, donde los dosjugadores eligen Cara con una probabilidad 1

    2y Cruz con una probabilidad

    12.En el juego de las monedas solo obtenemos un equilibrio de Nash en

    estrategias mixtas. Entonces, si dibujamos las funciones de mejor respuestaobtenemos que estas se cruzan solo una vez, en la Figura 2.11.

    0 1

    1

    q

    pp = 1

    2

    q = 12

    Figura 2.11: Mejores respuestas para el juego de las monedas

    2.5.4 El dupolio de Cournot

    Supongamos que tenemos dos empresas, i y j. Estas dos empresas producenel mismo bien y lo venden al mismo mercado. La cantidad del bien producidopor la empresa i (resp. j) es qi (resp. qj). Para las dos empresas, el objetivoes de maximizar el beneficio eligiendo la cantidad que va a vender en el

  • Juegos estaticos 34

    mercado. El precio de venta para las empresas esta determinado por lafuncion de demanda inversa:

    P = a b Q , (2.26)donde Q = qi + qj. La empresa i (resp. j) tiene un coste marginal deproduccion constante igual a ci (resp. cj), con ci, cj > 0.

    Entonces, la funcion de beneficio de la empresa i es:

    pii(qi, qj) = P qi ciqi = (a b(qi + qj))qi ciqi (2.27)y la funcion de beneficio de la empresa j es:

    pii(qi, qj) = P qj cjqj = (a b(qi + qj))qj cjqj (2.28)El objetivo de este ejemplo es de calcular el equilibrio de Nash del juego

    en el que las empresas eligen simultaneamente sus cantidades.Al final de la seccion 2.4.5 hemos visto que tenemos un equilibrio cuando

    las funciones de mejores respuestas se cruzan. Para solucionar el duopoliode Cournot vamos entonces calcular la funciones de mejor respuesta de cadaempresa. Una vez hayamos obtenido estas funciones vamos a calcular cualesson las cantidades con las que tenemos que las funciones de cruzan. Aqu,supondremos que la empresa i (resp. j) puede elegir cualquiera cantidadentre 0 y +.

    Supongamos que la empresa j ha elegido de producir una cantidad qj.Entonces, la mejor respuesta de i es la cantidad qi que maximiza pii. Paraobtener esta cantidad tenemos que calcular la derivada de pii respeto a qi:

    pii(qi, qjqi

    = 0 qi = a bqj ci2b

    . (2.29)

    Es decir, si fi(qj) es la mejor respuesta de i en funcion de qj tenemos quefi(qj) = (a bqj ci)/(2b) . Del mismo modo podemos calcular la funcionde mejor respuesta de la empresa j en funcion de qi:

    pij(qi, qjqj

    = 0 qj = a bqi cj2b

    . (2.30)

    y entonces tenemos fj(qi) = (a bqi cj)/(2b) .Las funciones de mejor respuesta fi y fj se cruzan cuando tenemos la

    solucion del sistema siguiente:{fi(qj) = qi

    fj(qi) = qj

    qi =a bqj ci

    2b

    qj =a bqi cj

    2b

    (2.31)

  • 35 2.5 Ejemplos

    La unica solucion de este sistema es cuando tenemos

    qi =a+ cj 2ci

    3bqj =

    a+ cj 2ci3b

    . (2.32)

    Entonces, el unico equilibrio de Nash en el duopolio de Cournot es cuandolas empresas i y j eligen las cantidades descritas en la ecuacion (2.32).

    Si queremos dibujar las funciones de mejor respuestas de las empresas iy j tenemos el dibujo de la Figura 2.12.

    AAAAAAAAAAAAAAAAA

    0

    qj

    qia ci2b

    a cj2b

    a ci

    a cj

    uEquilibrio: qi = a+cj2ci2b , qj = a+ci2cj2b

    Figura 2.12: Funciones de mejor respuesta de las empresas i y j.

  • Juegos estaticos 36

  • Captulo 3

    Juegos secuenciales

    En el capitulo anterior hemos visto los juegos en forma normal. En esosjuegos los jugadores juegan de manera simultanea, pero si queremos estu-diar situaciones donde hay una dinamica tenemos que tener otro enfoque delos juegos. Los juegos secuenciales y repetidos son juegos donde hay unadinamica, es decir, hay acciones que deben estar elegidas (o jugadas) antesde otras acciones. Por ejemplo, se puede ver el juego ir al cine como unjuego secuencial: primero pagamos el billete y luego podemos ver la pelcula(o salir sin ver la pelcula). Las acciones ensenar la pelcula y pagar elbillete no se realizan de manera simultanea. Primero pagamos el billete yluego los operadores del cine nos ensenan la pelcula.

    3.1 Definicion

    Un juego secuencial es un juego donde existe un orden de juego, y cuandotodos los jugadores han jugado cada uno recibe su ganancia. Despues dedistribuir las ganancias, el juego esta acabado. Observemos que este no esel caso para los juegos repetidos (que vamos a ver en el capitulo 4), dondedespues de haber distribuido las ganancias los jugadores vuelven a jugar eljuego.

    En principio, un juego secuencial (tambien llamado un juego en formaextensiva) se describe de la misma manera que un juego en forma normal,es decir:

    Un conjunto de jugadores; Cada jugador tiene un conjunto de estrategias; Para cada perfil de estrategia (= una estrategia para cada jugador) ypara cada jugador una ganancia.

  • Juegos secuenciales 38

    Donde esta la dinamica en este tipo de juegos? A partir de esta definicion,En que momento podemos deducir que hay un jugador que juega antes queotro? Parece que nuestra definicion carece de unos elementos. . . Veamos unjuego secuencial que nos ayudara a completar la definicion con los conceptosque faltan.

    bHHHHHHH

    i

    a br

    @@@@

    j

    c dr(24

    ) r(15

    )r

    @@@@

    j

    e fr(612

    ) r(2301)

    Figura 3.1: Un juego secuencial.

    Este juego se lee as: en primer lugar, juega el jugador i que puede elegirentre las acciones a y b. Si i elige la accion a, entonces el jugador j tiene quejugar, y pude elegir entre las acciones c y d. Si i elige la accion b en lugar dela accion a, j tiene que elegir entre las acciones e y f . Es importante senalar(y es evidente en el dibujo del juego) que j juega despues de i. Una vez quecada jugador ha elegido su accion, cada jugador tiene su ganancia.

    La norma en la teora de los juegos es que la primera cifra en las gananciases la del jugador que juega primero, la segunda cifra la del jugador que juegasegundo, etc. As, si i elige la accion a y j la accion c, la ganancia de i es 2y la de j es 4. Las ganancias posibles de i en este juego son 2, 1, 6 y 230, ylas de j son 4, 5, 12 y 1.

    3.1.1 Nodos de decisiones y estrategias

    Un juego secuencial esta representado por un arbol, que contiene nodosy ramas. Las ramas son las acciones de los jugadores. En el ejemplo queacabamos de ver, hay 6 ramas: a, b, c, d, e y f . Unas son del jugador i (ay b), y otras del jugador j (c, d, e y f). Los nodos son los puntos donde lasramas se tocan. En este juego hay 3 nodos. En un nodo, en lugar de poneruna accion, ponemos un jugador. Eso significa que el jugador que esta en unnodo tiene que elegir una accion de las que salen de este nodo. Por ejemplo,en el primer nodo se encuentra el jugador i, y de este nodo salen las accionesa y b. Por lo tanto, diremos que se trata de un nodo de decision: En unnodo de decision, un jugador tiene que tomar una decision, es decir, elegir

  • 39 3.1 Definicion

    una accion. En este juego, i tiene solo un nodo de decision pero j tiene 2.Dicho de otra manera, un nodo de decision es una contingencia en la quea un jugador le corresponde actuar. Por supuesto, en cada nodo dedecision solo hay un jugador. . .

    Ahora que tenemos unos terminos mas para describir un juego en formaextensiva podemos dar una definicion mas precisa de lo que es una estrategia.

    Definicion 4 Una estrategia de un jugador es un plan de accion com-pleto, es decir, especifica una accion factible de este jugador en cada nodode decision en lo que al jugador le pudiera corresponder actuar.

    Si volvemos al juego de antes observamos que el jugador i tiene un uniconodo de decision. Por lo que una estrategia de i solo contiene un elemento,es decir una accion. En conjunto de estrategias de i es:

    Si = {a, b} . (3.1)El caso del jugador j es mas interesante. Este jugador tiene dos nodos dedecision, uno despues de que i ha jugado a y el otro despues que i ha jugadob, por lo que cada estrategia de j debe contener dos acciones: una para unnodo y otra para el otro nodo. As, una estrategia de j puede ser:

    jugar c si i ha jugado ajugar f si i ha jugado b .

    Otra estrategia podra ser

    jugar c si i ha jugado ajugar e si i ha jugado b .

    Con estas estrategias esta claro que j juega despues de i, y que j puede jugarc solo si i ha jugado a. Es decir, tenemos una dinamica en la descripcion deljuego, que aparece en las estrategias de los jugadores.

    Por cierto, escribir as las estrategias de j es un poco feo, por lo queescribimos solo las acciones que j elige en cada nodo. As pues, el conjuntode estrategias de j es:

    Sj = {(c, e), (c, f), (d, e), (d, f)} . (3.2)Es muy importante entender que los elementos de la ecuacion (3.2) (por

    ejemplo (c, e), o (d, e)) son estrategias, pero c, o d no son estrategias, sinoacciones.

    Una accion es un concepto local: es lo que hace un jugador en unmomento particular del juego; es una rama en el dibujo.

  • Juegos secuenciales 40

    Una estrategia es una coleccion de acciones. Es un concepto global,por que nos obliga a considerar el juego entero, o mas precisamente,no obliga a considerar todos los nodos de decisiones donde el jugadorpuede jugar.

    Por cierto, una confusion es posible: en el juego que nos sirve de ejemplo,los numeros de acciones de j y de i son los mismos que los numeros deestrategias que tienen. Pero son conjuntos distintos para el jugador j.

    Miramos el juego siguiente.

    bHHHHHHH

    i

    a br

    @@@@

    j

    c dr(24

    ) r(15

    )r

    @@@@

    j

    e fg

    r(612

    ) r(2301) r(

    89

    )Figura 3.2: Un juego en forma extensiva.

    En este juego, el conjunto de acciones de i es:

    Ai = {a, b} . (3.3)Y el conjunto de acciones de j es:

    Aj := {c, d, e, f, g} . (3.4)As, el jugador j tiene 5 acciones. El conjunto de estrategias de i es:

    Si = {a, b} , (3.5)y el de j es:

    Sj = {(c, e), (c, f), (c, g), (d, e), (d, f), (d, g)} , (3.6)por lo que j tiene 6 estrategias.

    Veamos otro ejemplo en el que el conjunto de estrategias de i es distintodel de su conjunto de acciones.

    En este juego, i tiene 3 nodos de decisiones y por lo tanto cada estrategiade i debe tener 3 acciones distintas. El conjunto de acciones de i es:

    Ai = {a, b, l,m, p, q} , (3.7)

  • 41 3.1 Definicion

    bHHHHHHHHHHH

    i

    a b

    r

    @@@@

    j

    c dr(24

    ) r(110

    )rHHHHHHH

    j

    e fr

    @@@@

    i

    l m

    r(23

    ) r(14

    )r

    @@@@

    i

    p q

    r(50

    ) r(54

    )Figura 3.3: Un juego donde i tiene 8 estrategias.

    pero su conjunto de estrategias es

    Si = {(a, l, p), (a, l, q), (a,m, p), (a,m, q), (b, l, p), (b, l, q), (b,m, p), (b,m, q)} .(3.8)

    Eso nos da 8 estrategias. Para contar el numero de estrategias hay quemultiplicar el numero de acciones de cada nodo de decision del jugador i. Encada nodo, i tiene dos acciones. Entonces, su numero de estrategia es 2 2 2 = 8.

    La manera mas sencilla de construir el conjunto de estrategias consiste endibujar un arbol. En el primer nodo, pongamos las dos acciones que tiene enel primero nodo, a y b. Una vez que ha elegido entre a y b, el jugador i tieneque elegir una accion del segundo nodo. Es decir, tiene que elegir entre l y m.Entonces, si ha elegido a en primer lugar, puede elegir l om en segundo lugar.Eso nos da (a, l) y (a,m). Pero si ha elegido b en primer lugar, podemos tener(b, l) y (b,m). En este momento tenemos cuatro posibilidades:

    (a, l), (a,m), (b, l) y (b,m) . (3.9)

    Ahora, hay que anadir una accion del ultimo nodo, p o q. Si anadimos p,tenemos:

    (a, l, p), (a,m, p), (b, l, p) y (b,m, p) . (3.10)

    Pero si anadimos q, tenemos:

    (a, l, q), (a,m, q), (b, l, q) y (b,m, q) . (3.11)

    Si juntamos (3.10) y (3.11) tenemos (3.8) .

  • Juegos secuenciales 42

    b

    @@@@@@@@

    i

    a

    b

    r

    QQQQQQ

    l

    m

    r

    QQQQQQ

    l

    m

    rHHHHHp

    q

    r (b,m, p)r (b,m, q)

    rHHHHHp

    q

    r (b, l, p)r (b, l, q)

    rHHHHHp

    q

    r (a,m, p)r (a,m, q)

    rHHHHHp

    q

    r (a, l, p)r (a, l, q)

    Figura 3.4: Construccion de las estrategias de i del juego de la Figura 3.3.

    Por que tenemos que especificar tantas cosas en las estrategias de losjugadores? Por que si i decide jugar a tiene que especificar lo que hacedespues de que j haya jugado e? Eso parece raro, porque j juega e cuando iha jugado b. Pero si i juega a, i sabe que j va a elegir entre las acciones c yd, y nunca entre las acciones e y f . Entonces, Por que complicarnos la vida? Hay dos razones:

    Por una parte, porque es la definicion de una estrategia. . . Es decir, setrata simplemente una definicion, y nada mas. Si quereis hablar deotra cosa, podeis, pero no podeis llamarla una estrategia.

    Por otra parte, decir que una estrategia es un plan de accion para cadanodo de decision en el que al jugador le podra corresponder jugar esnecesario cuando queremos estudiar los equilibrios.

    3.1.2 El equilibrio de Nash

    El equilibrio de Nash en los juegos secuenciales tiene la misma definicionque en los juegos en forma normal. Es decir, un perfil de estrategia s =(s1, s2, . . . , si1, si, si+1, dots, sn) es un equilibrio de Nash si, para cada ju-

  • 43 3.1 Definicion

    gador i, para cada estrategia si 6= si, tenemos:

    ui(si, si) ui(si, si) , (3.12)

    donde si es la coleccion de las estrategias de todos los jugadores excepto eljugador i. Es decir,

    si = s(s1, s2, . . . , si1, si+1, dots, sn} . (3.13)

    Dicho de otra manera un equilibrio de Nash es una estrategia para cadajugador en la que cada esa es una mejor respuesta contra las estrategiaselegidas por los demas. Eso significa que la estrategia de un jugador i, alequilibrio de Nash, depende de la estrategia de los otros jugadores. Pero lasestrategias de esos jugadores dependen de la estrategia de i. . .

    Cogemos por ejemplo el juego de la Figura 3.5.

    bHHHHHHHHHHH

    i

    a b

    r

    @@@@@

    j

    c d

    r(24

    ) r(110

    )r

    @@@@@

    j

    e f

    r(50

    ) r(54

    )

    Figura 3.5:

    En este juego, los conjuntos de estrategias de i y j son respectivamente

    Si = {a, b}, Sj = {(c, e), (c, f), (d, e), (d, f)} . (3.14)

    Entonces, tenemos 8 perfiles de estrategias posibles:

    (a, (c, e)) (b, (c, e))

    (a, (c, f)) (b, (c, f))

    (a, (d, e)) (b, (d, e))

    (a, (d, f)) (b, (d, f))

  • Juegos secuenciales 44

    Supongamos que i elige la estrategia a y j elige la estrategia (c, f). Paraver si este perfil es un equilibrio de Nash, tenemos que ver si jugar a es unamejor respuesta contra (c, f) para i, y si (c, f) es una mejor respuesta de jcuando i juega a.

    Si sabemos que i juega a, Por que necesitamos saber lo que hace j si ijuega b? La razon es muy sencilla. Par ver si el perfil (a, (c, f)) es un equilibriode Nash, tenemos que ver si para cada jugador no hay otra estrategia quele de una ganancia estrictamente mas grande. La unica posibilidad de i siquiere desviarse del perfil (a, (c, f) es jugar b. Si i no desva, es decir si i eligela estrategia a, entonces i tiene una ganancia de 2 (porque j juega c). Si ijuega b, el tiene que saber cual seria su ganancia. Pero eso no puede saberlosi no sabe que accion (entre e y f) ha elegido j.

    Pero, trabajando con el concepto de estrategia, sabemos que j elige laaccion f . Por lo tanto, i puede ver que tiene una ganancia de 5 si juega ben lugar de a, cuando j elige la estrategia (c, f). Ahora esta claro que sidefinimos una estrategia de j como c (en lugar de (c, e) o (c, f)), no podemossaber si a es la mejor respuesta de i contra la estrategia de j.

    Ya hemos visto que cuando j elige (c, f), jugar b es la mejor respuesta dei. Entonces, el perfil (a, (c, f)) no puede ser un equilibrio de Nash.

    A continuacion, veamos si el perfil (b, (c, f) es un equilibrio de Nash. Yasabemos que b es la mejor respuesta de i contra la estrategia (c, f) de j.Para ver si ese perfil es un equilibrio de Nash, solo falta verificar que para jla estrategia (c, f) es una (o la) mejor respuesta cuando i juega b. El jugadorj tiene 4 estrategias. Si juega (c, f), podemos ver que tiene una ganancia de4. Tambien tiene una ganancia de 4 si elige la estrategia (d, f). Pero si jjuega la estrategia (c, e) o la estrategia (d, e), tiene una ganancia de 0. Porcierto, eso es menor que 4, y entonces jugar (c, f) es una mejor respuestapara j. As pues, el perfil (b, (c, f)) es un equilibrio de Nash.

    En el analisis que acabamos de hacer hemos utilizado (sin darnos cuenta)el concepto de camino de ejecucion de un perfil de estrategia. El caminode ejecucion de un perfil es la su-cecion de las acciones de los jugadores quellevan a las ganancias. Siempre se da el caso de que el camino de ejecucionsale del nodo de decision original. En nuestro ejemplo, el nodo de decisionoriginal es el nodo donde i tiene que elegir entre a y b. Con el perfil (a, (c, f),el camino de ejecucion es (a, f): i juega a, y despues j juega f . Aunque jtiene previsto jugar c si i juega a, j no tiene que jugar la accion c (en elsentido de actuar, de realizar una accion). La unica accion realizada por jes la accion f .

    En la Figura 3.6 el camino de ejecucion del perfil (a, (c, f)) esta indicadopor las lineas dobles.Ejercicio: Buscar los otros equilibrios de Nash de este juego.

  • 45 3.2 La induccion hacia atras

    bHHHHHHHHHHH

    i

    a b

    rHHHHHHHHHHHr

    @@@@@

    j

    c d

    r(24

    ) r(110

    )r

    @@@@@

    j

    e f

    r(50

    ) r(54

    )r@@@@@

    Figura 3.6: El camino de ejecucion del perfil (b, (c, f)).

    3.2 La induccion hacia atras

    El problema con el equilibrio de Nash en los juegos secuenciales es que puedellevar resultados que no son muy satisfactorios. Por supuesto, en los juegos enforma normal tambien podemos tener equilibrios malos, pero en los juegossecuenciales, dado el aspecto dinamico, esos equilibrios se podran evitar.Consideramos por ejemplo el juego de la figura 3.7.

    bHHHHHHHHHHH

    i

    a b

    r(110

    ) rr

    @@@@@

    j

    e f

    r(50

    ) r(54

    )

    Figura 3.7:

    Este juego tiene dos equilibrios de Nash:

    E1 = (a, e), E2 = (b, f) . (3.15)

  • Juegos secuenciales 46

    El perfil E1 es un equilibrio de Nash porque si j juega e, la mejor repuestade i es elegir la accion a. Si i elige esa accion tiene una ganancia de 1, y sielige la accion b, obtiene una ganancia de 5 (porque j juega e si i juega b).Si j juega e o f , el resultado no cambia (su ganancia es 10) y por lo tantojugar e es una mejor respuesta de j cuando i juega a.

    Pero, si i juega b, jugar e es la mejor respuesta de j? Supongamos quelos jugadores acuerdan jugar el perfil E1, pero cuando el juego empieza, i seequivoca y juega b en lugar de a. En este caso, j tiene que actuar, y sumejor eleccion es f , y no e. Pero si i sabe que j juega f , la mejor opcion dei es de jugar b y no a. As, tendra una ganancia de 5 en lugar de 1 que seriasu ganancia si hubiera jugado a.

    Vemos pues que el unico equilibrio que tiene sentido es el perfil E2.Para llegar a esta conclusion, hemos empezado por el fin del juego: primeroanalizar el comportamiento optimo de j, y dar un paso hacia atras y analizarel comportamiento optimo de i.

    Analizar una situacion dinamica empezando por el final y acabar por laprimera etapa puede parecer raro, pero es una manera muy util de solucionaruna situacion dinamica.

    Para entender porque es natural empezar por el final cojamos el casode un jugador de ajedrez. El senor Karpov esta jugando un partido, y seencuentra en una situacion en la que tiene 2 posibilidades. mover su reina omover su torre. Por ejemplo, Karpov podra ser en el juego de la Figura 3.7el jugador i. Cuando Karpov hace su eleccion se imagina lo que pasara simueve su reina o si mueve su torre. Mas precisamente, se pregunta cual seriala mejor accion del otro jugador si mueve la reina o la torre. Una vez queKarpov sabe cuales son los mejores movimientos del oponente despues dehaber movido el la reina o la torre, puede hacer su eleccion.

    En nuestro juego, solo nos interesa lo que pasa cuando i juega b, porquesi juega a el juego esta acabado y el jugador j no juega. Aqu, el jugador seimagina ser el jugador j, para saber lo que hara j si i elige b. En este caso,la mejor accion de j es f . Entonces, i sabe que si juega b, el jugador j debeelegir, racionalmente, la accion f y por lo tanto, i tendra una ganancia de5.

    En el perfil E1, decimos que j amenaza con jugar e. Si i cree en estaamenaza, la mejor accion de i es jugar a y no b. Es por ello que E1 es unequilibrio de Nash. Esta amenaza tiene sentido para j puesto que en estecaso tiene una ganancia de 10 si i cree en la amenaza. Pero acabamos de verque la amenaza de j no es creble: si i juega b, j no va a jugar e, sino queva a jugar f .

    Hemos podido analizar el juego y ver que el unico perfil de estrategiasque tiene sentido es el perfil E2. El hecho de empezar por el fin del juego,

  • 47 3.3 Ejemplo: El duopolio de Stackelberg

    de buscar los comportamientos optimos de los jugadores y subir haca elmodo inicial se conoce como la induccion hacia atras.

    En la seccion siguiente vamos a ver un ejemplo de la induccion haciaatras, a traves de un modelo economico (un poco) parecido al duopolio deCournot.

    3.3 Ejemplo: El duopolio de Stackelberg

    Supongamos que tenemos dos empresas, i y j que producen el mismo bien.La empresa i elige la cantidad que produce, qi y la empresa j elige la cantidadque produce, qj. La empresa i tiene un coste marginal de produccion iguala ci y la empresa j tiene un coste marginal de produccion igual a cj, conci, cj > 0. Es decir, si la empresa i produce una cantidad qi su coste deproduccion total es ci qi.

    La dos empresas venden el bien en el mismo mercado, lo que supone queel precio de vente para las dos empresas es lo mismo, que denominamos porp.

    En el modelo de Stackelberg la demanda inversa1 de los consumidores es

    P = a b Q , (3.16)donde Q es la cantidad total propuesta en el mercado por las empresas i yj, es decir, Q = qi + qj .

    Entonces, el beneficio de la empresa i es:

    pii(qi, qj) = P qi ci qi = (a b(qi + qj))qi ciqi , (3.17)y el beneficio de la empresa j es:

    pij(qi, qj) = P qj cj qj = (a b(qi + qj))qj cjqj , (3.18)En el duopolio de Stackelberg, una de las empresas elige primera su nivel

    de produccion y luego la otra empresa elige el suyo. Sea i la empresa que eligeprimero. Supongamos que la empresa i ha elegido un nivel de produccion qi.Ahora estamos entonces en la segunda etapa del juego, en la que la empresaj elige qj. La empresa j va a elegir el qj que maximiza su beneficio. Parasaber cual es el nivel de produccion optimo para j tenemos que calcular laderivada de pij por qj. Tenemos:

    pij(qi, qjqj

    = 0 abqi2bqjcj = 0 qj = a bqi c2b

    . (3.19)

    1Se llama demanda inversa porque da el precio en funcion de las cantidades compradaspor los consumidores. La demanda suele dar las cantidades en funcion del precio de venta.

  • Juegos secuenciales 48

    Por la induccion hacia atras la empresa i sabe que si produce qi entoncesla empresa j produce el nivel qj indicado por la ecuacion (3.19). Entonces,para la empresa i es como si su funcion de beneficio fuera la siguiente:

    pii(qi) =

    (q b

    (qi +

    a bqi c2b

    ))qi ciqi . (3.20)

    En este caso, la empresa i va a elegir el nivel de produccion qi que maxi-miza su beneficio indicado por la ecuacion (3.20). Eso nos da:

    pii(qiqi

    = 0 a 2bqi + ci2

    ci = 0 qi = a ci2b

    (3.21)

    Con esta solucion deducimos que el nivel de produccion elegido por laempresa j sera dado reemplazando en la solucion de la ecuacion (3.19) qi porsu valor encontrado en la ecuacion (3.21), es decir:

    qj =a+ ci 2cj

    4b. (3.22)

    En este caso, los beneficios de las empresas son:

    pii(qi, qj) =a 3ci + 2cj

    8b, pij(qi, qj) =

    (a+ ci 2cj)216b

    . (3.23)

    Lo que acabamos de hacer se llama calcular un equilibrio perfecto ensubjuegos. Este concepto de equilibrio esta descrito en la seccion siguiente.

    3.4 Equilibrio perfecto en subjuegos

    Acabamos de ver que el principio de la induccion hacia atras es un conceptomuy adecuado para analizar los juegos secuenciales. La induccion hacia atrases un elemento clave de un concepto de equilibrio introducido por ReinhardSelten a principio de los anos Setenta, el equilibrio perfecto en subjuegos.

    Antes de poder dar una definicion de este concepto de equilibrio necesi-tamos otras definiciones previas.

    Sea G un juego secuencial y sea un nodo de decision de este juego. Elsubjuego en el nodo es una parte del juego G que empieza en el nodo de, de forma que todos los nodos de decisiones que son posteriores al nodo forman parte del subjuego en el nodo .

    Dicho de otra manera, si cogemos un nodo de decision del juego (distintodel nodo ) este nodo forma parte del subjuego en el nodo si para cualquieraejecucion del juego, para llegar al nodo tenemos que pasar por el nodo .

  • 49 3.4 Equilibrio perfecto en subjuegos

    bHHHHHHHHHHH

    i,

    a b

    r

    @@@@

    j,

    c dr(24

    ) r(110

    )rHHHHHHH

    j,

    e fr

    @@@@

    i,

    l m

    r(23

    ) r(14

    )r

    @@@@

    i,

    p q

    r(100

    ) r(54

    )Figura 3.8: Un juego donde i tiene 8 estrategias.

    Cogemos el juego de la Figura 3.8. En este juego, hemos dado nombresa los nodos: , , , y .

    Tomamos, por ejemplo, el nodo . El subjuego en este nodo debe contenertodos los nodos que son posteriores al nodo , es decir, los nodos y . Elnodo no es un nodo posterior al nodo y, por lo tanto, no esta en elsubjuego del nodo .

    Si queremos un subjuego que contiene los nodos y , tenemos que cogercomo nodo inicial del subjuego un nodo x tal que los nodos y son nodosposteriores del nodo x. El unico nodo que satisface esta condicion es elnodo .

    Eso significa que un subjuego se puede ver como un juego por s mismoy, por lo tanto, el juego entero (el que empieza en el nodo ) tambien es unsubjuego. As todos los subjuegos del juego de la Figura 3.8 son:

    El subjuego que empieza en el nodo , representado en la figura 3.8.

    El subjuego que empieza en el nodo , representado en la figura 3.9.

    El subjuego que empieza en el nodo , representado en la figura 3.10.

    El subjuego que empieza en el nodo , representado en la figura 3.11.

    El subjuego que empieza en el nodo , representado en la figura 3.12.

    Ahora que sabemos lo que es un subjuego, veamos cual es la definicionde un equilibrio perfecto en subjuego.

  • Juegos secuenciales 50

    b

    @@@@

    j,

    c dr(24

    ) r(110

    )Figura 3.9: El subjuego en .

    bHHHHHHH

    j,

    e fr

    @@@@

    i,

    l m

    r(23

    ) r(14

    )r

    @@@@

    i,

    p q

    r(50

    ) r(54

    )Figura 3.10: El subjuego en .

    b

    @@@@

    i,

    l mr(23

    ) r(14

    )Figura 3.11: El subjuego en .

    b

    @@@@

    i, p q

    r(100

    ) r(54

    )Figura 3.12: El subjuego en .

  • 51 3.4 Equilibrio perfecto en subjuegos

    Definicion 5 Un perfil de estrategias es un equilibrio perfecto en sub-juegos de un juego secuencial G si es un equilibrio de Nash en cada sub-juego de G.

    Una vez que tenemos la definicion del equilibrio perfecto en subjuegospuede parecer que esta no tiene mucha relacion con el principio de la in-duccion hacia atras. Recuerda que la induccion hacia atras consiste en salirde los ultimos nodos del juego, buscar la mejor accion de los jugadores en esosnodos, y dar un paso hacia atras, considerando que el juego esta solucionadoen las etapas posteriores.

    Cogemos el juego de la Figura 3.8. Estudiamos este juego con el principiode la induccion hacia atras. En el nodo , la mejor accion de i es l. Si ahoracogemos el subjuego en el nodo (en la figura 3.11), podemos ver que el unicoequilibrio de Nash en este subjuego es tal que i elige la accion l. Por lo tanto,si buscamos un equilibrio perfecto en subjuegos del juego de la Figura 3.8,la estrategia de i debe ser tal que elige la accion l en el nodo . Del mismomodo, la accion optima de i en el nodo es p, y p es el unico equilibrio deNash en el subjuego .

    Ya hemos analizado la ultima etapa del juego. Podemos estudiar ahorala penultima etapa, donde j juega. Por el principio de la induccion haciaatras, sabemos que si j juega la accion e en el nodo , el jugador i juega laaccion l. Entonces, j sabe que si elige la accion e en el nodo , su gananciaes 3, y la de i es 2. Eso implica que para j, el juego es como si se acabarajusto despues de haber jugado e o f . Es decir, es como si el juego fuera eljuego de la Figura 3.13.

    bHHHHHHHHHHH

    i,

    a b

    r

    @@@@

    j,

    c dr(24

    ) r(110

    )r

    @@@@

    j,

    e fr(23

    ) r(100

    )

    Figura 3.13: Ya sabemos la acciones de i en la ultima etapa

    Ahora tenemos que buscar la acciones optimas de j en los (nuevos) sub-juegos y . El subjuego en es igual que antes, pero el subjuego en esnuevo, dado que hemos integrado las acciones en que i juega si j juega e o f .

  • Juegos secuenciales 52

    En el nodo , la mejor accion de j es d, y en el nodo es e; pero podemosver que en el subjuego , jugar d es el unico equilibrio de Nash.

    Entonces, un equilibrio perfecto en subjuegos del juego de la Figura 3.8debe ser tal que j juega d en y e en . Por que? En el subjuego (veasela Figura 3.10), i juega l y p. La mejor repuesta de j contra esta estrategia esjugar e. Si las estrategias de i y j en el juego inicial son tales que i juega l en y p en , y j juega e en , entonces estas estrategias forman un equilibriode Nash en los subjuegos , y . Esas acciones son claramente las mismasque obtenemos cuando analizamos el juego con el principio de la induccionhacia atras.

    Si damos un paso hacia atras llegamos al nodo . Par el jugador i escomo si el juego fuera el juego de la Figura 3.14.

    b

    @@@@

    i,

    a br(110

    ) r(23

    )Figura 3.14: El subjuego en con la induccion hacia atras.

    Eso es as porque ya sabemos que j juega d en y e en , y que i juega len y p en . Entonces, la mejor accion de i en es b que da una gananciade 2, que es mejor que una ganancia de 1 si juega a.

    Con el principio de la induccion hacia atras obtenemos el perfil de es-trategias siguiente:

    i juega b en , l en y p en . j juega d en y e en .Con el equilibrio perfecto en subjuegos llegamos al mismo perfil de es-

    trategias. Sea s un equilibrio perfecto en subjuegos, entonces, s es un perfilde estrategias: una estrategia para i y una para j. Cada estrategia de i debetener 3 componentes: una accion en , una en y una en . Para j cadaestrategia debe tener 2 componentes: una accion en y una en .

    Segun la definicion del equilibrio perfecto en subjuegos s = (si , sj) debe

    formar un equilibrio de Nash en cada subjuego. El equilibrio de Nash en elsubjuego delta es unico: i juega l. En el subjuego tambien hay un unicoequilibrio de Nash: i juega p. Dado que i juega (l, p), la unica mejor respuestade j en es jugar e. Entonces, el unico equilibrio de Nash en el subjuego ,es aquel en el que i juega (l, p) y j juega e.

  • 53 3.5 Ejemplos

    Por lo tanto, si y sj deben ser tales que

    si = (x, l, p) sj = (y, e) , (3.24)

    donde x es la accion que i juega en y y la accion elegida por j en .En el subjuego el unico equilibrio de Nash es aquel en el que j juega d.

    Por lo que la unica estrategia de j que puede formar parte de un equilibrioperfecto en subjuegos es

    sj = (d, e) , (3.25)

    Solo nos falta una accion para tener el equilibrio perfecto en subjuegos:la accion elegida por i en el nodo . Dado que en los otros nodos las accionesjugadas son d, e, l y p, la mejor accion que i puede elegir es b en el nodo ,por lo que el unico equilibrio perfecto en subjuegos es

    si = (b, l, p) sj = (d, e) . (3.26)

    Hemos visto que el equilibrio perfecto en subjuegos y el principio de lainduccion hacia atras nos dan el mismo resultado.

    3.5 Ejemplos

    En esta seccion vamos a ver dos ejemplos: el primero demuestra que el equilib-rio perfecto en subjuegos puede llegar a resultados que no son satisfactorios.El segundo es solo un ejercicio.

    3.5.1 El juego del ciempies

    El juego del ciempies se llama as porque su representacion grafica tiene (unpoco) la aparencia de este animal.

    bi P

    C

    r(10

    )rrj

    P

    C

    r(02

    )rri

    P

    C

    r(31

    )rrj

    P

    C

    r(24

    )rri

    P

    C

    r(53

    )rrj

    P

    C

    r(46

    )r (6

    5

    )

    Figura 3.15: El juego del ciempies.

    El juego empieza en el nodo . El jugador i tiene que elegir entre parar,P , y continuar, C. Si elige P entonces el juego se acaba y las ganancias son

  • Juegos secuenciales 54

    de 1 para el jugador i y 0 para el jugador j. Si i elige C, entonces llegamosal nodo y el jugador j tiene que elegir entre C y P . Si elige P tiene unaganancia de 2 y el jugador i tiene una ganancia de 0. El juego continua ashasta el nodo en el que, sea lo que sea la eleccion del jugador j, el juego seacaba.

    Por cierto, le perfil de estrategias en el que los jugadores siempre eligenC parece la mejor solucion. As tienen una ganancia de 6 para el jugadori y de 5 para el jugador j. Sin embargo, eligir siempre C no constituye unequilibrio perfecto en subjuegos. En el nodo , el jugador j tiene que elegirentre C y P . Si elige C tiene una ganancia de 5 y una ganancia de 6 si eligeP . Entonces, elige P cada vez que este en el nodo . En el nodo anterior, elnodo , el jugador i sabe que si elige C va a tener una ganancia de 4, porqueen este caso el jugador j va a elegir P , mientras que si elige P y obtiene unaganancia de 5. As pues, en el nodo el jugador i va a elegir P . Continuandoas, podemos deducir que en el nodo el jugador j va a elegir P , en el nodo el jugador i va a elegir P , etc. En el nodo , el jugador i va a elegir P , paraobtener una ganancia de 1, que es mayor que 0, la ganancia que obtendra alelegir C (porque si elige C llegamos en el nodo y en este nodo j elige P ).

    Entonces, el unico equilibrio perfecto en subjuegos de este juego es:

    El jugador i elige la estrategia (P, P, P ) El jugador j elige la estrategia (P, P, P )

    Este perfil de estrategias permite al jugador i de obtener una ganancia de 1y al jugador j de obtener u