La théorie des jeux

La théorie des jeux


Analyse des comportements stratégiques Utilisée en économie Relations internationales Jeux d’argent ou de société, etc.

Concurrence imparfaite Interactions stratégiquesEntreprises tiennent compte de la demandeProduction : fonction des autres entreprises

Le dilemme du prisonnier

Résolution d’un jeu

L’équilibre de Nash

L’équilibre en stratégie mixte

Les jeux répétés



Le dilemme du prisonnier définit une solution de jeux dans lesquels l’équilibre est sous-optimal

La solution optimale ne peut constituer l’équilibre du jeu issu de la rationalité des agents compte tenu des hypothèses de comportement et d’information.

Le dilemme du prisonnier démontre la difficulté à établir une coopération entre les agents alors que celles-ci auraient accru le bénéfice des agents.

Le jeu dans sa forme classiqueDeux suspects son arrêtés par la police,

mais la police manque de preuve pour les emprisonner.

Il ne peuvent les condamner qu’à un an de prison pour des faits mineurs.

La police doit les faire avouer.

Comment s’y prendre ?


Les policiers proposent un marché Si les deux avouent, ils auront chacun 5 ans, si

l’un avoue et l’autre nie, ils encourent 1 ou 10 ans, si les deux nient, chacun aura 2 ans de prison

Matrice des gains2ème criminel

avoue nie

1er criminel

avoue (5;5) (1;10)

nie (10;1) (2;2)


La solution du jeu est que le deux avouent

Chaque joueur poursuit son propre intérêt

S’agit-il d’un optimum social ? Contestation de la théorie économique « A beautiful mind »

Sans coopération, l’équilibre n’est pas optimal


Illustration: duopole avec bien homogène

Deux entreprises sur un marché peuvent : Se faire concurrence (Cournot) S’entendre pour partager la rente (cartel) Profit de l’entente > profit de duopole.

Si l’entente n’est pas illégale, alors cette solution est optimale du point de vue des entreprises. Mais l’entreprise peut essayer de tricher et produire plus.

2 joueurs : 2 entreprises A et B Produisant le même bien

2 stratégies : Produire la quantité de duopole Produire la quantité d’entente

Etant donnés 2 joueurs et 2 stratégies, le marché peut se trouver dans 4 cas de figure différents.


Dans un cas d’entente respectée: Chaque entreprise gagne un profit d’entente Πe = 10

Dans un cas de concurrence de duopole : Chaque entreprise gagne un profit de duopole

moins élevé Πd = 2

En cas d’entente non respectée: L’entreprise produisant la quantité de duopole

capture des parts de marchés et gagne un profit de tricheur élevé, Πt = 15. L’autre entreprise est pénalisée et gagne un profit minimum, Πm = 0.


Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)

Pour ent. A:Qd si ent B choisit Qd

Qd si ent B choisit Qe

Quel est la meilleure stratégie pour chaque entreprise?

Pour ent. B:Qd si ent A choisit Qd

Qd si ent A choisit Qe


Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)

Remarquons que la stratégie dominante est de produire la quantité de duopole, quelle que soit la stratégie de l’autre joueur.

Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs.






Les jeux répétés


Un jeu se résout comme suit

1. Identifier les décisions de A1. Meilleure décision de A, compte tenu de B12. Meilleure décision de A, compte tenu de B2, etc.

2. Identifier les décisions de B3. Meilleure décision de B, compte tenu de A14. Meilleure décision de B, compte tenu de A2, etc.

3. On caractérise la solution du jeu, si elle existe


Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)

Résolution d’un jeu (1)

1. Seules les décisions de A sont prises en compte

2. Seules les décisions de A sont retenues si B choisit Qd

3. On retient la décision qui génère le plus gros gain

*

Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)


1. Seules les décisions de A sont prises en compte

2. Seules les décisions de A sont retenues si B choisit Qe


**

Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)


1. Seules les décisions de B sont prises en compte

2. Seules les décisions de B sont retenues si A choisit Qd


** *

Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)


1. Seules les décisions de B sont prises en compte

2. Seules les décisions de B sont retenues si A choisit Qe


** *

*

Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd (2, 2) (15,0)

Qe(0,15

)(10,10)


1. Un jeu a un équilibre quand il génère une convergence des décisions stratégiques

2. Le couple de stratégies (Qd;Qd) est la solution du jeu

** *

*

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)

Résolution d’un jeu - Exemple de l’aéronautique

1. Prenons le cas de de l’aéronautique, avec deux constructeurs : Airbus et Boeing.

2. Voici la matrice des profits de chacun des constructeurs quand ils entreprennent de produire (P) ou pas (NP)

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)

Résolution d’un jeu - Exemple (1)

1. Seules les décisions de Boeing sont prises en compte

2. Seules les décisions de Boeing sont retenues si Airbus choisit de produire


*

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)


1. Seules les décisions de Boeing sont prises en compte

2. Seules les décisions de Boeing sont retenues si Airbus chosit de ne pas produire


*

*

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)


1. Seules les décisions de Airbus sont prises en compte

2. Seules les décisions de Airbus sont retenues si Boeing choisit de produire


*

*

*

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)


1. Seules les décisions de Airbus sont prises en compte

2. Seules les décisions de Airbus sont retenues si Boeing choisit de ne pas produire


*

*

*

*

Matrice des gains

Airbus

P NP

Boeing

P (-1,-1) (10,0)

NP(0,10

)(0,0)


1. Ce jeu a deux équilibres (convergence des décisions stratégiques)

2. Le couple de stratégies (P;NP) est le premier équilibre du jeu

3. Le couple de stratégies (NP;P) est le deuxième équilibre du jeu.

*

*

*

*

Matrice des gains

Joueur 2

S1 S2

Joueur 1

S1 (0,10) (10,0)

S2 (10,0) (0,10)

Exemple de jeu sans équilibre

*

*

*

*





Les jeux répétés


L’Equilibre de Nash

L’équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation en changeant unilatéralement de stratégie, compte tenu des décisions de l’autre joueur

Propriétés centrales: Contribution de John Nash (1950)L’équilibre de Nash est généralement stableChaque jeu défini à au moins un équilibre de Nash:

soit en stratégies pures : les joueurs ne jouent qu'une seule stratégie à l’équilibre

soit en stratégies mixtes : les joueurs jouent plusieurs stratégies avec une probabilité fixe

Retour à l’exemple de Duopole:

Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd 2,2 15,0

Qe 0,15 10,10

Un joueur peut-il seul améliorer sa position ?

L’entreprise A ?

L’entreprise B ?

Puisque qu’ où aucun joueur ne peut améliorer sa situation, il s’agit d’un équilibre de Nash

L’Equilibre de Nash

Efficacité de l’équilibre


Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd 2,2 15,0

Qe 0,15 10,10

La stratégie dominante est de produire « Qd »

Mais l’équilibre «Qd-Qd» n’est pas collectivement optimal au sens de Pareto

Si le nombre d’agents est restreint, la rationalité individuelle n’amène pas forcement au bien être collectif

Efficacité de l’équilibre


Matrice des gains

Ent. B

Qd Qe

Ent. A

Qd 2,2 15,0

Qe 0,15 10,10

Remarquons que puisque les gains en cas d’entente sont supérieurs au gains sans entente, il s’agit d’un jeu de coordination.

Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies.





Les jeux répétés


Stratégies pures, stratégies mixtes

Exemple du jeu des tirs au but 2 joueurs : Gardien et buteur2 stratégies : tirer/plonger à

gauche/droiteHypothèse de « talent » des joueurs

Le buteur ne tire jamais à coté Le gardien intercepte toujours si du bon coté Ceci permet de simplifier !!

Quelle est la matrice des gains ?


Pour le buteur:D si le gardien choisit GG si le gardien choisit D

Matrice des gains

Gardien

G D

ButeurG 0,1 1,0

D 1,0 0,1

Pour le gardien:G si le buteur choisit GD si le buteur choisit D

Pas d’équilibre de Nash en stratégies pures !

Quel que soit le résultat, l’un des joueurs peut améliorer sa situation en changeant de stratégie.


Il existe cependant un équilibre en stratégies mixtes

Stratégie pour les 2 joueurs: oJouer G et D 50% du temps (1 fois sur deux) oChaque cas à une probabilité de 0.25oLe buteur marque un but sur deux, l’autre est arrêté par le gardien

Matrice des gains

Gardien

G D

ButeurG 0,1 1,0

D 1,0 0,1


Vérifions que cet équilibre est bien un équilibre de Nash: Le gardien joue G et D 50% du temps. Le buteur peut il

augmenter son taux de succès en déviant de la règle 50-50?

Si le buteur décide de jouer 60% à gauche et 40% à droite, son taux de succès est:

(0.6 ✕ 0.5) + (0.4 ✕ 0.5) = 0.5(0.3) + (0.2) = 0.5

En choisissant 60-40, le buteur marque plus à gauche mais moins à droite. Son taux de succès est le même, il ne peut donc pas améliorer sa situation. On a bien un équilibre de Nash





Les jeux répétés


Les jeux répétés

La nature et la stabilité de l’équilibre dépendent du fait que le jeu est répété ou non. L’existence d’équilibre en stratégies mixtes,

par exemple, repose sur une répétition du jeu. Même dans les cas de stratégie pure (par

exemple le dilemme du prisonnier), la stabilité est affectée par les répétitions du jeu.

Dépend de l’horizon temporel du jeu Jeu fini Jeu infini

Les jeux répétés

Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à l’infini On peut sanctionner le « tricheur » lors du jeu

suivant. On peut aussi mettre en place une menace

crédible pour dissuader le tricheur. Stratégie du donnant-donnant (Tit-for-tat) :

comportement mimétique (Axelrod)

Les jeux répétés

Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à horizon fini Le jeu s’arrête au bout the T périodes Raisonnement à rebours (backward induction) On part de la dernière période On détermine ce que l’on doit faire en T-1 en

fonction de T, etc. Pas de solution stable

Théorie des jeux : définitions

Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs

L’équilibre d’un jeu est un couple de décision convergente (pas nécessairement les mêmes)

Un équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation unilatéralement

Une stratégie mixte est une stratégie qui fait appel à des choix aléatoires ou probabilistes

Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies.

Un jeu à somme nulle est un jeu où les gains de l’un des joueurs représentent les pertes de l’autre.

La théorie des jeux

Documents