La théorie des jeux
Jan 09, 2016
La théorie des jeux
La théorie des jeux
Analyse des comportements stratégiques Utilisée en économie Relations internationales Jeux d’argent ou de société, etc.
Concurrence imparfaite Interactions stratégiquesEntreprises tiennent compte de la demandeProduction : fonction des autres entreprises
Le dilemme du prisonnier
Résolution d’un jeu
L’équilibre de Nash
L’équilibre en stratégie mixte
Les jeux répétés
La théorie des jeux
Le dilemme du prisonnier
Le dilemme du prisonnier définit une solution de jeux dans lesquels l’équilibre est sous-optimal
La solution optimale ne peut constituer l’équilibre du jeu issu de la rationalité des agents compte tenu des hypothèses de comportement et d’information.
Le dilemme du prisonnier démontre la difficulté à établir une coopération entre les agents alors que celles-ci auraient accru le bénéfice des agents.
Le jeu dans sa forme classiqueDeux suspects son arrêtés par la police,
mais la police manque de preuve pour les emprisonner.
Il ne peuvent les condamner qu’à un an de prison pour des faits mineurs.
La police doit les faire avouer.
Comment s’y prendre ?
Le dilemme du prisonnier
Les policiers proposent un marché Si les deux avouent, ils auront chacun 5 ans, si
l’un avoue et l’autre nie, ils encourent 1 ou 10 ans, si les deux nient, chacun aura 2 ans de prison
Matrice des gains2ème criminel
avoue nie
1er criminel
avoue (5;5) (1;10)
nie (10;1) (2;2)
Le dilemme du prisonnier
La solution du jeu est que le deux avouent
Chaque joueur poursuit son propre intérêt
S’agit-il d’un optimum social ? Contestation de la théorie économique « A beautiful mind »
Sans coopération, l’équilibre n’est pas optimal
Le dilemme du prisonnier
Illustration: duopole avec bien homogène
Deux entreprises sur un marché peuvent : Se faire concurrence (Cournot) S’entendre pour partager la rente (cartel) Profit de l’entente > profit de duopole.
Si l’entente n’est pas illégale, alors cette solution est optimale du point de vue des entreprises. Mais l’entreprise peut essayer de tricher et produire plus.
2 joueurs : 2 entreprises A et B Produisant le même bien
2 stratégies : Produire la quantité de duopole Produire la quantité d’entente
Etant donnés 2 joueurs et 2 stratégies, le marché peut se trouver dans 4 cas de figure différents.
Illustration: duopole avec bien homogène
Dans un cas d’entente respectée: Chaque entreprise gagne un profit d’entente Πe = 10
Dans un cas de concurrence de duopole : Chaque entreprise gagne un profit de duopole
moins élevé Πd = 2
En cas d’entente non respectée: L’entreprise produisant la quantité de duopole
capture des parts de marchés et gagne un profit de tricheur élevé, Πt = 15. L’autre entreprise est pénalisée et gagne un profit minimum, Πm = 0.
Illustration: duopole avec bien homogène
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Pour ent. A:Qd si ent B choisit Qd
Qd si ent B choisit Qe
Quel est la meilleure stratégie pour chaque entreprise?
Pour ent. B:Qd si ent A choisit Qd
Qd si ent A choisit Qe
Illustration: duopole avec bien homogène
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Remarquons que la stratégie dominante est de produire la quantité de duopole, quelle que soit la stratégie de l’autre joueur.
Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs.
Illustration: duopole avec bien homogène
Le dilemme du prisonnier
Résolution d’un jeu
L’équilibre de Nash
L’équilibre en stratégie mixte
Les jeux répétés
La théorie des jeux
Un jeu se résout comme suit
1. Identifier les décisions de A1. Meilleure décision de A, compte tenu de B12. Meilleure décision de A, compte tenu de B2, etc.
2. Identifier les décisions de B3. Meilleure décision de B, compte tenu de A14. Meilleure décision de B, compte tenu de A2, etc.
3. On caractérise la solution du jeu, si elle existe
Résolution d’un jeu
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Résolution d’un jeu (1)
1. Seules les décisions de A sont prises en compte
2. Seules les décisions de A sont retenues si B choisit Qd
3. On retient la décision qui génère le plus gros gain
*
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Résolution d’un jeu (2)
1. Seules les décisions de A sont prises en compte
2. Seules les décisions de A sont retenues si B choisit Qe
3. On retient la décision qui génère le plus gros gain
**
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Résolution d’un jeu (3)
1. Seules les décisions de B sont prises en compte
2. Seules les décisions de B sont retenues si A choisit Qd
3. On retient la décision qui génère le plus gros gain
** *
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Résolution d’un jeu (4)
1. Seules les décisions de B sont prises en compte
2. Seules les décisions de B sont retenues si A choisit Qe
3. On retient la décision qui génère le plus gros gain
** *
*
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe(0,15
)(10,10)
Résolution d’un jeu (5)
1. Un jeu a un équilibre quand il génère une convergence des décisions stratégiques
2. Le couple de stratégies (Qd;Qd) est la solution du jeu
** *
*
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple de l’aéronautique
1. Prenons le cas de de l’aéronautique, avec deux constructeurs : Airbus et Boeing.
2. Voici la matrice des profits de chacun des constructeurs quand ils entreprennent de produire (P) ou pas (NP)
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple (1)
1. Seules les décisions de Boeing sont prises en compte
2. Seules les décisions de Boeing sont retenues si Airbus choisit de produire
3. On retient la décision qui génère le plus gros gain
*
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple (2)
1. Seules les décisions de Boeing sont prises en compte
2. Seules les décisions de Boeing sont retenues si Airbus chosit de ne pas produire
3. On retient la décision qui génère le plus gros gain
*
*
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple (3)
1. Seules les décisions de Airbus sont prises en compte
2. Seules les décisions de Airbus sont retenues si Boeing choisit de produire
3. On retient la décision qui génère le plus gros gain
*
*
*
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple (4)
1. Seules les décisions de Airbus sont prises en compte
2. Seules les décisions de Airbus sont retenues si Boeing choisit de ne pas produire
3. On retient la décision qui génère le plus gros gain
*
*
*
*
Matrice des gains
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP(0,10
)(0,0)
Résolution d’un jeu - Exemple (5)
1. Ce jeu a deux équilibres (convergence des décisions stratégiques)
2. Le couple de stratégies (P;NP) est le premier équilibre du jeu
3. Le couple de stratégies (NP;P) est le deuxième équilibre du jeu.
*
*
*
*
Matrice des gains
Joueur 2
S1 S2
Joueur 1
S1 (0,10) (10,0)
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
*
*
*
*
Le dilemme du prisonnier
Résolution d’un jeu
L’équilibre de Nash
L’équilibre en stratégie mixte
Les jeux répétés
La théorie des jeux
L’Equilibre de Nash
L’équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation en changeant unilatéralement de stratégie, compte tenu des décisions de l’autre joueur
Propriétés centrales: Contribution de John Nash (1950)L’équilibre de Nash est généralement stableChaque jeu défini à au moins un équilibre de Nash:
soit en stratégies pures : les joueurs ne jouent qu'une seule stratégie à l’équilibre
soit en stratégies mixtes : les joueurs jouent plusieurs stratégies avec une probabilité fixe
Retour à l’exemple de Duopole:
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Un joueur peut-il seul améliorer sa position ?
L’entreprise A ?
L’entreprise B ?
Puisque qu’ où aucun joueur ne peut améliorer sa situation, il s’agit d’un équilibre de Nash
L’Equilibre de Nash
Efficacité de l’équilibre
Retour à l’exemple de Duopole:
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
La stratégie dominante est de produire « Qd »
Mais l’équilibre «Qd-Qd» n’est pas collectivement optimal au sens de Pareto
Si le nombre d’agents est restreint, la rationalité individuelle n’amène pas forcement au bien être collectif
Efficacité de l’équilibre
Retour à l’exemple de Duopole:
Matrice des gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Remarquons que puisque les gains en cas d’entente sont supérieurs au gains sans entente, il s’agit d’un jeu de coordination.
Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies.
Le dilemme du prisonnier
Résolution d’un jeu
L’équilibre de Nash
L’équilibre en stratégie mixte
Les jeux répétés
La théorie des jeux
Stratégies pures, stratégies mixtes
Exemple du jeu des tirs au but 2 joueurs : Gardien et buteur2 stratégies : tirer/plonger à
gauche/droiteHypothèse de « talent » des joueurs
Le buteur ne tire jamais à coté Le gardien intercepte toujours si du bon coté Ceci permet de simplifier !!
Quelle est la matrice des gains ?
Stratégies pures, stratégies mixtes
Pour le buteur:D si le gardien choisit GG si le gardien choisit D
Matrice des gains
Gardien
G D
ButeurG 0,1 1,0
D 1,0 0,1
Pour le gardien:G si le buteur choisit GD si le buteur choisit D
Pas d’équilibre de Nash en stratégies pures !
Quel que soit le résultat, l’un des joueurs peut améliorer sa situation en changeant de stratégie.
Stratégies pures, stratégies mixtes
Il existe cependant un équilibre en stratégies mixtes
Stratégie pour les 2 joueurs: oJouer G et D 50% du temps (1 fois sur deux) oChaque cas à une probabilité de 0.25oLe buteur marque un but sur deux, l’autre est arrêté par le gardien
Matrice des gains
Gardien
G D
ButeurG 0,1 1,0
D 1,0 0,1
Stratégies pures, stratégies mixtes
Vérifions que cet équilibre est bien un équilibre de Nash: Le gardien joue G et D 50% du temps. Le buteur peut il
augmenter son taux de succès en déviant de la règle 50-50?
Si le buteur décide de jouer 60% à gauche et 40% à droite, son taux de succès est:
(0.6 ✕ 0.5) + (0.4 ✕ 0.5) = 0.5(0.3) + (0.2) = 0.5
En choisissant 60-40, le buteur marque plus à gauche mais moins à droite. Son taux de succès est le même, il ne peut donc pas améliorer sa situation. On a bien un équilibre de Nash
Le dilemme du prisonnier
Résolution d’un jeu
L’équilibre de Nash
L’équilibre en stratégie mixte
Les jeux répétés
La théorie des jeux
Les jeux répétés
La nature et la stabilité de l’équilibre dépendent du fait que le jeu est répété ou non. L’existence d’équilibre en stratégies mixtes,
par exemple, repose sur une répétition du jeu. Même dans les cas de stratégie pure (par
exemple le dilemme du prisonnier), la stabilité est affectée par les répétitions du jeu.
Dépend de l’horizon temporel du jeu Jeu fini Jeu infini
Les jeux répétés
Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à l’infini On peut sanctionner le « tricheur » lors du jeu
suivant. On peut aussi mettre en place une menace
crédible pour dissuader le tricheur. Stratégie du donnant-donnant (Tit-for-tat) :
comportement mimétique (Axelrod)
Les jeux répétés
Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à horizon fini Le jeu s’arrête au bout the T périodes Raisonnement à rebours (backward induction) On part de la dernière période On détermine ce que l’on doit faire en T-1 en
fonction de T, etc. Pas de solution stable
Théorie des jeux : définitions
Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs
L’équilibre d’un jeu est un couple de décision convergente (pas nécessairement les mêmes)
Un équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation unilatéralement
Une stratégie mixte est une stratégie qui fait appel à des choix aléatoires ou probabilistes
Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies.
Un jeu à somme nulle est un jeu où les gains de l’un des joueurs représentent les pertes de l’autre.