8/13/2019 The Orie Des Jeux
1/162
Introduction la Thorie des JeuxSebastien Konieczny
CRIL-CNRS
Universite dArtois - Lens
Introductiona la Theorie des Jeux p.1/77
8/13/2019 The Orie Des Jeux
2/162
Thorie des Jeux
DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.
Introductiona la Theorie des Jeux p.2/77
8/13/2019 The Orie Des Jeux
3/162
Thorie des Jeux
DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.
groupe
interaction
stratgique
rationnels
Introductiona la Theorie des Jeux p.2/77
8/13/2019 The Orie Des Jeux
4/162
Thorie des Jeux
DfinitionLa theorie des jeux permet une analyse formelle des problemesposes par linteraction strategique dun groupe dagents rationnels pour-suivant des buts qui leur sont propres.
groupe
interaction
stratgique
rationnels
Normatif vs Descriptif
Introductiona la Theorie des Jeux p.2/77
8/13/2019 The Orie Des Jeux
5/162
A quoi sert la thorie des jeux ?
Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
Dois-je travailler ou faire semblant ? Est-ce que jcoute de la musique ce soir ?
Enchres, vote
Comportement animal
Stratgies militaires/conomiques
Partages de ressource (marchandage)
Est-ce quune entreprise doit exploiter ses salaris ?
Est-ce quune entreprise doit entrer sur un march ou pas ? Faut-il contrler les dclarations dimpots sur le revenu ?
...
Introductiona la Theorie des Jeux p.3/77
8/13/2019 The Orie Des Jeux
6/162
Un peu dhistoire...
Cournot (1838), Borel (1921)
Zermelo (1913) Von Neumann (1928)
Theory of Games and Economic Behaviour, Von Neumann etMorgenstern (1944)
Nash (1950) Selten (1965), Harsanyi (1967)
Introductiona la Theorie des Jeux p.4/77
8/13/2019 The Orie Des Jeux
7/162
Bibliographie
M. Yildizoglu. Introduction a la theorie des jeux. Dunod. 2003.
D. Kreps. Theorie des jeux et modelisationeconomique. Dunod. 1990. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.
P. K. Dutta. Strategies and Games. MIT Press. 1999.
D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.
J. Von Neumann, O. Morgenstern. Theory of Game and Economic Be-havior. Princeton University Press. 1944.
Introductiona la Theorie des Jeux p.5/77
8/13/2019 The Orie Des Jeux
8/162
Terminologie - Une petite taxonomie...
Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle
Jeux information complte / Jeux information incomplte Jeux information parfaite / Jeux information imparfaite
Jeux coopratifs / Jeux non-coopratifs
Jeux 2 joueurs / Jeux njoueurs
Introductiona la Theorie des Jeux p.6/77
8/13/2019 The Orie Des Jeux
9/162
Plan du cours
Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeusous forme extensive - Stratgie
Concepts de solution - Stratgies dominantes
Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgiesmixtes
Rsolution par chainage arrire - Menaces crdibles - Equilibresparfaits en sous-jeux
Jeux somme nulle
Jeux rpts - Dilemme itr du prisonnier
Jeux information incomplte
Jeux coopratifs - Marchandage
Introductiona la Theorie des Jeux p.7/77
8/13/2019 The Orie Des Jeux
10/162
Formalisation dun Jeu
Quest-ce quun jeu ?
Qui?Joueurs Quoi?Coups (actions/choix) - Stratgies
Quand?Droulement du jeu
Combien?Que rapporte chaque issue aux diffrents joueurs ?Autres informations importantes:
Information
Rptition
Introductiona la Theorie des Jeux p.8/77
8/13/2019 The Orie Des Jeux
11/162
Jeux sous forme stratgique - Exemple
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Introductiona la Theorie des Jeux p.9/77
8/13/2019 The Orie Des Jeux
12/162
Utilit
Une hypothse de base de la thorie des jeux est de considrer que lesagents sont rationnels, cest--dire quils tentent darriver la situation
lameilleurepour eux. On appelleUtilitela mesure de chaque situation aux yeux de lagent.
LUtilitenest ni une mesure du gain matriel, montaire, etc. mais unemesuresubjectivedu contentement de lagent.
Introductiona la Theorie des Jeux p.10/77
8/13/2019 The Orie Des Jeux
13/162
Utilit
Une hypothse de base de la thorie des jeux est de considrer que lesagents sont rationnels, cest--dire quils tentent darriver la situation
lameilleurepour eux. On appelleUtilitela mesure de chaque situation aux yeux de lagent.
LUtilitenest ni une mesure du gain matriel, montaire, etc. mais unemesuresubjectivedu contentement de lagent.
Utiliser une fonction dutilit pour dfinir les prfrences de lagent nesuppose pas que lagent utilise cette fonction, mais quil raisonne con-formment un ensemble de conditions de rationalit. Von Neuman etMorgenstern (1944), Savage (1954).
Introductiona la Theorie des Jeux p.10/77
8/13/2019 The Orie Des Jeux
14/162
Jeux sous forme stratgique
Un jeu sous forme stratgique est dfini par :
un ensembleN ={1, . . . , n}de joueurs pour chaque joueuriun ensemble de stratgiesSi ={s1, . . . , sni}
pour chaque joueur iune fonction de valuation i : S1 . . . Sn IR,qui chaque ensemble de stratgies associe les gains du joueuri.
Notations :
On noterasun profil de stratgies{s1, . . . , sn}oi si Si.
On notesile profilsdes stratgies autres que celles du joueur i:si ={s1, . . . , si1, si+1, . . . , sn}.
On noteSlespace des stratgies, ie : S=ni=1Si
Introductiona la Theorie des Jeux p.11/77
8/13/2019 The Orie Des Jeux
15/162
Jeux sous forme extensive - Exemple
1
2 2
(4,2) (3,1) (2,5) (9,0)
x y
s t u v
Introductiona la Theorie des Jeux p.12/77
8/13/2019 The Orie Des Jeux
16/162
Jeux sous forme extensive
Un jeu sous forme extensive est dfini par :
un ensembleN ={1, . . . , n}de joueurs un arbre fini compos de :
un ensemble de noeuds{A , B , C , . . .}reprsentant les coups
un ensemble de branches{x , y , z , . . .}reprsentant les alternatives
chaque coup une fonction de nommage qui indique chaque noeud quel est le
joueur qui doit jouer
une fonction de valuation qui associe chaque noeud terminal un
vecteur de nombres reprsentant les gains de chacun des joueurs une partition des noeuds en un ensemble densembles dinformations
reprsentant les croyances (imparfaites) des joueurs
Introductiona la Theorie des Jeux p.13/77
8/13/2019 The Orie Des Jeux
17/162
Jeux sous forme extensive - Ensemble dinformations
Joueur 1
A
Joueur 2B C
(4,2) (3,1) (2,5) (9,0)
x y
s t u v
Introductiona la Theorie des Jeux p.14/77
8/13/2019 The Orie Des Jeux
18/162
Jeux sous forme extensive - Ensemble dinformations
A
B C
(4,2) (3,1) (2,5) (9,0)
x y
s t u v
Introductiona la Theorie des Jeux p.14/77
8/13/2019 The Orie Des Jeux
19/162
Jeux sous forme extensive - Ensemble dinformations
A
B C
(4,2) (3,1) (2,5) (9,0)
x y
u vu v
Introductiona la Theorie des Jeux p.14/77
8/13/2019 The Orie Des Jeux
20/162
Jeux sous forme extensive - Ensemble dinformations
A
B C
(4,2) (3,1) (2,5) (9,0)
x y
u vu v
Ensembles dinformation : {A}et{B, C}
Coups simultans Incertitude (croyances)
Introductiona la Theorie des Jeux p.14/77
8/13/2019 The Orie Des Jeux
21/162
Relation entre formes stratgique et extensive
A chaque jeu sous forme extensive correspond un jeu sous formestratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
Introductiona la Theorie des Jeux p.15/77
8/13/2019 The Orie Des Jeux
22/162
Relation entre formes stratgique et extensive
A chaque jeu sous forme extensive correspond un jeu sous formestratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
Unestratgieest la spcification complte du comportement dunjoueur dans nimporte quelle situation (dans un jeu sous formeextensive cela signifie donc pour chaque ensemble dinformation ocest ce joueur de jouer).
Algorithme
Introductiona la Theorie des Jeux p.15/77
8/13/2019 The Orie Des Jeux
23/162
Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.
Introductiona la Theorie des Jeux p.16/77
8/13/2019 The Orie Des Jeux
24/162
Relation entre formes stratgique et extensive
Forme stratgique :
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Introductiona la Theorie des Jeux p.17/77
8/13/2019 The Orie Des Jeux
25/162
Relation entre formes stratgique et extensive
Forme stratgique :
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Forme extensive :
A
B C
(4,2) (3,1) (2,5) (9,0)
x y
u v u v
Introductiona la Theorie des Jeux p.18/77
8/13/2019 The Orie Des Jeux
26/162
Relation entre formes stratgique et extensive
Forme stratgique :
Joueur 2
Joueur 1s1 s2 s3 s4
x 4,2 4,2 3,1 3,1y 2,5 9,0 2,5 9,0
Forme extensive :
A
B C
(4,2) (3,1) (2,5) (9,0)
x y
u v u v
s1: u si x, u si y s2: u si x, v si y
s3: v si x, u si y s4: v si x, v si y
Introductiona la Theorie des Jeux p.19/77
8/13/2019 The Orie Des Jeux
27/162
Elimination de stratgies domines
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Introductiona la Theorie des Jeux p.20/77
8/13/2019 The Orie Des Jeux
28/162
Elimination de stratgies domines
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Introductiona la Theorie des Jeux p.20/77
8/13/2019 The Orie Des Jeux
29/162
Elimination de stratgies domines
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Introductiona la Theorie des Jeux p.20/77
8/13/2019 The Orie Des Jeux
30/162
Elimination de stratgies domines
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Une stratgiesiest (strictement) domine pour le joueur isi il existeune stratgiesi telle que pour tous les profilssi
i(si
, si)> i(si, si)
Introductiona la Theorie des Jeux p.20/77
8/13/2019 The Orie Des Jeux
31/162
Elimination de stratgies domines
Joueur 2
Joueur 1u v
x 4,2 3,1y 2,5 9,0
Une stratgiesiest faiblement domine pour le joueurisi il existe unestratgie si telle que pour tous les profils si
i(si
, si) i(si, si)
Introductiona la Theorie des Jeux p.20/77
8/13/2019 The Orie Des Jeux
32/162
Elimination de stratgies domines
Joueur 2
Joueur 1
u v wx 3,6 7,1 4,8y 5,1 8,2 6,1
z 6,0 6,2 3,2
Introductiona la Theorie des Jeux p.21/77
8/13/2019 The Orie Des Jeux
33/162
Elimination de stratgies domines
Joueur 2
Joueur 1
u v wx 3,6 7,1 4,8y 5,1 8,2 6,1
z 6,0 6,2 3,2
Introductiona la Theorie des Jeux p.21/77
8/13/2019 The Orie Des Jeux
34/162
Elimination de stratgies domines
Joueur 2
Joueur 1
u v wx 3,6 7,1 4,8y 5,1 8,2 6,1
z 6,0 6,2 3,2
Introductiona la Theorie des Jeux p.21/77
8/13/2019 The Orie Des Jeux
35/162
Elimination de stratgies domines
Joueur 2
Joueur 1
u v wx 3,6 7,1 4,8y 5,1 8,2 6,1
z 6,0 6,2 3,2
Introductiona la Theorie des Jeux p.21/77
8/13/2019 The Orie Des Jeux
36/162
Elimination de stratgies domines
Joueur 2
Joueur 1
u v wx 3,6 7,1 4,8y 5,1 8,2 6,1
z 6,0 6,2 3,3
Introductiona la Theorie des Jeux p.21/77
8/13/2019 The Orie Des Jeux
37/162
Elimination de stratgies domines
Un jeu est dit rsolvable par limination itrative des stratgiesdomines, si on obtient un unique profil en liminant successivement
des stratgies (strictement) domines. Les profils obtenus aprs limination itrative des stratgies
(strictement) domines (EISD) ne dpendent pas de lordre choisi pourllimination des stratgies.
Par contre, on peut obtenir des profils diffrents lorsque lon choisit desordres diffrents pour llimination itrative de stratgies faiblementdomines (EISfD).
Les rsultats obtenus par EISD sont donc plus robustes que ceux
obtenus par EISfD. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable
par EISD !
Introductiona la Theorie des Jeux p.22/77
8/13/2019 The Orie Des Jeux
38/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0
z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
39/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
40/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
41/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
42/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
43/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
44/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
45/162
Equilibre de Nash
Joueur 2
Joueur 1
u v wx 3,0 0,2 0,3y 2,0 1,1 2,0z 0,3 0,2 3,0
La notion dequilibre de Nashest une situation telle quaucun joueurna intrt dvier (seul) de la situation obtenue.
Un equilibre de Nashest un profil de stratgies s
={s
1, . . . , s
n}telque pour tout joueuri, pour toute stratgies Si:
i(s
1, s
i)i(s, si)
Introductiona la Theorie des Jeux p.23/77
8/13/2019 The Orie Des Jeux
46/162
Equilibre de Nash et fonction de meilleure rponse
La fonction de meilleure rponse du joueuriest la fonctionBiquiassocie chaque combinaison de stratgies des autres joueurs siles
stratgies du joueuriqui maximise son utilit:
Bi(si) ={siSit.q. i(si, si) i(s
i, si)pour touts
i Si}
Introductiona la Theorie des Jeux p.24/77
8/13/2019 The Orie Des Jeux
47/162
Equilibre de Nash et fonction de meilleure rponse
La fonction de meilleure rponse du joueuriest la fonctionBiquiassocie chaque combinaison de stratgies des autres joueurs siles
stratgies du joueuriqui maximise son utilit:
Bi(si) ={siSit.q. i(si, si) i(s
i, si)pour touts
i Si}
Un quilibre de Nash est un profils tel que la stratgie du joueur iestune meilleure rponse:
si Bi(s
i)pour touti N
Introductiona la Theorie des Jeux p.24/77
E ilib d N h P i
8/13/2019 The Orie Des Jeux
48/162
Equilibre de Nash: Proprits
Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
Introductiona la Theorie des Jeux p.25/77
E ilib d N h P it
8/13/2019 The Orie Des Jeux
49/162
Equilibre de Nash: Proprits
Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
Introductiona la Theorie des Jeux p.25/77
E ilib d N h P it
8/13/2019 The Orie Des Jeux
50/162
Equilibre de Nash: Proprits
Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
Introductiona la Theorie des Jeux p.25/77
E ilib d N h P it
8/13/2019 The Orie Des Jeux
51/162
Equilibre de Nash: Proprits
Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ? Deux quilibres de Nashs = (si , s
i)et s = (si , s
i)sontinterchangeablessi pour touti (si , s
i)et(s
i , s
i)sont aussi desquilibres de Nash.
Introductiona la Theorie des Jeux p.25/77
Eq ilibre de Nash: Proprits
8/13/2019 The Orie Des Jeux
52/162
Equilibre de Nash: Proprits
Un profil (unique) obtenu par limination itrative de stratgies(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ? Deux quilibres de Nashs = (si , s
i)et s = (si , s
i)sontinterchangeablessi pour touti (si , s
i)et(s
i , s
i)sont aussi desquilibres de Nash.
Deux quilibres de Nashs ets sontquivalentssi ils donnent la mmeutilit tous les joueurs, i.e. pour touti N i(s) =i(s).
Introductiona la Theorie des Jeux p.25/77
Critre de Pareto
8/13/2019 The Orie Des Jeux
53/162
Critre de Pareto
Joueur 2
Joueur 1u v
x 4,4 3,1y 2,3 7,5
Introductiona la Theorie des Jeux p.26/77
Critre de Pareto
8/13/2019 The Orie Des Jeux
54/162
Critre de Pareto
Joueur 2
Joueur 1u v
x 4,4 3,1y 2,3 7,5
Un profils domineun profils au sens de Paretosi il est au moins aussibon pour tous les joueurs et sisest strictement meilleur pour au moinslun dentre eux, i.e. pour tout si set si s
on a si si et il existe
sj set s
j s
tel quesj > s
j .
Introductiona la Theorie des Jeux p.26/77
Critre de Pareto
8/13/2019 The Orie Des Jeux
55/162
Critre de Pareto
Joueur 2
Joueur 1u v
x 4,4 3,1y 2,3 7,5
Un profils domineun profils au sens de Paretosi il est au moins aussibon pour tous les joueurs et sisest strictement meilleur pour au moinslun dentre eux, i.e. pour tout si set si s
on a si si et il existe
sj set s
j s
tel quesj > s
j .
Un profil s domine strictement un profil s au sens de Pareto si seststrictement meilleur pour tous les joueurs, i.e. pour tout si set si s
on asi > si.
Introductiona la Theorie des Jeux p.26/77
Critre de Pareto vs niveau de scurit
8/13/2019 The Orie Des Jeux
56/162
Critre de Pareto vs niveau de scurit
Joueur 2
Joueur 1u v
x 9,9 0,8y 8,0 7,7
Introductiona la Theorie des Jeux p.27/77
Critre de Pareto vs niveau de scurit
8/13/2019 The Orie Des Jeux
57/162
Critre de Pareto vs niveau de scurit
Joueur 2
Joueur 1u v
x 9,9 0,8y 8,0 7,7
On dfinit leniveau de securite dune strategiesipour le joueur icomme le gain minimum que peut apporter cette stratgie quel que soitle choix des autres joueurs, soit
minsi i(si, si)
On dfinit leniveau de securite dun joueuricomme le niveau de scu-rit maximal des stratgies dei.
Introductiona la Theorie des Jeux p.27/77
Points focaux
8/13/2019 The Orie Des Jeux
58/162
Points focaux
Le problme pos par la multiplicit dquilibres de Nash est unproblme de coordination.
Pour certains jeux, certains quilibres semblent plus vidents quedautres aux joueurs. Cela est du certaines conventions sociales. Cesquilibres de Nash obtenus partir de ces conventions sont appelspoints focaux.
Introductiona la Theorie des Jeux p.28/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
59/162
La guerre des sexes
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Introductiona la Theorie des Jeux p.29/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
60/162
La guerre des sexes
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Sur cet exemple le niveau de scurit des deux joueurs est 0.
Introductiona la Theorie des Jeux p.29/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
61/162
g
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Sur cet exemple le niveau de scurit des deux joueurs est 0.
Supposons que le joueur 1 joue alatoirementfetcavec uneprobabilit de1/2
1(, f) = 1/2 2 + 1/2 0 = 1
1(, c) = 1/2 0 + 1/2 1 = 1/2
Introductiona la Theorie des Jeux p.29/77
8/13/2019 The Orie Des Jeux
62/162
Stratgies pures - Stratgies mixtes
8/13/2019 The Orie Des Jeux
63/162
g p g
Les stratgies que nous avons dfinies et utilises pour le moment sontdesstrategies pures, cest--dire les options qui se prsentent aux
joueurs. Unestrategie mixteiest une distribution de probabilit sur
lensemble des stratgies pures.
Lensemble des stratgies mixtes dun joueur ise notei.
Lensemble des stratgies pures utilises (i.e. dont la probabilit nestpas nulle) par une stratgie mixte iest appel lesupportde lastratgie mixte.
Notonspi(sk)la probabilit associe skpari, lutilit dun profil de
stratgies mixtesest dfinie par :
i() =XsS
(nY
j=1
pj(sj))i(s)
Introductiona la Theorie des Jeux p.30/77
Stratgie
8/13/2019 The Orie Des Jeux
64/162
g
Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.
Introductiona la Theorie des Jeux p.31/77
Stratgie
8/13/2019 The Orie Des Jeux
65/162
g
Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.
Unestrategie mixtedu joueur iest une distribution de probabilits pidfinie sur lensemble des stratgies pures du joueur i. On note ilensemble des stratgies mixtes du joueur i et par i une stratgiemixte de ce joueur.
Introductiona la Theorie des Jeux p.31/77
Stratgie
8/13/2019 The Orie Des Jeux
66/162
Une strategie pure du joueur i est un plan daction qui prescrit uneaction de ce joueur pour chaque fois quil est susceptible de jouer. Onnote par Si lensemble des stratgies pures du joueur iet par si unestratgie pure de ce joueur.
Unestrategie mixtedu joueur iest une distribution de probabilits pidfinie sur lensemble des stratgies pures du joueur i. On note ilensemble des stratgies mixtes du joueur i et par i une stratgiemixte de ce joueur.
Une strategie localedu joueur ien un ensemble dinformation Aestune distribution de probabilits sur lensemble des actions disponiblesen cet ensemble dinformation. On noteiAlensemble des stratgieslocales du joueuripour lensemble dinformationAetiAune stratgie
locale de ce joueur en A. Unestrategie comportementaledu joueuriest un vecteur de strat-
gies locales de ce joueur, contenant une stratgie locale par ensembledinformation de ce joueur. On noteilensemble des stratgies com-
portementales du joueuri, etiune stratgie comportementale de cejoueur.
Introductiona la Theorie des Jeux p.31/77
Equilibres de Nash en stratgies mixtes
8/13/2019 The Orie Des Jeux
67/162
DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i
i(
i,
i)i(i,
i)
Introductiona la Theorie des Jeux p.32/77
Equilibres de Nash en stratgies mixtes
8/13/2019 The Orie Des Jeux
68/162
DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i
i(
i,
i)i(i,
i)
Thorme. est un quilibre de Nash si et seulement si pour tout iet toutsi Si
i(i, i) i(si, i)
Introductiona la Theorie des Jeux p.32/77
Equilibres de Nash en stratgies mixtes
8/13/2019 The Orie Des Jeux
69/162
DfinitionUn quilibre de Nash en stratgies mixtes est un profil de stratgiesmixtes tel que pour toutiet touti i
i(
i,
i)i(i,
i)
Thorme. est un quilibre de Nash si et seulement si pour tout iet toutsi Si
i(i, i) i(si, i)
Thorme.[Nash, 1950]Tout jeu sous forme strategique a un equilibre deNash en strategies mixtes.
Introductiona la Theorie des Jeux p.32/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
70/162
Joueur 2
Joueur 1
f c
f 2,1 0,0 xc 0,0 1,2 1 x
Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx
maximise-t-il son niveau de scurit ?
Introductiona la Theorie des Jeux p.33/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
71/162
Joueur 2
Joueur 1
f c
f 2,1 0,0 xc 0,0 1,2 1 x
Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx
maximise-t-il son niveau de scurit ?1(, f) = x 2 + (1 x) 0 = 2x
1(, c) = x 0 + (1 x) 1 = 1 x
Introductiona la Theorie des Jeux p.33/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
72/162
Joueur 2
Joueur 1
f c
f 2,1 0,0 xc 0,0 1,2 1 x
Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelx
maximise-t-il son niveau de scurit ?1(, f) = x 2 + (1 x) 0 = 2x
1(, c) = x 0 + (1 x) 1 = 1 x
maxx
min(2x, 1 x) = 1/3
Introductiona la Theorie des Jeux p.33/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
73/162
Joueur 2
Joueur 1
f c
f 2,1 0,0 xc 0,0 1,2 1 x
Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelxmaximise-t-il son niveau de scurit ?
1(, f) = x 2 + (1 x) 0 = 2x
1(, c) = x 0 + (1 x) 1 = 1 x
maxx
min(2x, 1 x) = 1/3
Le niveau de scurit du joueur 1 est donc de2/3.
Introductiona la Theorie des Jeux p.33/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
74/162
Joueur 2
Joueur 1
f c
f 2,1 0,0 xc 0,0 1,2 1 x
Soitxla probabilit avec laquelle le joueur 1 joue f, pour quelxmaximise-t-il son niveau de scurit ?
1(, f) = x 2 + (1 x) 0 = 2x
1(, c) = x 0 + (1 x) 1 = 1 x
maxx
min(2x, 1 x) = 1/3
Le niveau de scurit du joueur 1 est donc de2/3.
Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cettestratgie ?Introductiona la Theorie des Jeux p.33/77
Reprsentation graphique du jeu
8/13/2019 The Orie Des Jeux
75/162
0
1
2
1/3 2/3 1
1
x
2x
Introductiona la Theorie des Jeux p.34/77
Reprsentation graphique du jeu
8/13/2019 The Orie Des Jeux
76/162
0
1
2
1/3 2/3 1
1
x
1 x
Introductiona la Theorie des Jeux p.34/77
Reprsentation graphique du jeu
8/13/2019 The Orie Des Jeux
77/162
0
1
2
1/3 2/3 1
1
x
2x
1 x
Introductiona la Theorie des Jeux p.34/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
78/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
Introductiona la Theorie des Jeux p.35/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
79/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?1(f, ) = y 2 + (1 y) 0 = 2y1(c, ) = y 0 + (1 y) 1 = 1 y
Introductiona la Theorie des Jeux p.35/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
80/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?1(f, ) = y 2 + (1 y) 0 = 2y1(c, ) = y 0 + (1 y) 1 = 1 y
Donc:
Si2y >1 y(y >1/3), la meilleure rponse du joueur 1 est de jouer f Si2y
8/13/2019 The Orie Des Jeux
81/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0 xc 0,0 1,2 1 x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
Introductiona la Theorie des Jeux p.36/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
82/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0 xc 0,0 1,2 1 x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?2(, f) = x 1 + (1 x) 0 = x
2(, c) = x 0 + (1 x) 2 = 2(1 x)
Introductiona la Theorie des Jeux p.36/77
8/13/2019 The Orie Des Jeux
83/162
La guerre des sexes
8/13/2019 The Orie Des Jeux
84/162
Joueur 2
Joueur 1
y 1 y
f cf 2,1 0,0 xc 0,0 1,2 1 x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1() = x y 2 +x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
= 3xy x y+ 1
2() = x y 1 +x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
= 3xy 2x 2y+ 2
Introductiona la Theorie des Jeux p.37/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
85/162
Joueur 2
Joueur 1
1/3 2/3
f cf 2,1 0,0 2/3c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1() = 3xy x y+ 12() = 3xy 2x 2y+ 2
Le profil = (, )est donc un quili-bre de Nash en stratgie mixte.
Introductiona la Theorie des Jeux p.37/77
La guerre des sexes
8/13/2019 The Orie Des Jeux
86/162
Joueur 2
Joueur 1
1/3 2/3
f cf 2,1 0,0 2/3c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1() = 3xy x y+ 12() = 3xy 2x 2y+ 2
Le profil = (, )est donc un quili-bre de Nash en stratgie mixte.
Les gains des deux joueurs avec
sont :1() = 3.2/3.1/3 2/3 1/3 + 1= 2/3
2() = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3
Introductiona la Theorie des Jeux p.37/77
Reprsentation graphique du jeu
8/13/2019 The Orie Des Jeux
87/162
1/3 2/3 1
1/3
2/3
1
0
y
x
joueur1
Introductiona la Theorie des Jeux p.38/77
Reprsentation graphique du jeu
8/13/2019 The Orie Des Jeux
88/162
1/3 2/3 1
1/3
2/3
1
0
y
x
joueur1
joueur2
Introductiona la Theorie des Jeux p.38/77
Reprsentation graphique du jeuy
8/13/2019 The Orie Des Jeux
89/162
1/3 2/3 1
1/3
2/3
1
0x
joueur1
joueur2
Introductiona la Theorie des Jeux p.38/77
Coopration - Itration - Corrlation
8/13/2019 The Orie Des Jeux
90/162
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?
Introductiona la Theorie des Jeux p.39/77
Coopration - Itration - Corrlation
8/13/2019 The Orie Des Jeux
91/162
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2
Introductiona la Theorie des Jeux p.39/77
Coopration - Itration - Corrlation
8/13/2019 The Orie Des Jeux
92/162
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur desquilibres corrls Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
Introductiona la Theorie des Jeux p.39/77
Coopration - Itration - Corrlation
8/13/2019 The Orie Des Jeux
93/162
Joueur 2
Joueur 1f c
f 2,1 0,0c 0,0 1,2
Que se passe-t-il si les 2 joueurs peuvent communiquer avant dejouer ?1 =2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur desquilibres corrls Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
Que se passe-t-il si la partie est joue plusieurs fois ?
Introductiona la Theorie des Jeux p.39/77
Itration: Le dilemme des prisonniers...
8/13/2019 The Orie Des Jeux
94/162
Deux personnes arrtes ensemble en possession darmes feu sontsouponns dun dlit fait en commun. Les policiers les sparent et disent chacun :
Si un des deux avoue et que lautre navoue rien, le premier est libr,et le second emprisonn (5 ans);
Si les deux avouent, les deux iront en prison (4 ans);
Si aucun des deux navoue, les deux seront seront librs assez vite (2ans).
Vous tes un des deux prisonniers, que faites-vous ?
Introductiona la Theorie des Jeux p.40/77
[DIP] Le dilemme des prisonniers
8/13/2019 The Orie Des Jeux
95/162
Joueur 2
Joueur 1C D
C 3,3 0,5D 5,0 1,1
Introductiona la Theorie des Jeux p.41/77
[DIP] Le dilemme itr...
8/13/2019 The Orie Des Jeux
96/162
Vous navez pas vraiment les mmes gots que votre voisin en matire demusique. Il lui arrive souvent dcouter sa musique fond. De mme ilvous arrive (en reprsailles) de mettre votre musique un volume plus queraisonnable. Ce qui a pour consquences que le lendemain il recommence nouveau. En dehors de ces priodes agites, vous apprciez les priodes oaucun de vous ne gne lautre.Supposons que lon pondre votre satisfaction :
Vous avez une satisfaction de 5 couter votre musique un volumeimportant.
La satisfaction est de 0lorsque votre voisin met sa musique fond.
Une soire calme, sans musique vous apporte une satisfaction de 3.
Le fait dcouter simultanment votre musique mle celle du voisin,donne une satisfaction de 1.
Vous savez ce que votre voisin a eu comme comportement les joursprcdents, que faites-vous aujourdhui?Introductiona la Theorie des Jeux p.42/77
[DIP] Le dilemme . . .
8/13/2019 The Orie Des Jeux
97/162
Introduction par FLOODet DRESHER la RAND Corp. en 1952
Jeu somme non-nulle
2 joueurs jouent simultanment 2 choix de jeux :
COOPERER, i.e. tre gentil, on notera C TRAHIR, i.e. tre mchant, on notera D
Les gains des joueurs, notsS,P,Ret T, sont fonction de leur choixde jeu avec :
S < P < R < T(0)
Introductiona la Theorie des Jeux p.43/77
[DIP] Le dilemme itr . . .
8/13/2019 The Orie Des Jeux
98/162
Les joueurs se rencontrent plusieurs fois
chaque itration les joueurs ont connaissance des coups prcdents
Ils ne connaissent pas le terme du jeu Le gain dun joueur est le cumul de ses gains dans chaque rencontre
Pour favoriser la coopration on ajoute la contrainte :
S+T
8/13/2019 The Orie Des Jeux
99/162
Dilemme... S < P < R < T
...itr S+T
8/13/2019 The Orie Des Jeux
100/162
Deux pays doivent-ils lever des taxes douanires sur les produitsimports de lautre pays.
Deux entreprises concurrentes doivent-elles essayer de sentendrepour se partag un march ou se faire concurrence ?
Deux espces vivant sur un mme territoire doivent-elles cohabiter ouse disputer la nourriture disponible ?
Introductiona la Theorie des Jeux p.46/77
[DIP] Les stratgies
8/13/2019 The Orie Des Jeux
101/162
Quelques exemples :
gentille
mchante
per_CCD
rancunire
lunatique
majoritaire_gentille
majoritaire_mchante
donnant_donnant
Introductiona la Theorie des Jeux p.47/77
8/13/2019 The Orie Des Jeux
102/162
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
103/162
qui batte toutes les autres :
Introductiona la Theorie des Jeux p.49/77
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
104/162
qui batte toutes les autres :mchante, car gnralisation du dilemme non itr
Introductiona la Theorie des Jeux p.49/77
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
105/162
qui batte toutes les autres :mchante, car gnralisation du dilemme non itr
qui fasse le meilleur score possible face toutes les autres :
Introductiona la Theorie des Jeux p.49/77
8/13/2019 The Orie Des Jeux
106/162
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
107/162
qui batte toutes les autres :mchante, car gnralisation du dilemme non itr
qui fasse le meilleur score possible face toutes les autres :aucune, car meilleure contre mchanteet contre rancunireest impossible
Problme de dfinition du critre dvaluation des stratgies
Introductiona la Theorie des Jeux p.49/77
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
108/162
Sur des confrontations de 100 parties :
Le gain maximal est de 500 points
Le gain minimal est de 0 pointCest ce quobtiennent MCHANTEet GENTILLElune contre lautre.
Introductiona la Theorie des Jeux p.50/77
[DIP] Quelle est la meilleurestratgie ?
8/13/2019 The Orie Des Jeux
109/162
Sur des confrontations de 100 parties :
Le gain maximal est de 500 points
Le gain minimal est de 0 pointCest ce quobtiennent MCHANTEet GENTILLElune contre lautre.Mais...
2 gentilles entre elles obtiennent chacune 300 points
2 mchantes entre elles obtiennent chacune 100 points
Chaque stratgie est bonne (au sens du meilleur score) face certaineset mauvaises face dautres car elle ne sait pas qui elle a affaire.
Introductiona la Theorie des Jeux p.50/77
[DIP] Les tournois
8/13/2019 The Orie Des Jeux
110/162
Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif
Le gain dune stratgie est le cumul de ses scores face chaqueadversaire
Toutes les parties ont la mme longueur (mme nombre ditrations),mais les stratgies ne la connaissent pas et ne peuvent pas le savoir
Introductiona la Theorie des Jeux p.51/77
[DIP] Exemples (tournoi)
8/13/2019 The Orie Des Jeux
111/162
gentille mchante per_CCD rancunire
gentille 30 50 36 30
mchante 0 10 3 9per_CCD 21 38 24 33
rancunire 30 14 13 30
Score 81 112 76 102
Classement
8>>>>>:
1 mchante2 rancunire
3 gentille4 per_CCD
Introductiona la Theorie des Jeux p.52/77
8/13/2019 The Orie Des Jeux
112/162
[DIP] Un tournoi
gentille rancunire majoritaire mchante
8/13/2019 The Orie Des Jeux
113/162
gentille
mchante
lunatique donnant_donnant
rancunire
per_DDC
per_CCD majoritaire_gentille
majoritaire_mchante
mfiante
sondeur donnant_donnant_dur
Scores :
donnant_donnant : 42
majoritaire_gentille : 19rancunire : 4sondeur : 1lunatique : 0
mchante : 0
Introductiona la Theorie des Jeux p.54/77
8/13/2019 The Orie Des Jeux
114/162
[DIP] donnant-donnant : une bonne stratgie
Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au
8/13/2019 The Orie Des Jeux
115/162
Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
donnant-donnant ne gagne jamais contre personne !
Introductiona la Theorie des Jeux p.55/77
[DIP] donnant-donnant : une bonne stratgie
Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au
8/13/2019 The Orie Des Jeux
116/162
Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.
Introductiona la Theorie des Jeux p.55/77
[DIP] donnant-donnant : une bonne stratgie
Au premier coup je coopre (C) ensuite si mon adversaire a coopr (C) au
8/13/2019 The Orie Des Jeux
117/162
Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) aucoup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.
Mais, au pire elle ne perd que 5 points quel que soit ladversaire et lalongueur de la partie !
Introductiona la Theorie des Jeux p.55/77
[DIP] volution cologique
Simulation de lvolution naturelle :
8/13/2019 The Orie Des Jeux
118/162
Simulation de l volution naturelle :
Chaque stratgie est reprsente par une population deNentits On effectue un tournoi entre toutes les entits
Les entits de faibles stratgies (au sens du classement dans letournoi) sont dfavorises, celles stratgie forte sont favorises
La favorisation est ralise par une redistribution proportionnelle de lapopulation
Ce cycle est rpt jusqu stabilisation de la population
Introductiona la Theorie des Jeux p.56/77
[DIP] Exemples (volution)
400
8/13/2019 The Orie Des Jeux
119/162
0
50
100
150
200
250
300
350
0 2 4 6 8 10 12 14 16 18 20
spitefulall_call_d
per_ccd
Introductiona la Theorie des Jeux p.57/77
[DIP] Une morale trs morale...
Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
8/13/2019 The Orie Des Jeux
120/162
C s q a p s a g ( ) [ , ]
Gentillesse
Ractivit Pardon
Simplicit
Introductiona la Theorie des Jeux p.58/77
[DIP] Une morale trs morale...
Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
8/13/2019 The Orie Des Jeux
121/162
q p g ( ) [ , ]
Gentillesse
Ractivit Pardon
Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )
Introductiona la Theorie des Jeux p.58/77
[DIP] Une morale trs morale...
Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
8/13/2019 The Orie Des Jeux
122/162
q p g ( ) [ ]
Gentillesse
Ractivit Pardon
Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )Pour plus de dtails sur le dilemme itr des prisonniers :
http://www.lifl.fr/IPD
Introductiona la Theorie des Jeux p.58/77
8/13/2019 The Orie Des Jeux
123/162
Jeux rpts
Soit un jeuG={S, {i}i=1,...,n}, oSest lensemble (fini) des profils
8/13/2019 The Orie Des Jeux
124/162
de stratgies etiest la fonction dutilit du joueur i.
On note(G, T)le jeu rpt obtenu en jouant Tfois le jeu de base G.
Lorsque le jeu est rpt un nombre infini de fois, on note(G, )le jeucorrespondant.
On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 qque le jeusarrte.
Introductiona la Theorie des Jeux p.59/77
Jeux rpts
Soit un jeuG={S, {i}i=1,...,n}, oSest lensemble (fini) des profils
8/13/2019 The Orie Des Jeux
125/162
de stratgies etiest la fonction dutilit du joueur i.
On note(G, T)le jeu rpt obtenu en jouant Tfois le jeu de base G.
Lorsque le jeu est rpt un nombre infini de fois, on note(G, )le jeucorrespondant.
On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 qque le jeusarrte.
Facteur dactualisation : Lorsquun jeu est rpt, il se peut que lesgains obtenus litration courantetsoient plus/moins importants auxyeux de lagent que les gains litration suivante t+1. Pour modlisercela on peut utiliser un facteur dactualisation.
t =t+1
Le facteur dactualisation=t/t+1reprsente donc lattrait du joueurpour les gains actuels. Introduction a la Theorie des Jeux p.59/77
8/13/2019 The Orie Des Jeux
126/162
8/13/2019 The Orie Des Jeux
127/162
Jeux rpts: Thorme Folk
Lutilit dun joueur dans un jeu rpt est donc:
8/13/2019 The Orie Des Jeux
128/162
i(G, T) = Tt=0
ti(t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T
Siti(t) =, alorsi(G, ) = 11
Introductiona la Theorie des Jeux p.60/77
Jeux rpts: Thorme Folk
Lutilit dun joueur dans un jeu rpt est donc:
8/13/2019 The Orie Des Jeux
129/162
i(G, T) = Tt=0
ti(t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T
Siti(t) =, alorsi(G, ) = 11
Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.
Introductiona la Theorie des Jeux p.60/77
Jeux rpts: Thorme Folk
Lutilit dun joueur dans un jeu rpt est donc:
8/13/2019 The Orie Des Jeux
130/162
i(G, T) = Tt=0
ti(t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T
Siti(t) =, alorsi(G, ) = 11
Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.
Lquilibre de Nash en question est un quilibre de Nash parfait ensous-jeux (voir plus loin). Notion de menace crdible.
Introductiona la Theorie des Jeux p.60/77
Jeux rpts: Thorme Folk
Lutilit dun joueur dans un jeu rpt est donc:
8/13/2019 The Orie Des Jeux
131/162
i(G, T) = Tt=0
ti(t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeude base, on utilise la moyenne des gains du joueur: i(G, T)/T
Siti(t) =, alorsi(G, ) = 11
Thorme Folk: Soit un jeu rpt(G, )avec un facteurdactualisationsuffisamment proche de 1 et = (1, . . . , 2)unvecteur de gains ralisable de ce jeu, alors il existe un quilibre deNash du jeu rpt qui donnecomme vecteur de gains.
Lquilibre de Nash en question est un quilibre de Nash parfait ensous-jeux (voir plus loin). Notion de menace crdible.
Ce rsultat signifie que lensemble des quilibres de Nash dun jeurpt est immense: quasiment toute squence (finie) de jeu correspond un quilibre de Nash.
Introductiona la Theorie des Jeux p.60/77
Jeux deux joueurs Somme nulle
Rle central le plus simple
8/13/2019 The Orie Des Jeux
132/162
le plus simple pas de notion de majorit pas de coalition
Introductiona la Theorie des Jeux p.61/77
8/13/2019 The Orie Des Jeux
133/162
Jeux deux joueurs Somme nulle
Rle central le plus simple
8/13/2019 The Orie Des Jeux
134/162
le plus simple pas de notion de majorit pas de coalition
Strictement Comptitif Les joueurs ont des prfrences strictement opposes
Pour tout profil de stratgiess, on a1(s) +2(s) = 0
Introductiona la Theorie des Jeux p.61/77
Jeux deux joueurs Somme nulle
Rle central le plus simple
8/13/2019 The Orie Des Jeux
135/162
le plus simple pas de notion de majorit pas de coalition
Strictement Comptitif Les joueurs ont des prfrences strictement opposes
Pour tout profil de stratgiess, on a1
(s) +2
(s) = 0 Exemples :
Jeux de plateau (echecs, dames,. . .) Guerre
. . .
Introductiona la Theorie des Jeux p.61/77
8/13/2019 The Orie Des Jeux
136/162
Jeux deux joueurs somme nulle - Exemple
Joueur 2
8/13/2019 The Orie Des Jeux
137/162
Joueur 1
y1 y2 y3 y4
x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5
x4 9 3 0 20
Introductiona la Theorie des Jeux p.62/77
Jeux deux joueurs somme nulle - Exemple
Joueur 2
8/13/2019 The Orie Des Jeux
138/162
Joueur 1
y1 y2 y3 y4
x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5
x4 9 3 0 20 Le joueur 1 tente de maximiser son niveau de scurit
vx = maxi(minj(xi, yj))
Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj(maxi(xi, yj))
Introductiona la Theorie des Jeux p.62/77
Jeux deux joueurs somme nulle - Exemple
Joueur 2
8/13/2019 The Orie Des Jeux
139/162
Joueur 1
y1 y2 y3 y4
x1 18 3 0 2x2 0 3 8 20x3 5 4 5 5
x4 9 3 0 20 Le joueur 1 tente de maximiser son niveau de scurit
vx = maxi(minj(xi, yj))
Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj(maxi(xi, yj))
Si vx = vy = v, alors tout couple de stratgies (xi, yi), xi garantissantv au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de
Nash et sont des stratgies respectivement maximin et minimax pourles joueurs 1 et 2. Introduction a la Theorie des Jeux p.62/77
Jeux sous forme extensive
13
1
2
3 (3,2,9)z
w x x w
8/13/2019 The Orie Des Jeux
140/162
(3,2,9)
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
(4,2,4) (2,3,1)
x y u y y u
w u
Introductiona la Theorie des Jeux p.63/77
Jeux sous forme extensive
13
1
2
3 (3,2,9)z
w x x w
8/13/2019 The Orie Des Jeux
141/162
( , , )
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
(4,2,4) (2,3,1)
x y u y y u
w u
Rcurrence rebours (backward induction)
On commence par chercher les choix optimaux la dernirepriode (noeuds terminaux).
On remonte larbre de noeud en noeud, en cherchant chaquenoeud le choix optimal, une fois quon a pris en compte les choix
optimaux pour chaque noeud fils.Introductiona la Theorie des Jeux p.63/77
Jeux sous forme extensive
Tout jeu (fini) sous forme extensive a information parfaite a un
equilibre de Nash en strategies pures (equilibre obtenable par
` b ) (Z l (1953) K h (1953))
8/13/2019 The Orie Des Jeux
142/162
recurrence a rebours).(Zermelo (1953), Kuhn (1953))
Introductiona la Theorie des Jeux p.64/77
Forme extensive - Sous-jeu
1
8/13/2019 The Orie Des Jeux
143/162
(2,2)2
(3,1)1
(2,-2) (-2,2) (-2,2) (2,-2)
x y
u v
r s2
w zw
z
Introductiona la Theorie des Jeux p.65/77
Forme extensive - Sous-jeu
1
8/13/2019 The Orie Des Jeux
144/162
(2,2)2
(3,1)1
(0,0)
x y
u v
Introductiona la Theorie des Jeux p.65/77
Forme extensive - Sous-jeu
1
8/13/2019 The Orie Des Jeux
145/162
(2,2)2
(3,1)1
(0,0)
x y
u v
Un sous-jeudun jeu sous forme extensive est un jeu compos dun noeud(qui est un ensemble dinformation singleton), de tous les noeuds successeursde ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes tous les noeuds terminaux successeurs.
Introductiona la Theorie des Jeux p.65/77
8/13/2019 The Orie Des Jeux
146/162
Forme extensive - Menaces non crdibles
1 Joueur 2
8/13/2019 The Orie Des Jeux
147/162
(2,2)2
(3,1) (0,0)
x y
u v Joueur 1u v
x 2,2 2,2y 3,1 0,0
lquilibre de Nash xv nest pas crdible car il repose sur la menacenon-crdible du joueur 2 de jouerv.
Introductiona la Theorie des Jeux p.66/77
Equilibre parfait en sous-jeux
Un quilibre de Nash dun jeu sous forme extensive est un equilibreparfait en sous-jeuxsi toute restriction du profil de stratgies un sous-jeu est un quilibre de Nash pour ce sous-jeu
8/13/2019 The Orie Des Jeux
148/162
jeu est un quilibre de Nash pour ce sous jeu.
Introductiona la Theorie des Jeux p.67/77
Equilibre parfait en sous-jeux
Un quilibre de Nash dun jeu sous forme extensive est un equilibreparfait en sous-jeuxsi toute restriction du profil de stratgies un sous-jeu est un quilibre de Nash pour ce sous-jeu
8/13/2019 The Orie Des Jeux
149/162
jeu est un quilibre de Nash pour ce sous jeu.
Pour les jeux informations parfaites, la notion dquilibre parfait ensous-jeux concide avec la notion de rcurrence rebours.
Introductiona la Theorie des Jeux p.67/77
Promesse non crdible
(2,-1)1
Exploiter 2
8/13/2019 The Orie Des Jeux
150/162
1
(1,1)2
(0,0)
Daccord pour travailler
Pas daccord pour travailler
Ne pas exploiter 2
Introductiona la Theorie des Jeux p.68/77
Promesse non crdible
(2,-1)1
Exploiter 2
8/13/2019 The Orie Des Jeux
151/162
1
(1,1)2
(0,0)
Daccord pour travailler
Pas daccord pour travailler
Ne pas exploiter 2
Rputation
Introductiona la Theorie des Jeux p.68/77
Le mille-pattes - Limites de la rcurrence rebours
1 2 1 1 2 1 2(100 100)
8/13/2019 The Orie Des Jeux
152/162
. . . (100,100)
(1,1) (0,3) (2,2) (98,98) (97,100) (99,99) (98,101)
RD rd RD RD rd RD rd
Introductiona la Theorie des Jeux p.69/77
Limites de la rcurrence rebours
Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
8/13/2019 The Orie Des Jeux
153/162
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
Introductiona la Theorie des Jeux p.70/77
Limites de la rcurrence rebours
Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
8/13/2019 The Orie Des Jeux
154/162
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
Ecrire ce jeu sous forme extensive en ne considrant que les partages(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.
Introductiona la Theorie des Jeux p.70/77
Jeux coopratifs 2 joueurs
Dans les jeux coopratifs on autorise la communication et les accordsentre joueurs avant la partie.
Tous les messages formuls par un joueur sont transmis sans
8/13/2019 The Orie Des Jeux
155/162
g p j
modification lautre joueur. Tous les accords entre joueurs seront respects. Lvaluation des situations par un joueur nest pas perturbe par les
ngociations prliminaires.
Guerre des sexes
Introductiona la Theorie des Jeux p.71/77
Jeu de marchandage - Ensemble de ngociation
L ensemble de negociation dun jeu de marchandage est lensemble desissues :
ralisables
8/13/2019 The Orie Des Jeux
156/162
appartenant lespace de marchandage efficientes
telles quaucune autre issue ne donne plus un joueur et autant lautre (non pareto-domine)
individuellement rationnelles chaque joueur gagne au moins autant que le gain quil est sur
dobtenir si il ny a pas daccord.
Introductiona la Theorie des Jeux p.72/77
Jeu de Marchandage - Solution de Nash
Invariance a lechelle dutiliteSi[R1, (u1, v
1)]et[R2, (u
2, v
2)]sont deux versions du mme jeu demarchandage, ie si ils ne diffrent que sur les units et lorigine desf ti d tilit l l d l ti F ([R ( )]) t
8/13/2019 The Orie Des Jeux
157/162
fonctions dutilits, alors les deux solutionsF([R1, (u1
, v1
)])etF([R2, (u
2, v
2)])doivent tre les mmes au changement dchelle prs.
Pareto optimaliteLa solution du jeu de marchandage(u0, v0)doit satisfaire les propritssuivantes :
u0u etv0 v
(u0, v0)est un point deR
il ny a pas de (u, v)dansR(diffrent de(u0, v0)) tel queu u0etvv0.
Introductiona la Theorie des Jeux p.73/77
Jeu de Marchandage - Solution de Nash
Independance des alternatives non disponiblesSoient deux jeux de marchandage avec le mme point de status quo ettels que les issues du premier sont incluses dans les issues du second.
8/13/2019 The Orie Des Jeux
158/162
Si la solution du second jeu est ralisable dans le premier jeu, alors cedoit tre aussi la solution du premier jeu : SiR1R2etF([R2, (u, v)])R1, alors
F([R1, (u, v)]) =F([R2, (u
, v)])
SymetrieSi un jeu de marchandage a les proprits suivantes : u =v
(u, v)Rimplique(v, u) R
(u0, v0) =F([R, (u
, v
)])Alors
u0 =v0
Introductiona la Theorie des Jeux p.74/77
Jeu de Marchandage - Solution de Nash
Soit un jeu de marchandage[R, (u, v)], procdons comme suit :
Changeons lorigine des utilits des joueurs pour que le point(u, v)soit transform en (0 0) Soit [R (0 0)] le jeu correspondant
8/13/2019 The Orie Des Jeux
159/162
soit transform en(0, 0). Soit[R , (0, 0)]le jeu correspondant.
Dans R trouver (lunique) point (u0, v
0)(u
0 > 0et v
0 > 0) tel que u
0v
0
est le maximum de tous les produits uv avec (u, v)dans R (u > 0 etv >0).
Le point (u0, v0) est la solution de Nash du jeu [R, (0, 0)]. La solution deNash de[R, (u, v)]est obtenu en inversant la transformation dutilit.
Introductiona la Theorie des Jeux p.75/77
Jeu de Marchandage - Solution de Nash
Soit un jeu de marchandage[R, (u, v)], procdons comme suit :
Changeons lorigine des utilits des joueurs pour que le point(u, v)soit transform en (0 0) Soit [R (0 0)] le jeu correspondant
8/13/2019 The Orie Des Jeux
160/162
soit transform en(0, 0). Soit[R , (0, 0)]le jeu correspondant.
Dans R trouver (lunique) point (u0, v
0)(u
0 > 0et v
0 > 0) tel que u
0v
0
est le maximum de tous les produits uv avec (u, v)dans R (u > 0 etv >0).
Le point (u0, v0) est la solution de Nash du jeu [R, (0, 0)]. La solution deNash de[R, (u, v)]est obtenu en inversant la transformation dutilit.
Thorme. Lunique solution qui verifie les 4 proprietes desirees est la
solution de Nash.(Nash (1950))
Introductiona la Theorie des Jeux p.75/77
Jeux contre la nature
Si on considre un jeu deux joueurs dont un des deux joueurs est lanature, on fait de la dcision dans le risque ou dans lincertain.
En ce sens la thorie de la dcision peut tre vue comme un cas partic-
8/13/2019 The Orie Des Jeux
161/162
ulier de la thorie des jeux.
Introductiona la Theorie des Jeux p.76/77
Conclusion
Jeux coopratifs
Jeux information incomplte
Rationalit limite
8/13/2019 The Orie Des Jeux
162/162
Introductiona la Theorie des Jeux p.77/77