Jtkelmlet1(elektronikus jegyzet)
Forg Ferenc Pintr Mikls Simonovits Andrs Solymosi Tams 2005
1 Ez a munka az OTKA T046194 plyzat tmogatsval kszlt.
2
ElszNagyon sok j jtkelmlet knyv van a vilgban nyomtatott s elektronikus formban is. Mindegyik valamilyen jl krlhatrolt olvastbort, ltalban egyetemi hallgatsgot, cloz meg. Ennek a knyvnek a megrst is elssorban az sztnzte, hogy a Budapesti Corvinus Egyetemen nemrgen egy j szak, a gazdasgmatematika szak indult. A szak hallgati szmra a Jtkelmlet ktelez trgy. Termszetesen ki lehetett volna vlasztani egy knyvet, amelyik elg jl lefedi azokat a tmakrket, amelyeket fontosnak tartunk s mell kiegsztsknt egyb irodalmat adni. Mi inkbb azt vlasztottuk, hogy mi magunk vgezzk el ezt a vlogatst a klnbz forrsokbl, s formljuk egysges knyvv. A jtkelmlet oktatsnak hagyomnyai vannak a Corvinus Egyetemen illetve eldjn a Budapesti Kzgazdasgtudomnyi Egyetemen. A Gazdasgelmleti szakirnyosoknak ktelez, msoknak vlaszthat trgy volt a negyedik s tdik vben. Ennek a kurzusnak az anyaga elg jl kikristlyosodott az utbbi 10 vben s tulajdonkppen ez adja ennek a knyvnek is a vzt. Elg jl lehet tagolni az anyagot s taln azt az alcmet is adhatnnk neki, hogy 14 elads a jtkelmletbl. A Corvinus Egyetemen nem ez az egyetlen trgy, ahol jtkelmlettel, vagy azzal kzeli rokonsgban ll trggyal tallkoznak a hallgatk. tana trgyakat emlteni. Elg csak a Mikrokonmia, a Piacszerkezetek s az Informci KzgazdasgEz a knyv nem szeretne ezekkel a terletekkel konkurlni, inkbb ki szeretn szolglni ket s a mr tanult dolgokat j megvilgtsba helyezni. Trekedtnk arra, hogy egyenslyban legyen a matematikai megalapozs s precizits az intucival, az elmlet a pldkkal, s kell szm gyakorl feladat is lljon rendelkezsre. A pldk s feladatok zmmel kzgazdasgi eredetek. Egyes fejezeteket (alfejezeteket)
jellel je-
lltnk meg, jelezve azt, hogy ezek az alapkurzusba ugyan nem frnek bele, de tovbbi olvasmnynak, egyni tanulsnak, vagy egy magasabb szint kurzusban felhasznlhatk. A
jeles rszek kihagysa nem bontja meg a logikai
egysget. A Fggelkben nhny fontos matematikai eredmnyt gyjtttnk ssze bizonyts nlkl, valamint a jtkelmlet rvid trtnett rtuk le. A
3
4
knyvben a kooperatv jtkok elmlete egy kicsit alulreprezentlt, aminek az a magyarzata, hogy az vlaszthat trgyknt nllan is szerepel. Az elektronikus formt azrt vlasztottuk, hogy az anyag javtst, fejlesztst folyamatosan, kis kltsggel el tudjuk vgezni s a knyv mindenki szmra ingyen elrhet legyen. Az eredmnyes tanulshoz az analzis, lineris algebra s programozs valamint a valsznsgszmts alapjai szksgesek, de leginkbb a formlis, kritikus gondolkodshoz val anits s az ebben val jrtassg segt a megrtsben s a tanultak alkalmazsban.
TartalomjegyzkBevezetsI. Nem kooperatv jtkok
79
1. Jtkok norml formban1.1. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1115
2. A Nash-egyensly2.1. 2.2. 2.3. 2.4. 2.5. 2.6. A Nash-egyensly fogalma . . . . . . . . . . . . . . . . . . . . Ltezs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Szimmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Egyrtelmsg . . . . . . . . . . . . . . . . . . . . . . . . . . . A Nash-egyensly axiomatikus jellemzse Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1717 20 27 28 32 34
3. Jtkok extenzv formban3.1. 3.2. 3.3. 3.4. 3.5. Informci s emlkezet Extenzv s norml forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nash-egyensly s rszjtk tkletessg Kevert s viselkedsi stratgik Feladatok
3939 45 48 52 56
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4. Ktszemlyes zrussszeg jtkok4.1. 4.2. 4.3. 4.4. Egyensly s minimax . . . . . . . . . . . . . . . . . . . . . . Mtrixjtkok . . . . . . . . . . . . . . . . . . . . . . . . . . . Bimtrix-jtkok . . . . . . . . . . . . . . . . . . . . . . . . . Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5959 61 67 71
5. Racionalizlhatsg s egyensly5.1. 5.2. Racionalizlhatsg . . . . . . . . . . . . . . . . . . . . . . . . Korrellt egyensly . . . . . . . . . . . . . . . . . . . . . . . .
7373 78
5
6
TARTALOMJEGYZK
5.3. 5.4. 5.5.
Tkletes egyensly . . . . . . . . . . . . . . . . . . . . . . . . Evolcisan stabil egyensly Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83 87 90
6. Nem teljes informcis jtkok6.1. 6.2. 6.3. 6.4. A Harsnyi-modell Vgtelen tpustr Feladatok . . . . . . . . . . . . . . . . . . . . . . . .
9393
A korrellt egyensly, mint bayesi egyensly . . . . . . . . . . 100 . . . . . . . . . . . . . . . . . . . . . . . . . 102 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
7. Szekvencilis egyensly7.1. 7.2. 7.3. Feladatok
109
Tkletes bayesi-egyensly . . . . . . . . . . . . . . . . . . . . 109 Jelzses jtkok . . . . . . . . . . . . . . . . . . . . . . . . . . 112 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8. Ismtelt jtkok8.1. 8.2. 8.3. 8.4. ltalnos modell s alapfogalmak Ugr stratgik Feladatok Automatk s npttelek
119. . . . . . . . . . . . . . . . 119 . . . . . . . . . . . . . . . . . . . . . . . . . . 123 . . . . . . . . . . . . . . . . . . . . 128
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
A. Feladatmegoldsok B. Fixpontttelek C. A Gale-Nikaidottel Irodalomjegyzk
137 139 141 143
BevezetsMivel is foglalkozik a jtkelmlet? Egy rvid denci: tbbszemlyes dntsi problmkkal. Ez gy elg tg, de nem elg precz, mert nem szerepel benne a modern jtkelmlet egyik legfbb jellemzje: a matematikai modellek hasznlata ezeknek a dntsi problmknak a tanulmnyozsra. Msodik ksrletre ezrt jobb ez a denci: a jtkelmlet matematikai modellek olyan gyjtemnye, amelyeket tbbszerepls koniktushelyzetek tanulmnyozsra hasznlunk. Lazn fogalmazva, a jtkelmlet egy jtkban (a koniktushelyzetet ezentl ezen a nven illetjk) a jtkosok (dntshozk) cselekedeteit s az ennek a kvetkezmnyeknt ltrejv helyzeteket elemzi a jtkosok viselkedsre s a jtkra tett klnfle felttelezsek mellett. Alapveten ktfle szempontbl tekinthetnk egy jtkra. Az egyikben, amit nevezhetnk gy is, hogy alulnzetbl nzzk a jtkot, azonostjuk magunkat az egyik jtkossal s azt vizsgljuk, hogy mi ezen jtkos optimlis viselkedse. A msik a madrtvlat szemllet. Ekkor mintegy fellrl nzve azt vizsgljuk, hogy a jtkosok egyttes cselekvseknt kialakul helyzet milyen, elssorban mennyire stabil. Ez utbbi megkzelts vezet el a jtkelmletben szinte mindenhol jelenlv egyenslyi szemllethez. Mindkt esetben a vizsglat mdszere normatv. Nem azt vizsgljuk elssorban, hogy bizonyos szitucikban a jtkosok a valsgban meggyelheten hogyan viselkednek, hanem azt, hogy racionlis cselekvsek eredmnyekppen minek kell trtnnie, mit diktl a modellben rgztett koniktushelyzet bels logikja. Termszetesen sohasem szabad teljesen elszakadni a valsgtl, az intucival ellenttes megoldsok nem lehetnek hossz letek. A klnbz jtkelmleti modelleket nagyon sok szempont szerint lehet osztlyozni. A teljessg ignye nlkl felsorolunk nhnyat:
A jtkosok szma szerint (kett, vges, vgtelen), A jtkosok szmra rendelkezsre ll lehetsgek szma (vges, vgtelen), A szembenlls foka (antagonisztikus, nem antagonisztikus),
7
8
TARTALOMJEGYZK
A megengedett kooperci foka (kooperatv, nem kooperatv), A jtk informcis struktrja (teljes, nem teljes, tkletes, nem tkletes), Az id szerepe (statikus, dinamikus), A vletlen szerepe (determinisztikus, sztochasztikus), A matematikai megfogalmazs specialitsa (norml forma, extenzv forma, karakterisztikus fggvny forma).
A knyv alapveten kt rszre tagozdik: a nem kooperatv s a kooperatv jtkokkal foglalkoz rszekre. A kett kztti lnyeges klnbsg az, hogy a kooperatv jtkok esetben a jtkosok csoportokat (koalcikat) alkothatnak, amelyeken bell az sszehangolt cselekvst elktelez szerzdsek garantljk, mg a nem kooperatv jtkok esetben ilyen szerzdseket a jtk szablyai nem engednek meg. Helynvalnak tartjuk, hogy itt a bevezetsben foglalkozzunk egy keveset kt alapvet dologgal: a racionalitssal s a kztudssal. Ez a kt tma egyenknt is megrdemelne egy-egy teljes knyvet, de mi csak annyiban rintjk, amennyiben kzvetlen jtkelmleti kvetkezmnyk van. Egy jtkost racionlisnak neveznk, ha viselkedse lerhat matematikai rtelemben optimlis dntsekknt. Ebben a knyvben az egyszersg kedvrt mindvgig feltesszk, hogy a jtkosok preferenciit hasznossgi fggvnyekkel lehet kifejezni, amelyeket a jtkelmleti kontextusban (a hagyomnytisztelet miatt elssorban) kizetfggvnyeknek fogunk nevezni. Bizonytalansg hinyban, egy racionlis jtkos gy a lehetsges alternatvi halmazn a kizetfggvnyt maximalizlja a tbbi jtkos cselekvsrl s az sszes paramterrl alkotott vlekedseket adottnak vve. Bizonytalansg esetn a racionlis jtkosrl azt tesszk fel, hogy az ltala nem befolysolhat paramterek egyttesrl van egy (szubjektv) valsznsgeloszlsa, s az ennek segtsgvel kpzett vrhat kizetst maximalizlja a sajt alternatvi halmazn. Az ltalunk hasznlt msik felttelezs, az n. kztuds (common knowledge). Egy esemny kztudott, ha minden jtkos tudja, hogy az esemny bekvetkezett, minden jtkos tudja, hogy minden jtkos tudja, hogy az esemny bekvetkezett, s.i.t. Ez nyilvnvalan nem egy precz denci, de ez nem is volt clunk. Beszlhetnk kztudott racionalitsrl is, ekkor minden jtkos racionlis, minden jtkos tudja magrl, hogy racionlis, minden jtkos tudja, hogy minden jtkos racionlis s.i.t. Ebben a knyvben, ha csak kln nem jelezzk, feltesszk, hogy a racionalits kztudott.
I. rsz Nem kooperatv jtkok
9
1. fejezet Jtkok norml formbanA nem kooperatv jtkok lersnak legtmrebb formja a stratgiai, vagy norml forma. Ebben az esetben a jtkot a jtkosok vges halmazval, az egyes jtkosok ezek
N = {1, . . . , n}
S1 , . . . , S n
nem res stratgiahalmazaival s
S = S1 Sn
szorzathalmazn rtelmezett
fi : S R, i = 1, . . . , n
kizetfggvnyekkel adjuk meg, vagy mg tmrebben a
G = {S1 , . . . , Sn ; f1 , . . . , fn }szimblummal. Az
S
halmaz elemeit
stratgiaprol oknak
nevezzk.
A jtk lejtszst gy kpzeljk el, hogy a jtkosok egymstl fggetlenl vlasztanak egy stratgit a sajt stratgiahalmazukbl, majd az gy kialakult stratgiaprolhoz tartoz kizetsek megtrtnnek. Sokszor szoktk azt is mondani, hogy a jtkosok egyidejleg (szimultn) vlasztanak stratgit, ez azonban flrevezet is lehet, mivel itt az iddimenzi semmilyen formban nincs jelen. Akkor mr jobb a szintn szoksos statikus jtk elnevezs. A ksbbiekben ltni fogjuk, hogy olyan jtkok is megadhatak norml formban, amelyeknek eredetileg lnyeges iddimenzijuk is volt s gy a norml forma nmileg ltalnosabbnak is tekinthet, noha ez nem az egyetlen forma, amelyet a jtkelmleti modellek hasznlnak. A megfogalmazs tmrsge s matematikai kezelhetsge mindenkppen vonzv teszi a norml formt.
1.1. denci.
Azokat a jtkokat, ahol a stratgiahalmazok vgesek, vges
jtkoknak nevezzk. A vges jtkok esetben vges szm stratgiaprol van, s minden jtkos kizetfggvnye megadhat egy a bimtrix-jtk elnevezs). Sokfle jtkelmleti koncepcit fogunk a lehet legegyszerbb bimtrixjtkokkal szemlltetni, ahol mindkt jtkosnak csak kt stratgija van.
n-dimenzis tmbbel
(polimtrixszal). Ktszemlyes jtkok esetben ez kt mtrixot jelent (innen
11
12
1. FEJEZET. JTKOK NORML FORMBAN
Ezek kzl taln a legismertebb a
Fogolydilemma.
1.2. plda
(Fogolydilemma)
.
Kt fogoly van vizsglati fogsgban kln cel-
lkban gy, hogy nem kommuniklhatnak egymssal. Az gysz egy nagyobb bntnyt szeretne rjuk bizonytani, de csak a beismer vallomsukra, illetve az egyms elleni tanskodsukra szmthat. Mindkt fogolynak kt lehetsge van: vall (V ) vagy nem vall (N ). A bntetseket vekben a
V
s
N
kombincijra (negatv eljellel) az 1.1. tblzat mutatja (a tblzat egyes pozciiban az els szm az 1. fogoly, a msodik a 2. fogoly kizetse).
2. fogoly
N1. fogoly
V(-10,-1) (-5,-5)
N V
(-2,-2) (-1,-10)
1.1. tblzat. Fogolydilemma Mieltt mg az ltalnos elmlettel foglalkoznnk, vessnk egy pillantst a
Fogolydilemmra
s prbljunk csak a jtkosok racionalitsra, ami amgy
is alapfeltevsnk, hivatkozni. Az 1. fogoly ugyan nem tudja, hogy mit fog csinlni a msik, de brmit is csinl a msik, a mindkt esetben jobban jr, mint az kedveztlenebb
V
stratgia vlasztsval
N
vlasztsval, gy a minden esetben A
N
stratgit akr el is hagyhatja, hiszen racionlis jtkos
szmra ez sohasem lesz a legjobb vlasz a msik jtkos vlasztsra. szimmetria miatt a 2. fogoly ugyangy gondolkodik, s is kikszbli az stratgit, gy marad a fogoly kap
N
(V, V )
stratgia prol, mint megolds, s mindkt stratgik kikszblse, s szerencsre
5
vet. Amit itt tettnk, az nem volt ms, mint az egyrtelmen
kedveztlen,
szigoran dominlt
ezzel a megolds triviliss vlt. Felmerl a krds, lehet-e ezt ltalban is csinlni. Ezzel a krdssel egy kicsit ksbb foglalkozunk. A
Fogolydilemma
tpus jtkok nemcsak ilyen frivol krnyezetben for-
dulhatnak el. Gondoljunk az OPEC-re, s az egyszersg kedvrt legyen az egyik jtkos Szaud-Arbia, a msik pedig a tbbi tagorszg. Kt stratgiapr van: visszafogjk olajtermelsket egy magasabb olajr elrsnek remnyben, vagy nem. Az igazi OPEC-optimum (Pareto-optimum) az lenne, ha mindketten visszafognk a termelsket. Mivel nem bznak meg egymsban, mindkt fl abban remnykedik, hogy a msik visszafogja a termelst s pedig kihasznlja az gy add kedvez lehetsget s nveli termelst. Vilgos, hogy a helyzetet egy
Fogolydilemma
tpus jtkkal lehet modellez-
ni. A valdi helyzet sokkal bonyolultabb, de az elmlet mgis ad valamilyen magyarzatot a tnyleges folyamatokra.
13
A
Fogolydilemma
esetben szerencssek voltunk, mert a szigoran domi-
nlt stratgik kikszblse utn csak egy stratgiaprol maradt. A kvetkez bimtrix-jtkban ennek elrshez nem elegend egy lps.
1.3. plda.1. jtkos
Tekintsk az 1.2.
tblzattal megadott bimtrix-jtkot.
Az
jtkos egyik stratgija sem dominlja szigoran a msikat, de a 2.
K
stratgija szigoran dominlja
J -t,
gy racionlis jtkos tbb
J -vel s elhagyja mindkt mtrixbl. A megmaradt jtkban mr F szigoran dominlja L-et, az gy megmaradt jtkban K szigoran dominlja B -t, teht egy stratgiaprolra, (F, K)-ra redukldott a jtk.mr nem szmol Joggal tekinthetjk ezt a jtk megoldsnak, hiszen racionlis jtkosokat s a racionalits kztudottsgt feltve ez lesz a kimenetel.
2. jtkos
B1. jtkos
K(1,2) (0,1)
J(0,1) (2,0)
F L
(1,0) (0,3)
1.2. tblzat. Az 1.3. plda jtka Amit a fenti pldval demonstrltunk, az tulajdonkppen a
dominlt stratgik iteratv kikszblse,
szigoran
ami vges jtkok esetben egy jl
denilt eljrs. Nincs azonban semmi garancia arra, hogy ezzel az eljrssal mindig egy stratgiaprolra tudnnk szkteni az eredeti jtkot. A kvetkez pldban egyik jtkosnak sincs dominns stratgija.
1.4. plda
(Nemek harca)
.
Jancsi s Juliska egytt akarnak szombat este
szrakozni menni. Kosrlabda mrkzs (K ) az egyik lehetsg, egy operaelads (O ) a msik. Jancsi a kosrmeccset, Juliska az opert szereti jobban, de mindketten azt szeretik legkevsb, ha egyedl kell elmenni szrakozni. Egymstl fggetlenl vsrolnak kt-kt jegyet valamelyik esemnyre. Az 1.3. tblzat szmai Jancsi s Juliska preferenciit tkrzik. Knnyen lthat, hogy most semmire sem megynk a szigoran dominlt stratgik iteratv kikszblsvel, hiszen el sem tudunk indulni. Nzznk most egy olyan pldt, ahol a stratgiahalmazok nem vgesek.
1.5. plda
(Szimmetrikus Cournot-duoplium)
.
Egy ipargban kt megha-
troz vllalat van, amelyek egy homogn termket lltanak el. A vllalatok termelsi volumeneikrl dntenek. Adott az inverz keresleti fggvny, amely az iparg ssztermelshez rendeli hozz azt a legmagasabb rat, amelyen a piac kirl. Adott a vllalatok (azonos) kltsgfggvnye. Deniljuk most
14
1. FEJEZET. JTKOK NORML FORMBAN
Juliska
KJancsi
O(0,0) (1,2)
K O
(2,1) (0,0)
1.3. tblzat. Nemek harca azt a jtkot norml formban, amelyben a stratgiahalmazok a termelsi volumenek, amelyet a nemnegatv vals szmok halmazval reprezentlunk. A kizetfggvnyek a brutt nyeresgek: a kltsgekkel cskkentett rbevtel. Vegyk a legegyszerbb esetet, amikor az inverz keresleti fggvny s a kltsgfggvny lineris. Ha
q1
s
q2
jellik a kt vllalat (nemnegatv)
termelsi volument, akkor az
i
jtkos kizetfggvnye:
fi (q1 , q2 ) = qi p(q1 , q2 ) c(qi ),ahol
p(q1 , q2 ) = max{a b(q1 + q2 ), 0}. c(qi ) = cqi , a, b, c > 0, a > c , i = 1, 2. Ekkor ltszik, hogy a 0 termelsi volumen 0 nyeresget ad. A tl nagy termelsi volumen vesztesgetLegyenek (negatv nyeresget) eredmnyez, fggetlenl attl mekkora termelst vlaszt a msik jtkos. Az gy szigoran dominlt stratgikat el lehet hagyni, s a a megoldst a [0, ] intervallumban keresni. b Nzzk most a dominlt stratgik iteratv kikszblst ltalnosabban. A ksbbiekben is egyszersteni fogja a dolgokat az albbi jells. Vegyk az
i
jtkost. Jelljk
mazt, amelyek nem tartalmazzk az
i jtkos stratgijt, ezeket csonka stratgiaprol nak nevezzk, s ha si Si , akkor annak az s stratgiaprolnak a jellsre, amelyben az i jtkos az si stratgijt, mg a tbbiek si -t jtsszk az s = (si , si ) szimblumot hasznljuk. Deniljuk most adominls fogalmt.
Si -vel
azoknak a stratgiaproloknak a hal-
1.6. denci.ban legyen az
si
stratgia
A G = {S1 , . . . , Sn ; f1 , . . . , fn } norml formban adott jtksi , ti Si az i jtkos kt stratgija. Azt mondjuk, hogy az szigoran dominlja a ti stratgit, ha
fi (si , si ) > fi (ti , si )minden
(1.1)
si Si -re. Hasonlan, az si stratgia gyengn dominlja fi (si , si ) fi (ti , si )
a
ti
stratgit, ha (1.2)
minden
si Si -re.
1.1. FELADATOK
15
Tekintsk most a vges jtkokat, azokat a jtkokat, ahol a jtkosok stratgiahalmazai vgesek. Tegyk fel, hogy a dominlt stratgikat egyenknt kszbltk ki mindaddig amg ez megtehet. Mivel a stratgiahalmazok vgesek, ezrt vges szm lpsben eljutunk egy reduklt jtkhoz (idelis esetben egyetlen stratgiaprolhoz), amelyet mr nem tudunk tovbb szkteni. Mivel a kikszbls sorrendje esetleges, zavar lenne, ha a vgeredmny fggne a kikszbls sorrendjtl. Szerencsre, ha csak szigoran dominlt stratgikat hagyunk el, akkor a vgeredmny fggetlen a kikszbls sorrendjtl. Ennek bizonytst (vges esetben) gyakorl feladatknt az olvasra bzzuk (lsd az 1.1. feladatot). Nem ilyen kedvez a helyzet Ekkor a akkor, ha a kikszbls a gyengn dominls alapjn trtnik.
vgeredmny fgghet attl, hogy milyen sorrendben hagyjuk el a gyengn dominlt stratgikat. Nagyon knny ilyen pldt adni, ezt is az olvasra bzzuk (lsd az 1.2. feladatot). A szigoran dominlt stratgik kikszblsvel olyan megoldsokhoz jutunk, melyek stabilitst mutatnak. Stabilitst abban az rtelemben, hogy ha a jtk egy olyan megoldshoz jut, amely tllte a szigoran dominlt stratgik kikszblst, akkor nem racionlis egyik jtkosnak sem olyan stratgit vlasztani, amely nem lte tl a szigoran dominlt stratgik iteratv kikszblst. Lttunk pldkat arra, hogy sokszor vagy semmire sem megynk a szigoran dominlt stratgik iteratv kikszblsvel, (hiszen el sem tudunk indulni) vagy nem tudjuk kellkppen szkteni a racionlisan szba jhet stratgiaprolok halmazt. Olyan megoldsi koncepcira van szksgnk, ami sokkal szigorbb, mint a szigoran dominlt stratgik iteratv kikszblse, vagyis jobban leszkti azoknak a stratgiaproloknak a halmazt, amelyek stabilitst mutatnak. (N EP ). A szigoran dominlt stratgik iteratv kikszblsre a ksbbiekben mg visszatrnk. Egy ilyen megolds a Nash-egyenslypont
1.1. Feladatok
1.1. feladat.
Bizonytsuk be, hogy vges jtkok esetn a szigoran domi-
nlt stratgik iteratv kikszblsnek sorrendje nem befolysolja a vgeredmnyt (a kikszbls utn megmaradt stratgiaprolok halmazt).
1.2. feladat.
Adjunk pldt olyan vges jtkra, ahol a gyengn dominlt
stratgik iteratv kikszblsnek sorrendje befolysolja a vgeredmnyt (a kikszbls utn megmaradt stratgiaprolok halmazt).
16
1. FEJEZET. JTKOK NORML FORMBAN
1.3. feladat.nagyobb, mint legfeljebb szmra.
Kt jtkos a kvetkez osztozkodsi jtkot jtssza.
100
Ft-
ot kell elosztaniuk egyms kztt kerek forintokban. A kt jtkos egyszerre s egymstl fggetlenl jelenti be ignyt a brnak. Ha az ignyek sszege
100 Ft, akkor egyik fl sem kap semmit.
Ha az ignyek sszege
100
Ft, akkor mindkt fl megkapja azt, amit krt, s az esetleges
maradkot a br jtkonysgi clra fordtja, s ez kzmbs a jtkosok
1. Mik ebben a jtkban a szigoran dominlt stratgik ? 2. Melyek ebben a jtkban a gyengn dominlt stratgik? 3. Van-e dominns stratgia?
2. fejezet A Nash-egyensly2.1. A Nash-egyensly fogalmaTegyk fel, hogy valamilyen megfontols, elmlet, esetleg intuci vagy konvenci alapjn azt gondoljuk, hogy egy adott egy
s
stratgiaprolt tekintnk
G = {S1 , . . . , Sn ; f1 , . . . , fn } ijtkos (i
jtk megoldsnak. Ezt a megoldst akkor
tekinthetjk stabilnak vagy nmegvalstnak (self enforcing), ha tetszleges a sajt
= 1, 2, . . . , n) nem tudja a kizetst nvelni azzal, hogy si komponenst s-bl megvltoztatja, feltve, hogy a tbbiek az siA Nash-egyensly pontosan ezt a stabili-
csonka stratgiaprolt jtsszk. tst testesti meg.
G = {S1 , . . . , Sn ; f1 , . . . , fn } egy n-szemlyes nem ko operatv jtk norml formban. Egy s stratgiaprolt Nash-egyenslypont nak (N EP ) neveznk, ha a kvetkez egyenltlensg fennll:Legyen
2.1. denci.
fi (s , s ) fi (si , s ) i i iminden
si Si
s minden
i = 1, . . . , n
esetn.
A denci tovbb ersthet (szkti az egyenslypontok halmazt), ha a (gyengn) dominlst is megkveteljk.
2.2. denci.
Az
s S
stratgiaprolt
dominns Nash-egyenslypont nak
(DN EP ) nevezzk, ha
fi (s , si ) fi (si , si ) iminden
sS
stratgiaprol s minden
i = 1, . . . , n
esetn.
17
18
2. FEJEZET. A NASH-EGYENSLY
Pldul a egy
Fogolydilemma
jtkban (1.2.
plda) a (V, V ) stratgiapros
DN EP .ltalban nem elg, ha azt tesszk fel, hogy a jtkosok csak NashLehetsges ugyanis, hogy a jrsze, de a vlasztott stratgik
egyenslyhoz tartoz stratgit jtszanak. tkban tbb
N EP
is van, ilyenkor elkpzelhet, hogy mindegyik jtkos egy
olyan stratgit jtszik, amely egy
N EP
egyttese (a kialakul stratgiaprol) nem alkot
N EP -eta
(erre plda a
mek harca
Ne-
jtk (1.4. plda)). Ha
2.3. denci.. . . , fn }
jtk kt
s = (s1 , . . . , sn ) N EP -je, s
s
t = (t1 , . . . , tn )
G = {S1 , . . . , Sn ; f1 ,
u = (u1 , . . . , un ),ahol
ui {si , ti }, i = 1, . . . , n, szintn N EP , akkor azt mondjuk, hogy s s t felcserlhetek. Ha a G jtknak csak egyetlen N EP -je van, vagy brmely kt N EP -je felcserlhet, akkor azt mondjuk, hogy G rendelkezik a felcserlhetsgi tulajdonsg gal.
2.4. denci.kus nakfennll, hogy
A
nevezzk,
G = {S1 , S2 ; f1 , f2 } ktszemlyes jtkot antagonisztiha brmely s1 , t1 S1 s s2 , t2 S2 stratgiaprosra
f1 (s1 , s2 ) f1 (t1 , t2 ) f2 (s1 , s2 ) f2 (t1 , t2 ).Az antagonisztikus jtkokban a jtkosok rdekei csakugyan ellenttesek. A konstans sszeg jtkok (f1 + f2
= konstans) antagonisztikusak, de nem
minden antagonisztikus jtk konstans sszeg.
2.5. ttel. Minden antagonisztikus jtk rendelkezik a felcserlhetsgi tulajdonsggal s minden N EP -ben mindkt jtkos kizetfggvny-rtke azonos. Bizonyts.2.2. feladatot). A kizetfggvnyek rtkt (brmely) egyenslypontban a
A ttel bizonytst gyakorlskppen az olvasra bzzuk (lsd a
inek
jtk rtke-
nevezzk.
E -vel a G = {S1 , . . . , Sn ; f1 , . . . , fn } jtk N EP -jeinek halmazt. Deniljunk egy binris relcit az E halmazon a kvetkezkppen: e f akkor s csak akkor, ha e s f felcserlhetek, e, f E . Knny megmutatni, hogy a relci reexv, szimmetrikus, de nem tranzitv (lsd a 2.6.Jelljk feladatot).
2.1. A NASH-EGYENSLY FOGALMA
19
E egy olyan D rszhalmazt, amelyre brmely d1 , d2 D esetn d1 d2 , Nash-halmaz nak nevezzk. Ha egy Nash-halmaz nem valdi rszhalmaza egyetlen Nash-halmaznak sem, akkor ezt maximlis Nashhalmaznak hvjuk.Az A
2.6. denci.
N EP
dencijbl (2.1. denci) kiderl, hogy a jtkosok kizetEz lehetv teszi, hogy amennyiben
fggvnyei (hasznossgi fggvnyei) fggetlenek egymstl, minden jtkos sajt sklt alkalmazhat a mrsnl. anlkl, hogy ezzel a ez szksges, bizonyos transzformcikat vgezznk a kizetfggvnyeken
N EP -ek
halmazt megvltoztatnnk.
2.7. denci.
Tekintsnk kt jtkot, amelyek csak a kizetfggvnyeik-
ben klnbznek:
G = {S1 , . . . , Sn ; f1 , . . . , fn } H = {S1 , . . . , Sn ; g1 , . . . , gn }.A
G
s
H
jtkokat
stratgiailag ekvivalensnek
nevezzk, ha
N EP -jeik
halmaza megegyezik.
R szigoran monoton nv minden i = 1, . . . , n-re, akkor a H = {S1 , . . . , Sn ; 1 f1 , . . . , n fn } jtk stratgiailag ekvivalens G-vel (a szimblum az sszetett fggvny kpzst jelli).Bizonyts.A ttel bizonytst az olvasra bzzuk (lsd a 2.3. feladatot).
2.8. ttel. Tetszleges G = {S1 , . . . , Sn ; f1 , . . . , fn } jtk esetn, ha i : R
Ha a kizets pnzben trtnik, akkor a stratgia vlaszts szempontjbl kzmbs, hogy milyen pnzegysget hasznlunk s hogy vajon van-e (pozitv vagy negatv) rszvteli dj a jtkban, mivel a
i (fi ) = ai fi +bi an transzformci szigoran monoton nvekv, ha ai > 0 minden i = 1, . . . , n-re.Mivel nagyon slyos intuitv rvek tmogatjk mind a szigoran dominlt
stratgik iteratv kikszblsvel nyert megoldst (mr ha egyltaln ezzel az eljrssal eljutunk hozz), mind pedig a
N EP -et,
jogosan vetdik fel a
krds, hogy milyen kapcsolat ltesthet a kett kztt.
2.9. ttel. A G = {S1 , . . . , Sn ; f1 , . . . , fn } jtkban a szigoran dominltstratgik iteratv kikszblsvel egyetlen N EP -et sem vesztnk el. Bizonyts.Az lltst indirekt mdon igazoljuk. Az ltalnossg megszor-
tsa nlkl feltehetjk, hogy minden lpsben pontosan egy stratgit ksz blnk ki. Tegyk fel, hogy G egy N EP -jt, mondjuk az s stratgiaprolt valamikor az eljrs sorn kikszbltk, s hogy si lett elszr kikszbl ve s komponensei kzl. Ekkor kell lenni egy ti Si stratginak, ami
20
2. FEJEZET. A NASH-EGYENSLY
szigoran dominlja fennll:
s -ot, i
vagyis minden olyan
si -re,
amely a tbbi jtkos
mg nem kikszblt stratgiibl llthat ssze, a kvetkez egyenltlensg
fi (ti , si ) > fi (s , si ) iMinthogy
s volt az els, amit kikszbltnk, s -re is fenn kell lljon a fenti i i egyenltlensg, ami viszont ellentmond annak, hogy s N EP G-ben.kikszblsvel egyetlen s stratgiaprol marad, akkor s a G jtk egyetlen N EP -je. Bizonyts.Indirekten bizonytunk. Tegyk fel, hogy
2.10. ttel. Ha a G jtk vges, s a szigoran dominlt stratgik iteratv
s
az egyetlen strat-
giaprol, amely tllte a kikszblsi eljrst, s ez nem vges, gy ltezik ti Si ti = si , hogy
N EP .
Mivel
Si
fi (t , s ) fi (si , s ) i i ifennll minden hogy
(2.1)
si Si -re.
Mivel
t i
szigoran dominlt, gy ltezik
r i Si ,
fi (ri , si ) > fi (t , si ) iminden mg ki nem kszblt (2.1)-nek. A 2.10. ttel bizonytsbl kitnik, hogy a ttel felttelei tl ersek. Az is vilgos azonban, hogy ltalban, tetszleges
si Si -re,
gy
s -re i
is, ami ellentmond
G
vges jtkban, a szigor-
an dominlt stratgik kikszblst tllt stratgiaprolok nem felttlenl
N EP -ek
(lsd a 2.4. feladatot).
2.2. LtezsA
Fogolydilemma
jtkban (1.2. plda) a
slypont.
Ugyancsak
N EP
a
(K, K)
s az
harca
(V, V ) stratgiapros Nash-egyen(O, O) stratgiaprol a Nemek
jtkban (1.4. plda). Nagyon knny azonban olyan pldt mutatni,
ahol a jtknak nincs
N EP -je.
2.11. pldaakkor az
(rmeprosts)
.
Kt jtkos azt a jtkot jtssza, hogy egy-
mstl fggetlenl, anlkl, hogy a msik ltn, egy pnzrme rs (I ) vagy fej (F ) oldalt fordtja felfel. Ha a kt rme fell lv oldala megegyezik,
1.
jtkos nyer 1 egysget a
2.
jtkostl, ha pedig klnbzek,
2.2. LTEZS
21
akkor a
2.
jtkos nyer egy egysget az 1. jtkostl. Ez egy vges, ktsze-
mlyes zrussszeg jtk, gy elg az els jtkos kizetmtrixt megadni (az els sor s oszlop
I -t,
a msodik
F -et
reprezentlja):
A=
1 1 1 1 N EP -je.
Knnyen lthat, hogy ennek a jtknak nincs
Nagyon lnyeges krds, hogy milyen felttelek mellett van egy jtknak
N EP -je.
A norml forma matematikai tisztasga s egyszersge lehetv
teszi, hogy a stratgiahalmazokra s a kizetfggvnyekre tett klnbz felttelezsek mellett mly, s a jtkok szles osztlyra vonatkoz egzisztenciatteleket bizonytsunk. Noha ezek a ttelek ltalnosabb terekben is bizonythatak, mi mgis a gyakorlati szempontbl kielgt vges dimenziban maradunk. Induljunk ki a
G = {S1 , . . . , Sn ; f1 , . . . , fn }norml formban adott jtkbl, ahol most feltesszk, hogy
Si Rki , (i =
1, . . . , n).
A stratgiaprolok ill.
a csonka stratgiaprolok halmazainak
jellsre tovbbra is az
ezek elemeire pedig az s s si szimb lumokat hasznljuk. Idzzk fel, hogy az s stratgiaprol N EP , ha s az
S
Si ,
fi (s , s ) fi (si , s ) i i iminden
si Si s minden i = 1, . . . , n esetn. A N EP -et lehet jellemezni az n. legjobbvlasz-lekpezssel (best reply). Az i jtkos Bi : S Si legjobbvlasz-lekpezse a kvetkez: Bi (s) = {ti Si | fi (ti , si ) fi (ri , si ), ri Si -re}.
minden
Bi (s) az i jtkos legjobb stratgiit tartalmazza, ha a tbbi jtkos az sicsonka stratgiaprolban szerepl stratgikat jtssza. Az eddigi feltevsek mellett
Bi (s)
akr res is lehet. Az egsz jtkra vonatkoz
2.12. denci.lekpezs legyen
B : S S
legjobbvlasz-
B(s) = B1 (s) Bn (s),vagyis
t B(s)
akkor s csak akkor, ha
ti Bi (s)
minden
i = 1, . . . , n-re.
22
2. FEJEZET. A NASH-EGYENSLY
A kvetkez megllapts a
N EP
dencijnak egyenes kvetkezmnye:
jtknak, ha s xpontja a B legjobbvlasz-lekpezsnek, vagyis ha s B(s ). Bizonyts.A bizonytst feladatknt tztk ki: 2.8. feladat.
2.13. segdttel. Az s S stratgiaprol akkor s csak akkor N EP -je a G
Ez a megllapts egy ltalnos mdszert ad a keznkbe az egzisztenciattelek bizonytsnl: olyan feltteleket kell keresni, amelyek mellett a legjobbvlasz-lekpezsre teljeslnek valamely xpontttel felttelei. jk egy viszonylag egyszer esettel. Kezd-
jtk, ahol a stratgiahalmazok vges dimenzis euklideszi terek nemres, konvex, kompakt rszhalmazai, s a kizetfggvnyek folytonosak a stratgiaprolok S halmazn. Ha a G jtkra vonatkoz B legjobbvlasz-lekpezs egyrtk, akkor G-nek van legalbb egy N EP -je. Bizonyts.Mivel
2.14. ttel. Legyen G = {S1 , . . . , Sn ; f1 , . . . , fn } norml formban megadott
Bi
egyrtk,
fi
folytonos,
Si
kompakt, ezrt
Bi
az
siaz
paramtervektor folytonos fggvnye (lsd a 2.9. feladatot). Ekkor a
B
S
kompakt, konvex halmaz nmagra val folytonos lekpezse. A Brouwer-
xpontttel szerint (lsd az B. fggelket)
B -nek van xpontja, ami a G jtk
N EP -je.Egyszerbb esetekben a 2.14. egyenslypontokat. ttel alapjn ki is tudjuk szmolni az Ehhez az kell, hogy a legjobbvlasz-lekpezs viszony-
lag egyszer legyen, s a stratgia halmazok alacsony dimenzisak (lehetleg egydimenzisak) legyenek.
2.15. plda.duopliumhoz. intervallumok. vlasza a
Visszatrnk az 1.5.
pldban lert szimmetrikus Cournot-
A dominlt stratgik elhagysa utn a stratgiahalmazok korltos, zrt A kizetfggvnyek konkv kvadratikus fggvnyek. Ha a msodik vllalat kibocstsa
q,
akkor az els vllalatnak erre a legjobb
Q(x) = x(a b(x + q)) cxq x = ac 2 kibocsts. A legjobb vlasz 2b q ac az egyik jtkos q kibocstsra max{ 2 , 0} s a legjobbvlasz-lekpezs 2b q ac egyrtk (vagyis egy fggvny). Az (egyetlen) xpontot a q = 2 2bkvadratikus fggvnyt maximalizl egyenlet megoldsval kapjuk:
q=
ac . 3b
2.2. LTEZS
23
2(ac) a+2c , az r pedig . 3b 3 Ugyancsak egyszer szmtssal (a protfggvny maximalizlsval) kapac a+c juk, hogy a monopol kibocsts , a monopolr pedig . A versenyzi 2b 2 ac egyenslyi r a c hatrkltsg, az ipargi kibocsts pedig . Az adott b felttelek mellett kis szmolssal ltjuk a korntsem meglep eredmnyt: aAz egsz iparg kibocstsa (a szimmetria miatt) duopolr nagyobb, mint a versenyzi egyenslyi r, de kisebb a monopolrnl, mg a duoplium sszkibocstsa nagyobb, mint a monoplium, de kisebb, mint a versenyzi egyensly esetn. Nzzk most azt az esetet, amikor a legjobbvlasz-lekpezs tbbrtk (halmazrtk). Azt mr lttuk, hogy a legegyszerbbnek tartott vges jtkok esetben ltalban nem szmthatunk arra, hogy a
N EP
ltezik (lsd a 2.11. pldt).
Kedvezbb a helyzet akkor, ha megengedjk, hogy a jtkosok vletlenszeren vlasszanak a (vges szm) stratgiik kzl. Ekkor stratgiahalmazaik az eredeti (ebben a kontextusban
tiszta stratgik nak
nevezett) stratgi-
kon rtelmezett valsznsgi vektorok sszessgei, mg kizetfggvnyeik a vlasztott stratgiaprolbl szrmaztatott valsznsgekkel vett vrhat kizetsek (a kizetsek vrhat rtke) lesznek. Ekkor egy j jtkhoz ju-
kevert bvtsnek neveznk. Magt az n-szemlyes vges jtkot s annak kevert bvtst is megadhatjuk n darab n-dimenzis tmbbel (polimtrixszal), amelyek az egyes jtkosok kizetseittunk, amelyet az eredeti vges jtk adjk meg az sszes stratgiaprol esetben. i Jellje apq...uv az i jtkos kizetst. Ekkor, ha az jtkos a q , . . ., az n 1-edik az u, az n-edik pedig a jtssza, akkor a kevert bvtsben az
1. jtkos a p, a 2. v tiszta stratgijt
i
jtkos kizetse
gi (x, y, . . . , u, v) =p,q,...,u,vvrhat rtk, ahol
ai pq...uv xp yq wu zv 1.jtkos a
xp
annak a valsznsge, hogy az
p-edik
tiszta stratgijt jtssza. Hasonl az
yq , . . . , wu , zv
valsznsgek jelentse.
A vrhat rtk szmtsnl ezeket a valsznsgeket azrt szoroztuk ssze, mert feltettk, hogy a jtkosok egymstl fggetlenl vlasztanak stratgit, ami a jelen esetben az egyes tiszta stratgikhoz rendelt valsznsgek megvlasztst jelenti. ban a
G = {S1 , . . . , Sn ; f1 , . . . , fn } vges jtk kevert bvtst norml formGK = {T1 , . . . , Tn ; g1 , . . . , gn } szimblummal jelljk, ahol T1 , . . . , Tn a megfelel dimenzis egysgszimplexek, a g1 , . . . , gn kizetfggvnyek rtkeiA pedig az elzekben denilt vrhat rtkek. A kevert bvtst sokflekppen lehet interpretlni. A legkzenfekvbb a kvetkez: a jtkosok elszr egymstl fggetlenl vlasztanak egy valsz-
24
2. FEJEZET. A NASH-EGYENSLY
nsgeloszlst (az egysgszimplex egy elemt), majd szintn egymstl fggetlenl a vlasztott valsznsgeloszlssal vletlenszeren vlasztanak egy tiszta stratgit, majd pedig megtrtnik a kizets. A jtkosok a hossz tv tlagos kizetseik (a vrhat kizetsek) maximalizlsra trekszenek. Vegyk szre azt a fontos dolgot, hogy a jtk sokszori lejtszsa sorn a tapasztaltak fggvnyben mr nem lehet megvltoztatni az eredetileg vlasztott eloszlst. A ksbbiekben egyb interpretcikkal is foglalkozunk. 1 1 1 1 Knnyen igazolhatjuk, hogy a 2.11. pldban az (( , ), ( , )) kevert 2 2 2 2 stratgikbl ll stratgiaprol a kevert bvtsnek N EP -je (lsd a 2.13. feladatot). [Nash (1951)] bizonytotta be elszr, hogy a vges jtkok kevert bvtsnek mindig van legalbb egy
N EP -je.
Ezt a ttelt most nem
bizonytjuk kln, egy ltalnosabb ttel specilis eseteknt fogjuk megkapni.
2.16. ttel. Legyen G = {S1 , . . . , Sn ; f1 , . . . , fn } olyan jtk, amely elegettesz az albbi feltteleknek minden i = 1, . . . , n-re: 1. Si egy vges dimenzis euklideszi tr nem res, konvex, kompakt rszhalmaza, 2. fi fellrl flig folytonos (a tovbbiakban f.f.f.) a stratgiaprolok S halmazn, 3. brmely rgztett si Si esetn az f (si , ) fggvny alulrl flig folytonos (a tovbbiakban a.f.f.) az Si csonka stratgiaprolok halmazn, 4. minden s S esetn a Bi (s) legjobbvlasz-halmaz konvex. Ekkor a G jtknak van N EP -je. Bizonyts.A
B
legjobbvlasz-lekpezs rtkei nem resek, hiszen minden
stratgiahalmaz kompakt s minden kizetfggvny f.f.f. Elszr azt mutatjuk meg, hogy a B lekpezs grfja: GB = {(x, y) | x S, y B(x)} zrt. Tegyk fel, hogy nem az. Ekkor van olyan (x0 , y0 ) GB , / 0 0 hogy (x , y ) minden krnyezetnek S S -sel kzs rsze tartalmazza GB 0 0 0 0 legalbb egy pontjt. Mivel S zrt, gy (x , y ) S S , tovbb y B(x ), / 0 vagyis van legalbb egy jtkos (mondjuk az 1. jtkos), aki szmra y1 nem 1 a legjobb vlasz. Ekkor van olyan y1 S1 , hogy
1 0 f1 (y1 , x0 , . . . , x0 ) > f1 (y1 , x0 , . . . , x0 ). 2 n 2 nDeniljuk az
(2.2)
F : S2 R
fggvnyt a kvetkezkppen:
1 F (x, y) = f1 (y1 , x2 , . . . , xn ) f1 (y1 , x2 , . . . , xn )
2.2. LTEZS
25
F a.f.f., gy a C = {(x, y) S 2 | F (x, y) 0} halmaz zrt. Minden (x, y) GB esetn F (x, y) 0, de az 1. felttel miatt F (x0 , y0 ) > 0, ami ellentmond C zrtsgnak. A B legjobbvlasz lekpezsA 2. s 3. felttelek miatt gy kielgti a Kakutani-xpontttel (lsd az B. fggelket) minden felttelt s gy van xpontja, ami a A 2.16. az ttel 4.
G
jtk
N EP -je.
felttele teljeslsnek egy elgsges felttele az, hogy kvzikonkv minden rgztett az
fi (, si ) fggvnyek konkvak (termszetesen ekkor kvzikonkvak is), s az fi fggvnyek folytonosak az S -en, akkor [Nikaido s Isoda (1955)] ttelt kapjuk, ha pedig az fi (, si ) fggvnyek linerisak, s az Si halmazok az egysgszimplexek, akkor [Nash (1951)] eredetiegzisztenciattelt kapjuk specilis esetknt.
fi (, si ) kizetfggvny minden i = 1, . . . , n-re. Ha
si Si -re
s
2.17. plda
(Gyva nyl)
.
Kt autvezet, Pter s Pl a kvetkez rlt
jtkot jtssza. Egyms fel hajtanak egy keskeny ton, ahol csak egy autnak van hely. Btorsgukat szeretnk megmutatni azzal, hogy nem trnek ki elbb, mint a msik. Mindkettnek kt tiszta stratgija van: Kitr (K ), nem tr ki (N ). A 2.1. brn a hasznossgaikat a kvetkez kizetsek jellemzik: az els szm Pter, aki a sorjtkos, a msodik szm Pl, aki az oszlopjtkos. A jtk kevert bvtsben Pter a
K
s az
N
stratgikat, Pter pedig
x s (1x) valsznsgekkel alkalmazza y s (1 y) valsznsggel az tiszta
stratgiit. lekpezse:
Ekkor egyszer szmolssal kapjuk, hogy Pter legjobbvlasz-
0, 1, BPter (y) = [0, 1],Hasonlan, Pl legjobbvlasz-lekpezse:
ha ha ha
0 szmhoz van olyan elg nagy k0 , hogy minden k k0 esetn | tk t |< . Ugyanakkor a kontrakci dencijbl kvetkeznek az albbiszksges!), ezrt egyenltlensgek :
t. {tk }
Mivel
S
zrt (a korltossg nem
| tk+1 B(t ) |=| B(tk ) B(t ) | | tk t |< .A hromszg-egyenltlensg miatt
| t B(t ) || t tk+1 | + | tk+1 B(t ) | ( + 1).amibl a A
t = B(t ) kvetkezik, vagyis t a G jtk egyetlen N EP -je.interpretcija is vonz: A jtkosok a tbbiek korbbi
Picard-iterci
stratgiavlasztsaira legjobb vlaszokat adva gy kzeltik meg egyre jobban az egyenslyi stratgiikat, hogy ennek az llapotnak az elrse nem szerepel explicit cljaik kztt. Ms jelleg feltteleket is kaphatunk az egyrtelmsgre.
G = {S1 , . . . , Sn ; f1 , . . . , fn } egy konkv jtk. Tegyk fel, hogy int S = , s minden i-re az fi kizetfggvnyek ktszer folytonosan dierencilhatak az int S -en, sajt vltozjukban szigoran konkvak, valamint brmely s S -re B(s) int S . Jellje J(s) a g(s) vektor-vektor fggvnyLegyen Jacobi-mtrixt, ahol
g(s) =
f1 (s). . .
fn (s)a kizetfggvnyek gradienseinek egyms al rsval sszelltott vektor. A kizetfggvnyek grdiensein most a sajt vltozk szerinti parcilis derivltakbl sszelltott vektort rtjk.
J(s) + JT (s) mtrix negatv denit minden s-re, akkor G-nek pontosan egy egyenslypontja van.
2.26. ttel. Legyen G = {S1 , . . . , Sn ; f1 , . . . , fn } egy konkv jtk. Ha a
2.4. EGYRTELMSG
31
0 Indirekten tegyk fel, hogy s s 0 0 felttelekbl kvetkezik, hogy g(s ) = g(t ) =rtelmben invertlhat, teht a 0 0 pontbl, gy s = t .
Bizonyts.
t0 0.
is egy
N EP s s0 = t0 . A n A g : int S R lekpezs
kielgti a Gale-Nikaidottel (lsd a C. fggelket) feltteleit, ezrt a ttel
0 pont inverzkpe nem llhat kt klnbz
A 2.26. ttel akkor is rvnyben marad, ha azt az ers felttelt, hogy a
B
lekpezs legyen egyrtk, elhagyjuk s helyette feltesszk, hogy a strat-
gia halmazok vges szm, folytonosan dierencilhat fggvnnyel denilt egyenltlensggel vannak megadva (ebben a formban a ttel [Rosen (1965)]tl szrmazik).
2.27. pldagoplium.
(Oligoplium)
Oligopliumrl
.
A duoplium termszetes ltalnostsa az oli-
akkor beszlnk, ha a piacon jelenlv vllalatok
szma nagyobb, mint egy, de olyan kicsi, hogy nem lehet elhanyagolni az egyes szereplk dntsei kztti klcsnhatsokat. Vegyk a legegyszerbb esetet, amikor a piacon kltsgk egyarnt lineris:
n
egyforma vllalat tevkenykedik, pozitv egysg-
c, kapacitskorltjuk k > 0. A piac keresleti fggvnye Q = qj = Q(p) = a bp, ahol a, b > 0, s feltesszk, hogy j 0 a bc (n + 1)k , azaz a p = c minimumrhoz tartoz kereslet nem negatv s ezt a keresletet (n+1) vllalat kpes kielgteni, ha teljes kapacitson = a s a = 1 jellseket. Ekkor az i vllalat protja: b b fi (q1 , . . . , qn ) = qi ( n qj ) cqi . Ltjuk, hogy rgztett qi -re, az j=1 fi (qi , qi ) konkv kvadratikus fggvny. Tegyk fel most tmenetileg, hogy nincsenek kapacitskorltok. rjuk fel a N EP elsrend feltteleit:Vezessk be az
termel.
2qi j=i
qj c = 0,
i = 1, . . . , n. qi =
abc , i = 1, . . . , n. n+1 Feltteleink miatt 0 qi k , i = 1, . . . , n, gy ez az egyetlen N EP . Ekkor n(abc) az iparg egyenslyi sszkibocstsa: Q = , az egyenslyi r pedig n+1 a+nbc p = (n+1)b . Lthatjuk, hogy a versenyz vllalatok szmnak nvekedsvel a knlat n, az r pedig cskken. A kt vgletet specilis esetknt kapjuk: a+bc abc az n = 1 behelyettestssel a pM = monopolrat s a QM = ssz2b 2 termelst, mg az n hatrrtk kpzssel a pC = c versenyzi rat sEnnek az egyenletrendszernek az egyetlen megoldsa: a
QC = a bc
ssztermelst kapjuk.
A 2.15.
pldban trgyalt Cournotbehelyettestssel kapjuk.
duopliumra vonatkoz eredmnyeket az lyi sszkibocstsnak pont a fele.
n = 2
rdemes megjegyezni, hogy a monopol sszkibocsts a versenyzi egyens-
32
2. FEJEZET. A NASH-EGYENSLY
Knnyen lthat, hogy a fentiekben denilt oligoplium jtk kielgti a 2.26. ttel feltteleit (lsd a 2.16. feladatot).
2.5. A Nash-egyensly axiomatikus jellemzseA
N EP
fogalma, mint a stabilits jtkelmleti megtesteslse nagyon vonz
s a jtkelmlet sarokkvt jelenti. Mint nagyon fontos fogalmat rdemes ms szemszgbl is megkzelteni. Maga
Nash
mutatott pldt arra, hogy
ha egy fogalmat axiomatikusan is megalapozunk, akkor mg szilrdabban ll a lbn, s mg olyan tulajdonsgait is fel tudjuk fedezni, amelyek egybknt rejtve maradnak. A kvetkezben a [Peleg s Tijs (1996)]-tl szrmaz axiomatizlst ismertetjk.
G = {N, (Si )iN , (fi )iN } N a jtkosok vges halmaza, Si az i jtkos stratgiahalmaza, s fi : jN Sj R a kizetfggvnye i N . Legyen T N , T = s vezessk be a S T = iT Si jellst. Legyen tovbb S a jtkok (norml formban) egy halmaza. Nevezzk a : 2 \ {} fggvnyt megoldsfggvnynek a halmazon, ha minden G jtkhoz N az S = S stratgiaprolok egy nem res (G) rszhalmazt rendeli.Egy kicsit ms jellst alkalmazva tekintsnk a jtkot norml formban, ahol
2.28. denci.G
A
(one person rationality:
megoldsfggvny kielgti az egyszemlyes racionalits OP R) kvetelmnyt, ha minden G = {{i}, Si , fi },
egyszemlyes jtkra fennll a kvetkez:
(G) = {xi Si | fi (xi ) fi (yi )Az
minden
yi Si -re}.
OP R
alapvet kvetelmny a dntselmletben s a jtkelmletben:
minden jtkos maximalizlja a sajt hasznossgfggvnyt (racionalits).
2.29. denci.
x S egy stratgiaprol. A Gx,T = {T, (Si )iT , (fix ) iT } jtkot a G jtk T -re s x-re vonatkoz reduklt jtk nak (reduced x T T N \T game) nevezzk, ahol fi (y ) = fi (y , x ) minden yT S T -re s i T -re.Legyen
Gx,T
az a jtk, amelyet
jtkosai az
T jtkosai jtszanak, miutn megtudjk, hogy N \T xi , i N \ T stratgikat vlasztottk s elhagytk a G jtkot.A jtkok egy s
2.30. denci.T N , T = ,
osztlyt zrt nak neveznk, ha (G , x S) = Gx,T , vagyis olyan, hogy tartalmazza A a jtkok egy zrt osztlya s
minden jtknak reduklt jtkait.
2.31. denci.fggvny a
Legyen
halmazon.
megoldsfggvny
egy megoldskonzisztens (CON S), ha
2.5. A NASH-EGYENSLY AXIOMATIKUS JELLEMZSE
33
(G
, T N , T = , s x (G)) = xT (Gx,T ), ahol (xT az x = xN -nek csak azokat a komponenseit tartalmazza, amelyek a T -ben lvjtkosokhoz tartoznak). A
CON S
azt jelenti, hogy ha a
T
-ben lv jtkosok tudjk, hogy az
N \T
jtkosai az
xN \T
stratgiaprolt vlasztottk s elhagytk a
akkor nem kell megvltoztatni a reduklt jtkot jtsszk.
G jtkot, G -ben hasznlt stratgiikat, amikor a Gx,T
Legyen a jtkok egy zrt osztlya s egy megoldsfggvny -n. Ha G = {N, (Si )iN , (fi )iN } s |N | 2, akkor deniljuk a (G) halmazt a kvetkezkppen:
(G) = {x S | xT (Gx,T )
minden
T N, T = , T = N -re} megoldsfggvny kielgti
2.32. denci.a
Egy a
halmazon denilt
fordtott konzisztencia
(converse consistency:
ha minden legalbb kt jtkossal rendelkez
COCON S ) kvetelmnyt, G jtk esetben (G)
(G).rdemes megjegyezni, hogy a
CON S
tulajdonkppen az a kvetelmny,
hogy a fordtott tartalmazs, vagyis a
(G) (G)
teljesljn minden
G -re. COCON Smegoldst. Ha
azt jelenti, hogy kevesebb szemlyes reduklt jt-
kok megoldsait konzisztens mdon sszeillesztve megkaphatjuk a jtk
egy olyan jtkosztly (pldul a vges jtkok kevert bvtsei,
amely jtkosztly zrt, hiszen minden vges jtk kevert bvtshez tartoz reduklt jtk is egy vges jtk kevert bvtse), amelyben minden jtknak van legalbb egy
N EP -je,
akkor jelljk
amely minden jtkhoz hozzrendeli a
N E -vel azt a megoldsfggvnyt, N EP -ek halmazt.
2.33. llts. Ha egy tetszleges, zrt jtkosztly, akkor N E kielgti az OP R, CON S , s COCON S kvetelmnyeket -n.Bizonyts.A bizonytst gyakorlskppen az olvasra bzzuk (2.11. feladat).
2.34. llts. Legyen a zrt fggvnyosztlyon denilt megoldsfgg-
vny. Ha kielgti az OP R s CON S kvetelmnyeket, akkor (G) N E(G) minden G -ra. Bizonyts. Legyen G = {N, (Si )iN , (fi )iN } s x (G). CON S x i x i miatt, xi (Gx,{i} ) minden i N -re. OP R miatt fi (x ) fi (y ) minden y i Si s i N -re. Ezrt
34
2. FEJEZET. A NASH-EGYENSLY
fi (xi , xN \{i} ) fi (y i , xN \{i} )ami azt jelenti, hogy
minden
y i Si -re,
s
i N -re
x N E(G).
2.35. llts. Legyen a zrt jtkosztlyon denilt megoldsfggvny.Ha kielgti az OP R s COCON S kvetelmnyeket, akkor N E(G) (G) minden G -ra. Bizonyts.megy. Legyen A bizonyts a jtkosok szmra vonatkoz teljes indukcival
N E(G) (G) az OP R miatt. Tegyk most fel, hogy N E(G) (G) minden G m-szemlyes jtkra ahol m k s k 1. Legyen G egy (k + 1)-szemlyes jtk. Mivel N E kielgti a CON S kvetelmnyt, ezrt N E(G) NE(G). Az indukcis feltevs miatt N E(G) (G), tovbb a COCON S kvetelmny kvetkeztben (G) (G), amelybl N E(G) (G) kvetkezik.egy egyszemlyes jtk. Ekkor
G
2.36. kvetkezmny. Ha egy a zrt jtkosztlyon denilt megolds-
fggvny kielgti az OP R, CON S , s COCON S kvetelmnyeket, akkor = N E. Bizonyts.Az A 2.33., 2.34., 2.35. lltsok kzvetlen kvetkezmnye. s
OP R, CON S
COCON S
kvetelmnyek teht egyrtelmen meg-
hatrozza a Nash-megoldsfggvnyt. Nem nehz bebizonytani, hogy ezek a kvetelmnyek fggetlenek, vagyis ha brmelyiket elhagyjuk, akkor a msik kettt nem csak az
NE
megoldsfggvny elgti ki (lsd a 2.12. feladatot).
2.6. Feladatok
2.1. feladat.
Mutassuk meg, hogy ha egy jtk rendelkezik a felcserlhets-
gi tulajdonsggal (2.3. denci), akkor tetszleges kikevert stratgiaprol is
kN
darab
N EP -jbl
N EP .
2.2. feladat. 2.3. feladat.akkor a
Bizonytsuk be, hogy minden antagonisztikus jtk rendelkezik
a felcserlhetsgi tulajdonsggal. Mutassuk meg, hogy tetszleges
jtk esetn, ha
G-vel
i : R R szigoran monoton H = {S1 , . . . , Sn ; 1 f1 , . . . , n fn } jtk stratgiailag (a szimblum az sszetett fggvny kpzst jelli).
G = {S1 , . . . , Sn ; f1 , . . . , fn } nv minden i = 1, . . . , n-re,ekvivalens
2.6. FELADATOK
35
2.4. feladat.de nem
Adjunk pldt olyan vges jtkra, aminek van olyan stratgia-
prolja, amely tllte a szigoran dominlt stratgik iteratv kikszblst,
N EP .Adjunk pldt olyan jtkra, ami antagonisztikus, de nem
2.5. feladat.zrussszeg.
2.6. feladat. 2.7. feladat. 2.8. feladat.
Mutassuk meg, hogy a 2.6.
denciban hasznlt
binris
relci reexv, szimmetrikus, de nem tranzitv. Adjunk pldt olyan jtkra, aminek tbb maximlis Nash-
halmaza is van.
N EP -je a G ha s B(s ).
Mutassuk meg, hogy az s S stratgiaprol pontosan akkor jtknak, ha s xpontja a B legjobbvlasz-lekpezsnek, vagyis
2.9. feladat.k,
Bizonytsuk be, hogy ha a
fi
folytonos, s
Si
kompakt, akkor
Bi legjobbvlasz-lekpezs egyrtBi az si paramtervektor folytonos1 X = {(x1 , x2 )| 2 N EP -je a Cournot-
fggvnye. Mutassuk meg, hogy a 2.23. pldban 1 x1 1, 2 x2 1, x1 + x2 = 3 } halmaz minden eleme 2 duoplium jtknak.
2.10. feladat.
2.11. feladat. Bizonytsuk be, hogy ha egy tetszleges, zrt jtkosztly,akkor
NE
kielgti az
OP R, CON S ,
s
COCON S
kvetelmnyeket
-n. =
2.12. feladat. az
Adjunk pldkat arra, hogy ha a 2.36. kvetkezmnyben kvetelmnyek egyikt elhagyjuk, akkor
OP R, CON S , s COCON S N E.
2.13. feladat.
ben (2.11. plda) az
Mutassuk meg, hogy az rmeprosts jtk kevert bvts1 1 1 (( 2 , 2 ), ( 1 , 2 )) stratgiaprol N EP . 2 ttel bizonytsban
2.14. feladat. Lssuk be, hogy a 2.16.s S -re.
B(s) = minden
2.15. feladat.i {1, 2}.
Mutassuk meg, hogy a 2.23. pldban
fi
szigoran konkv
2.16. feladat.
Mutassuk meg, hogy a 2.27. pldban denilt oligopoljtk
kielgti a 2.26. ttel feltteleit.
36
2. FEJEZET. A NASH-EGYENSLY
2.17. feladat[0, 1]
(Telephely-vlaszts [Hotelling (1929)])
.
Tegyk fel, hogy a
intervallum egy strandszakaszt reprezentl s ezen a szakaszon a stran-
dolk egyenletesen oszlanak el. A strandon kt fagylaltos knlja azonos ron, azonos minsg rjt. Minden strandol ahhoz a fagylaltoshoz megy, aki kzelebb van hozz. Ha a tvolsg azonos akkor pnzfeldobssal vlaszt. A fagylaltosok a forgalmukat akarjk maximalizlni. A fagylaltosok egymstl fggetlenl vlasztanak egy helyet a strandon, ahol fellltjk bdjukat. 1. Hol helyezkednek el a fagylaltosok a Nash-egyenslyban? 2. Hov kellene a kt fagylaltost elhelyezni, ha a fogyaszt ltal megteend tlagos tvolsgot szeretnnk minimalizlni? 3. Van-e Nash-egyensly, ha hrom fagylaltos van?
2.18. feladat.q2 ) , 0)2
Kvadratikus inverz keresleti fggvny
(p = max{1 (q1 +
s azonosan nulla kltsgfggvny vllalatok esetben hatrozzuk
meg a Cournot-duoplium egyenslyi termelst s protjt. Legyen G = {S1 , S2 ; f1 , f2 } egy ktszemlyes jtk, ahol S1 = [10, 0], S2 = [3, 0], f1 (s1 , s2 ) = as1 + bs1 s2 cs2 , f2 (s1 , s2 ) = ds1 + es1 s2 1 gs2 , s1 S1 , s2 S2 , ahol a, b, c, d, e, g R nem zrus paramterek. Adjunk 2 a paramtereknek olyan rtkeket, hogy 1. 2. 3. 4.
2.19. feladat.
G-nek G G
tbb
N EP -je
legyen.
kielgtse a 2.24. ttel feltteleit. kielgtse a 2.26. ttel feltteleit. egyetlen
G-nek
N EP -je
legyen, de ne elgtse ki sem a 2.24. ttel, sem
a 2.26. ttel feltteleit.
2.20. feladat.xpontttel.
Bizonytsuk be, hogy a 2.16. ttelbl kvetkezik a Brouwer-
K Rn konvex, kompakt halmazon, akkor deniljunk egy G = {K, K; f1 , f2 } jtkot, ahol f1 (x, y) = | x g(y) |s f2 (x, y) = | x y |, x, y K , majd vizsgljuk a G N EP -jeit.Ha
J tancs :
g:KK
folytonos lekpezs a
G = {S1 , . . . , Sn ; f1,..., fn } egy norml formban adott jtk s S = S1 , . . . , Sn a stratgiaprolok halmaza. Deniljunk egy H : S S R aggregtor fggvnyt a kvetkez kppen:Legyen
2.21. feladat.
2.6. FELADATOK
37
n
H(x, y) =i=1Bizonytsuk be, hogy a
fi (x1 , . . . , xi1 , yi , xi+1 , . . . , xn )akkor s csak akkor
x S
N EP -je
a
G
jtknak, ha
H(x , y) H(x , x )egyenltlensg minden
yS
-re fennll.
2.22. feladat.lok
Bizonytsuk be, hogy a 2.18. pldban (Bertrand-duoplium)
a jtkosok kizetfggvnyei nem fellrl flig folytonosak a stratgiapro-
S
halmazn. Mutassuk meg, hogy a 2.23. pldban (Cournot-duoplium) fggvnye
2.23. feladat.az
fi szigoran konkv [0, 1] intervallumon.
xi -nek
a msik vltoz rgztse mellett a
38
2. FEJEZET. A NASH-EGYENSLY
3. fejezet Jtkok extenzv formban3.1. Informci s emlkezetMindenki ismeri a sakkjtkot. Els ltsra, mg elvben is, elg nehz ezt a jtkot norml formban megadni. Mg az sem vilgos igazn, hogy mit is rtsnk stratgin ebben az esetben. Az biztos, hogy nem sokra megynk a sakkozk fogalmainak hasznlatval, akik a jtk megnyitsi szakaszban a gurk olyan mozgatst rtik ezen, amely az adott jtkos szmra gretes kzpjtkot s/vagy vgjtkot valsznst. Ennl preczebbnek kell lennnk. Prbljuk meg a jtkot mintegy lpsrl lpsre haladva lerni, gyelembe vve a sakkjtk szablyait. Ezek a szablyok nem teszik lehetv, hogy egy jtszma vgtelen hossz legyen s termszetesen minden pozciban vges szm lpsbl lehet csak vlasztani. A jtknak van egy dinamikja: a kezd lpstl vagy az egyik jtkos gyzelmig, vagy dntetlenig halad elre. lyeket Az ilyen jtkok lersra, ameneveznk (egyelre ez nem elg
extenzv formban adott jtk oknak
pontos denci!) a legmegfelelbb matematikai eszkz egy
krrel rendelkez vges fa.be irnytott l.
irnytott, gy-
Ez egy olyan grf, amely sszefgg, krmentes s
pontosan egy olyan kitntetett cscsa van (a gykr), amelybe nem rkezik A jtkelmletben szoks a cscsokat Azokat a pontokat, amelyekbl nem vezet ki l, vgpont oknak (levl) nevezzk. A fa azon pontjait, amelyek nem vgpontok dntsi pont oknak hvjuk. A fa (a tovbbiakban jtkfa ) minden pontjhoz, a vgpontok kivtelvel, gy jrunk el mi is. hozzrendelnk egy jtkost, aki az adott pontbl kiindul lekbl vlaszt egyet, s a jtk ezen l mentn halad tovbb egy jabb pontba, vagy vget r, ha egy vgpontba jutottunk el. A gykrbl egy vgpontba vezet pontok s lek halmazt a grfelmletben
pont oknak
nevezni,
t nak,
a jtkelmletben
jtszm nak
39
40
3. FEJEZET. JTKOK EXTENZV FORMBAN
nevezzk. A sakkjtkban a gykrhez
Vilgos
van hozzrendelve s innen
20 irny-
ba indulhat el (20 l indul ki a gykrbl). Mindegyik l vgn lv ponthoz
Stt
van hozzrendelve (Stt lp) s szintn
20
lehetsge van. A sakkj-
tkot brzol fban kt lps utn mr
421
pont s
420
l van. A sakkjtk
fjt csak elvben tudjuk felrajzolni a fa risi mrete miatt. Ezrt clszer az extenzv formban adott jtkok szemlltetsre egyszerbb pldkat (is) hasznlni.
3.1. plda (ruhzlnc jtk).ruhzat nyitni. Ha
Egy vros kiskereskedelmt egy nagy ruhz
(N ) uralja. Egy vllalkoz (B ) szeretne erre a piacra belpni s egy konkurens
B
belp a piacra, akkor
N
ktflekppen reaglhat: vagy
rhbort indt (h), vagy belenyugszik az j helyzetbe (b). A jtkot a 3.1. brn lthat jtkfval adhatjuk meg. Elbb vagy belenyugszik az j helyzetbe.
B
lp s dnt, hogy belp-e a
piacra (l ), vagy kvl marad (m). Ha belpett, akkor
N
dnt, hogy harcol,
l 4 N r44 4e
rB 4 4
m r
h r
e
eb e er
3.1. bra. ruhzlnc jtk Meggyelhetjk, hogy mind a sakkjtkban, mind az
ruhzlnc
jtk-
ban az egyes lpsek jl denilt egymsra kvetkezse, s amiatt, mert a mlt (korbbi lpsek) mindenki szmra meggyelhet, a jtkosok
letesen informltak.
tk-
Ezen azt rtjk, hogy minden jtkos ismeri a jtkot
ler ft, mindig tudja, hogy a jtk ppen hol (melyik pontjn a fnak) tart, s emlkszik arra, hogy melyik svny mentn jutott oda. Nem mindig van azonban ez gy. Nzzk a kvetkez pldt:
3.2. plda
(Egyszerstett snbli)
.
Kt jtkos mindegyike
0
vagy
1
pnz-
rmt tesz a kezbe gy, hogy ezt a msik nem ltja. Ezutn az megtippeli, hogy a kt kzben sszesen hny rme van. Utna a tippel, de nem mondhatja ugyanazt, mint az pl. senki sem tippelhet
1. 2.
jtkos jtkos
1.
jtkos. A helyzet tovbbi
egyszerstse cljbl feltesszk, hogy a blls nem megengedett, vagyis
0-t,
mikzben az kezben
1
van.
3.1. INFORMCI S EMLKEZET
41
Ezt a jtkot nem tudjuk gy brzolni, mint pl. a sakkot, mert a jtkosoknak nincs informcijuk arrl, hogy a msik hny rmt tett a kezbe, s gy nem tudjk pontosan, hogy ppen merre jrnak a jtkfban. Ilyen jtkok esetben segt az
informcis halmaz
fogalmnak bevezetse.
3.3. denci.ben az
Jelljk
i
jtkos lp. Az
Ui -vel a jtkfa azon pontjainak halmazt, amelyekUi egy Uit rszhalmazt az i jtkos egy informcis
halmaznak nevezzk, ha 1.
Uit
minden pontjbl ugyanannyi l indul ki, s az lek ugyanazokhoz
a jtkosokhoz tartoz pontok fel irnyulnak,
t 2. brmely tnak legfeljebb egy kzs pontja van Ui -vel (nem megengedett t pl., hogy Ui kt pontja llel legyen sszektve).3. az
Uit
halmazok az
Ui
egy partcijt adjk.
Vegyk szre, hogy az informcis halmazok struktrja nem kvetkezik a jtk fjnak szerkezetbl, teht az informcis halmazok a jtk lershoz tartoznak, nem pedig abbl vezethetek le. Az informcis halmazok dencija mgtti intuci a kvetkez: az i t jtkos tudja, hogy az Ui valamelyik pontjban van a jtk, neki kell lpnie t (vlasztani az Ui pontjaibl kiindul azonos szm l kzl) anlkl, hogy t tudn, hogy az Ui melyik pontjban van. Ehhez mg arra is szksg van, t t hogy minden Ui informcis halmazhoz hozzrendeljnk egy Vi indexhalmazt, amely azoknak a jtkosoknak az indexeit tartalmazza (egyes jtkot sok tbbszr is szerepelhetnek), akik Ui pontjaibl egy llel elrhetek. Ezek t szerint egy informcis halmaz minden pontjbl ugyanazok a jtkosok (Vi elemei) rhetek el. Ha nem gy lenne, akkor az adott informcis halmazhoz tartoz jtkos esetleg klnbsget tudna tenni az informcis halmaz pontjai kztt, amit persze nem engedhetnk meg. Visszatrve a 3.2. pldra, a jtkot az informcis halmazok segtsgvel brzolni tudjuk egy jtkfval, amint azt a 3.2. brn ltni lehet. Az informcis halmazok kivlan alkalmasak azoknak a helyzeteknek a lersra, amikor a jtkosoknak idnknt egyidejleg kell lpnik. Ekkor nknyesen vlaszthatunk valamilyen lpssorrendet, csak arra kell vigyzni, hogy az informcis halmazok pontosan fejezzk ki azt, hogy a jtkosok nem tudhatnak egyes ms jtkosok vlasztsrl. Az egyidej lpst egybknt sem gy kell rteni, hogy mindenki ugyanabban a msodpercben lp.
3.4. plda.knyesen jtkfa a
rmeprosts jtkot extenzv formban. nvlasztva, hogy elszr az 1. jtkos lpjen, majd a 2. jtkos, a 3.3. brn lthat (F : fej,I : rs).brzoljuk az
42
3. FEJEZET. JTKOK EXTENZV FORMBAN
0 4 4 4 r4 e e e1 0 e er r e g e g 0 1 er g g r r g gr 4
r 4
1. jtkos rme kzbe 1 r e e e e er r f f f 1 f2 f f r f f r f f r r r r
2. jtkos rme kzbe
1. jtkos tippel
2. jtkos tippel
0
r
0
r
1
r
2
r
1
r
r
2
3.2. bra. Egyszerstett snbli
F 4 4 4 r4 e e eI F e er r
r 4 4
1. jtkos I r e e e e er r
2. jtkos
3.3. bra. rmeprosts
Ha a jtkban minden informcis halmaz egyetlen pontbl ll, akkor azt
tkletes informcis jtk nak hvjuk. informcis jtk oknaknevezzk.
Azokat a jtkokat, ahol legalbb egy
informcis halmaznak legalbb kt pontja van, Mind a kt pldnkban (3.2. s 3.4.
nem tkletes (imperfect)
plda) az informcis halmazok A 3.2. pldban az
sszhangban voltak a jtkosok korbbi lpseivel. emlkszik arra, hogy elsre hogy a
1.
jtkos tudja, hogy a kt informcis halmaznak melyikben van, hiszen
0-t
vagy
1-et
vlasztott, csak azt nem tudja,
2.
jtkos mit lpett korbban. Nem ez a helyzet azonban a kvetkez
jtkban.
3.5. plda.
A 3.4.
brn lthat jtkban az
1.
jtkos ktszer lp s
3.1. INFORMCI S EMLKEZET
43
mindktszer
J (obb)
s
B (al)
kzl vlaszt, a
2.
jtkos egyszer vlaszt
J
s
B
kzl. Az egyetlen informcis halmazban az
1.
jtkos nem tudja, hogy
melyik pontban van a jtk, hiszen elfelejtette, hogy elsre lpett.
J -t
vagy
B -t
J 4 4 4 r4 e e eB J e er r f f J f B f fr r4
r 4
1. jtkos B r e e e e er r f f f f fr r
2. jtkos
1. jtkos
3.4. bra. A 3.5. plda jtkfja Azokat a jtkokat, amelyekben az informcis halmazok sszhangban vannak azzal a felttelezssel, hogy minden jtkos emlkszik korbbi lpse-
tkletes emlkezet (perfect recall) jtk oknak nevezzk. Ha ez a felttel nem teljesl, akkor nem tkletes emlkezet (imperfect recall) jtk okrl beire, szlnk. A krtyajtkok is tkletes pldnak ltszanak az extenzv formban adott jtkokra. A klnbsg a sakktl az, hogy idnknt a vletlen, nem pedig a jtkosok dntik el, hogy merre haladjon a jtk tovbb a fn. A krtyk keverse s osztsa j plda erre. Clszer teht egy klnleges sttus jtkost csatolni a jtkosok halmazhoz, amelyet egyszeren Vletlennek (V ) hvunk.
V
annyiban klnbzik a tbbi jtkostl, hogy minden informcis
halmaza egyetlen pontbl ll, s ezekben a pontokban egy adott, s minden jtkos ltal ismert valsznsgeloszls szerint vletlenszeren vlaszt lt. Feltesszk, hogy ha tbb pontban is kivlasztsa) egymstl fggetlenek.
V
hatrozza meg a tovbbhaladst,
akkor a sorsolsok (a tovbbhaladsi lek adott eloszls szerinti vletlen
3.6. plda.B
Az
ruhzlnc
jtkban (3.1. plda)
N
mskppen rtkeli a
belpse utni helyzetet, ha konjunktra (k ) vrhat s mskppen, ha 3 1 dekonjunktra (d). Ez a kt esemny illetve valsznsggel kvetkezik 4 4 be. N -nek a dntst akkor kell meghoznia, amikor mg nem tudja, hogy
k
vagy
d
fog-e bekvetkezni.
A jtkfa ekkor a
V (letlen),
mint szerepl
megjelense utn a 3.5. brn lthat.
44
3. FEJEZET. JTKOK EXTENZV FORMBAN
l 4 V r44 4e r f f f f fr r
rB 4 4
m r
k
e
ed e er N f f h fb f fr r
3.5. bra. ruhzlnc jtk II.
Az extenzv formban adott jtkok lershoz nemcsak az egyes lehetsges lpseket brzol fa tartozik hozz, hanem a jtkosok cselekedeteit rtkel s motivl rtkel fggvny is, amely a jtk minden vgpontjhoz s minden jtkoshoz hozzrendel egy hasznossgi szintet (ezt itt is kizetsnek fogjuk hvni). A jtkft, az informcis halmazokat, a egytt nevezzk a
Vletlen
valsznsgeloszlsait, valamint a jtkfa vgpontjaihoz tartoz kizetseket
jtk extenzv form jnak.
Miutn, remlhetleg, jl megrtettk, hogy milyen is egy jtk extenzv formban, az eddigi jellsek felhasznlsval mintegy sszegzskppen megadjuk a pontos matematikai dencit.
3.7. denci.ll: 1.
Egy
G extenzv formban adott jtk a kvetkez elemekbl
N = {0, 1, . . . , n}tkost jelli,
a jtkoshalmaz, amelyben a
0
index a
Vletlen
j-
2. 3.
r
jelli a
T
jtkfa gykert,
U0 , U1 , . . . , Un a T dntsi pontjainak egy partcija. Az U0 pontokban a Vletlen dnt, az Ui pontjaiban pedig az i jtkos, i N , U0minden pontjhoz adott az illet pontbl kiindul leken rtelmezett valsznsgeloszls,
4. az
5. minden
i N -re adott az Ui
halmaz egy
Ui1 , . . . , Uiki
partcija, amely-
nek elemeit informcis halmazoknak nevezzk s amelyek minden
j=
1, . . . , ki -re
kielgtik a kvetkez feltteleket:
3.2. EXTENZV S NORML FORMA
45
(a) brmely
Uij
informcis halmaz minden pontjbl ugyanannyi l
indul ki s az lek ugyanazokhoz a jtkosokhoz tartoz pontok fel irnyulnak, (b) a gykrbl kiindul minden t minden informcis halmazt legfeljebb egyszer rint,
6. a
T
fa minden
t
vgpontjhoz tartozik egy
f (t)
vektor, amelynek kom-
ponensei a jtkosok kizetsei a
t
vgpontban.
3.2. Extenzv s norml formaEddig az extenzv formban adott jtkok lersig jutottunk el, ez azonban nem elg egy normatv elmlethez. Ehhez denilnunk kell a jtkosok stratgiit s kizetfggvnyeit, ms szval meg kell teremtennk az tmenetet az extenzv s a norml forma kztt. Az
i
jtkos egy
si stratgi ja
nem
ms, mint egy teljes magatartsterv, amely az
i
jtkos brmely informcis
halmazban megmondja, hogy merre lpjen az
i
jtkos abban az esetben,
ha a jtk eljut ahhoz az informcis halmazhoz. Az si teht egy fggvny, t amely az informcis halmazok t {Ui } unijnak halmazn van rtelmezve. Ha az
i
jtkos eldnttte a jtk kezdete eltt, hogy az
si
stratgit fogja
alkalmazni, akkor egy jtszma lejtszsa sorn a szemlyes rszvtelre nincs Az sszes stratgik
si utastsait. Si halmazt az i jtkos stratgiahalmaznak nevezzk. Ha az i jtkos az si (i = 1, . . . , n) stratgit vlasztotta az n-szemlyes extenzv formban adott jtkban, akkor az s = (s1 , . . . , sn ) stratgiaprol egyrtelmen meghatrozza a jtk fjnak egy vgpontjt, ha a Vletlen nem szerepel a jtk lersban. Ha a Vletlen is szerepel, akkor a fa mindegyikis szksg, egy gp, vagy egy gynk vgre tudja hajtani az vgpontjhoz tartozik egy elrsi valsznsg, amit gy szmtunk ki, hogy a gykeret a vgponttal sszekt t leinek valsznsgeit sszeszorozzuk (feltettk, hogy a
Vletlen
sorsolsai fggetlenek). Termszetesen azokhoz
a vgpontokhoz, amelyekhez az
s
stratgiaprol sohasem vezet el,
0
elr-
si valsznsg tartozik, s az elrsi valsznsgek a vgpontok halmazn egy valsznsgeloszlst adnak. Mivel a jtk lersban minden vgponthoz (jtszmhoz) tartozik egy egy elrsi valsznsg, gy az vrhat rtkt:
n-elem kizetsvektor (a jtkosok kizetsei) s i jtkos s stratgiaprolhoz tartoz kize-
tst gy deniljuk, mint a kizetseknek az elrsi valsznsgekkel vett
fi (s) =k
i pk vk ,
46
3. FEJEZET. JTKOK EXTENZV FORMBAN
ahol
i vk
a
k
vgpontban az
i
jtkos kizetse,
pk
pedig a
k
vgpont elrsi
valsznsge. Ily mdon az extenzv formhoz egyrtelmen hozzrendelhetnk egy
G = {S1 , . . . , Sn ; f1 , . . . , fn }
norml formt.
Az extenzv formbl a norml formba val tmenetet az jtkon (3.6. plda) szemlltetjk.
ruhzlncpldban
3.8. pldavan:
(ruhzlnc jtk III.)
.
Nzzk mg egyszer a 3.6.
szerepl jtkot (lsd a 3.6. brt), most mr a hasznossgokat reprezentl kizetsekkel (az els szm
l
s
m, N -nek
is kett:
elrsi valsznsgeket az
N , a msodik B kizetse). B -nek kt stratgija h s b. Az egyes stratgiaprosokhoz tartoz 5 vgpont esetben (balrl jobbra indexelve ket)
az albbi tblzat mutatja: Vgpont
1 2 3 4 5Vrhat kizetsek
N: B:
lh 1/4 0 3/4 0 0 0 0 N
lb 0 1/4 0 3/4 0 9/4 9/4
mh mb 0 0 0 0 0 0 0 0 1 1 5 5 1 1 Baz oszlopjtkos,
Ez a jtk bimtrix-jtkknt felrva, ha a kizetseket pedig tovbbra is
a sor- s
N, B
sorrendben megadva:
NA jtk
h b
B l (0, 0) (9/4, 9/4)
m (5, 1) (5, 1)
teljes norml form jban
egy stratgia olyan dntsi pontok-
ban is utastst ad a tovbbhaladsi irnyra, amely egy korbbi vlaszts eredmnyekppen ltre sem jhet. gy olyan stratgik is klnbzkknt szerepelnek, amelyek ugyanabba a vgpontba vezetnek a tbbi jtkos rgztett stratgiavlasztsa esetn. gy pldul a sakkjtkban, ha a stratgija azt rja el, hogy a kezd lpse
Vilgos
egy
e4 legyen, akkor ennek a stratgi-
nak olyan esetekre is meg kell mondania a megteend lpst, amelyek csak akkor llhattak volna el, ha a kezd lpse lershoz jutunk az n.
d4 lett volna. Egy takarkosabb gyengn reduklt norml form val. Itt egy stratgi-
nak csak azokban a dntsi pontokban kell utastst adni a tovbbhalads irnyra, amelyek a tbbi jtkos valamely stratgiavlasztsa mellett a sajt korbbi dntsek eredmnyekppen ltre is jhetnek.
3.2. EXTENZV S NORML FORMA
47
rB 4e 4 l44 e V r4 e 4 e e 3 1 e e e m ed 4 4k e e e er r N e f f e f f e h fb f e f f er fr fr r r
N: B:
0 0
3 3
0 0
2 2
5 1
3.6. bra. ruhzlnc jtk III.
3.9. denci.kt stratgija
G extenzv formban adott jtkban tetszleges i si s si ekvivalensek, ha minden si Si -re (a tbbiA
jtkos jtkos
tetszlegesen rgztett stratgija mellett) a kt stratgia ugyanabba a vgpontba vezeti a jtkot, ill. a A
Vletlen
jtkost is gyelembe vve ugyanazt
az eloszlst generlja a vgpontokon.
G
jtk gyengn reduklt norml formjt a
G
jtk teljes norml
formjbl gy kapjuk meg, hogy tetszleges valenciaosztlyai a stratgik az j jtkban).
i
jtkos ekvivalens stratgii
kztt nem tesznk klnbsget (pontosabban az ekvivalens stratgik ekvi-
Vilgos, hogy egy stratgiaprol gy is egyrtelmen meghatrozza a vgpontot, de jval kevesebb stratgit kell csak gyelembe vennnk.
3.10. plda.s
Tekintsnk egy ktszemlyes tkletes informcis jtkot, a-
melyben mindkt jtkosnak minden dntsi pontban kt lehetsge van (J
B ).
Elbb az
1.
jtkos lp, majd a brn lthat). A
(a jtkfa a 3.7.
2. 2.
jtkos s vgl ismt az Az
1.
jtkos
jtkosnak mind a teljes, mind a
gyengn reduklt norml formban teljes norml formban formban csak
4
stratgija van.
1.
jtkosnak a nem kell
32
stratgija van, mg a gyengn reduklt norml
8,
hiszen ha indulskor
trdnie, hogy mit tenne, ha
J -t vlasztotta, azzal mr indulskor a B -t vlasztotta volna.
A teljes norml forma elnye, hogy a jtkos szellemi kpessgeire semmilyen mdon nem pt, teljesen mechanikusan alkalmazhat, gy tetszleges stratgia birtokban a jtkos tudja mit csinljon akkor is, amikor a jtkba csak ksbb kapcsoldik be, s addig nem a kvnt stratgia szerint alakultak a dolgok valamilyen okbl (pl. vletlenl ms gurt fogott meg a sakktb-
48
3. FEJEZET. JTKOK EXTENZV FORMBAN
J 4 4 4 r4 e e eB J e er r f f f f f f f f fr fr r r4
r 4
1. jtkos B r e e e e er r f f f fB J f f f f fr fr r r
2. jtkos
1. jtkos
3.7. bra. A 3.10. plda jtkfja
ln, mint amit a stratgija diktlt volna), de a teljes stratgia ebben az esetben is megmondja, hogy mit kell csinlnia.
3.3. Nash-egyensly s rszjtk tkletessgA norml formra val ttrs lehetv teszi, hogy a Nash-egyenslypontot (rviden egyenslypont vagy adott jtknak az a
N EP ) az
extenzv formban adott jtkokra is
denilni tudjuk. Egyszeren azt mondjuk, hogy egy
G
extenzv formban
s
stratgiaprol egyenslypontja, ha
s
egyenslypontja
G-bl
szrmaztatott norml formban adott jtknak. Vagyis az
s
a j-
tkosok olyan magatartsterve, amelynek utastsaitl brmely jtkos, ha egyetlen dntsi pontban (informcis halmazban) is eltrne, nem jrna jobban (kizetse nem nvekedne), ha a tbbi jtkos nem vltoztat az egyenslyi magatartstervein (stratgiin) egyetlen dntsi pontban (informcis halmazban) sem. Itt az egyenslypontok halmaza klnbz lehet aszerint, hogy a teljes vagy a reduklt norml formval dolgozunk.
3.11. plda.1.
Knny ltni, hogy a 3.8. pldban szerepl ruhzlnc jtk-
ban (a teljes norml formt tekintve) kt
N EP
van:
N
nem kezd rharcot (b) s
B
belp a piacra (l ), harcolna (h), de
2. ha
B
belpne a piacra, akkor
N
B
nem lp be a piacra
(m). A 3.11. pldban szerepl kt egyenslypontot nem rezzk ugyanolyan meggyznek. sztnsen is hajlamosak vagyunk az elst jobban elfogadni,
3.3. NASH-EGYENSLY S RSZJTK TKLETESSG
49
mint a msodikat. Mirt? Az extenzv formban adott jtkoknak fontos az iddimenzijuk. A
2.
csak azrt lehet egyenslypont, mert
B -t B
a piacon
val kvlmaradsra knyszerti az a fenyegets, hogy akkor mr
N
harcolni fog, ha
B
belpne. Hihet ez a fenyegets? Nem nagyon, mert ha egyszer
belpett,
N -nek
nem rdeke harcolni.
Hogyan lehet ezt a nem letszer
megoldst kizrni? Egy extenzv formban adott jtk
rszjtk nak
nevezzk a jtknak
azt a rszt, amely egy egyelem informcis halmazzal kezddik (ez lesz a rszjtk fjnak gykere), egyebekben pedig teljesen azonos az eredeti jtkkal. gy kell elkpzelnnk, hogy az eredeti jtk egy ideig haladt elre, majd egy egyelem informcis halmaznl kezddik egy j jtk, ami rsze az eredetinek. Egy egyenslyi magatartsterv-prolt (stratgiaprolt)
konzekvens nek, szleskren elfogadott terminolgival rszjtk tkletes nek(subgame perfect) neveznk, ha azt egy rszjtkra korltozva tovbbra is egyenslyi stratgiaprol marad abban a rszjtkban. az A 3.11. pldban
V (letlen) jtkoshoz tartoz ponthoz, mint gykrhez tartoz rszjtkban (h, m) nemegyenslypont rszjtk tkletes, a azonban nem az (a egyensly). Minthogy az extenzv formban adott jtkokat vissza tudjuk vezetni norml formban megadott jtkokra, mindazok az egzisztenciattelek, amelyeket a 2.2. alfejezetben trgyaltunk tovbbra is rvnyesek maradnak. Az extenzv forma specialitsa azonban lehetv teszi ms tpus egzisztenciattelek bizonytst is. A legrgibb s mindmig legalapvetbb
1.
2.
Kuhn
ttele.
3.12. ttel
(Kuhn)
jtknak van rszjtk tkletes egyenslypontja.
. Minden (vges fval brzolhat) tkletes informcis
Bizonyts. Nevezzk egy t hossznak a benne lv lek szmt s jelljk h = h(F )-el az F fa hosszt, vagyis a leghosszabb t hosszt F -ben. Abizonyts a fa hosszra vonatkoz teljes indukcival megy.
h = 0 esetben az egy pontbl ll fra a ttel trivilisan igaz. Tekinth hosszsg fval brzolhat G jtkot (h > 1). Tegyk most fel, hogy minden legfeljebb h 1 hosszsg fval brzolhat jtknak van rszjtk tkletes egyenslypontja. Hagyjuk el G fjbl a gykeret. Ezltal vges szm G1 , . . . , Gk rszjtk keletkezik, amelyeknek hossza legfeljebb h1.A snk egy Az indukcis feltevs miatt ezek mindegyiknek van legalbb egy rszjtk tkletes egyenslypontja. Jelljnk ezek kzl egyet-egyet (tetszlegeset)
s1 , . . . , sk -val,
a hozztartoz kizetsvektorokat pedig
f1 , . . . , fk -val.jtkos van hozz-
Nyugodtan feltehetjk, hogy a rendelve. Konstruljunk
G
gykerhez az
1.
G-ben
egy stratgiaprolt a kvetkezkppen:
2, . . . , n
jtkosok stratgii legyenek azok a stratgik, amelyeket
i= s2 , . . . , sk
hatroz meg, mivel ezeknek a jtkosoknak a
G
gykerben nem kell lpni.
50
3. FEJEZET. JTKOK EXTENZV FORMBAN
Az
i = 1 jtkos stratgija pedig legyen a kvetkez 1 magatartsterv: a s G1 , . . . , Gk rszjtkokban azt kell csinlni, amit ezekben az s1 , . . . , sk egyenslyi stratgik diktlnak, a G gykerben pedig azt az lt kell vlasztani, amely ahhoz a rszjtkhoz vezet, amelyben az 1. jtkos kizetse a legnagyobb. Mskppen, vlasszuk azt az lt, amelyen elindulva olyan rszjtkba jutunk, ahol az gyobb. Az gy
fi , (i = 1, . . . , k) kizetsvektor nyert 1 , s2 , . . . , sk stratgiaprol s 1.
els komponense a legnaa
G
egyenslypontja.
Az
indukcis feltevs miatt egyetlen jtkosnak sem rdemes a rszfkban stratgit vltoztatni, az jtkosnak pedig a gykrben sem, hiszen az
1 s
stratgia olyan rszjtkba vezeti, amelyben maximlis lesz a kizetse. A bizonyts menetbl az is ltszik, hogy az gy nyert egyenslypont rszjtk tkletes, hiszen rszjtkok egyenslypontjaibl ptettk fel a egyenslypontjt. A fenti ttel nemcsak egy egzisztenciattel, hanem egyttal mdszert is ad arra, hogy egy egyenslypontot meghatrozzunk. Tulajdonkppen a dinamikus programozs mdszert hasznltuk, amit ebben a jtkelmleti sszefggsben
G
visszafel indukci nak
(backward induction) neveznk.
3.13. plda.
Tekintsk a 3.8. brn lthat ft, amelynek vgpontjainl a
kt jtkos kizetseit is megadtuk. Minden egyes cscspontnl feltntettk a kt jtkosnak az ezzel a ponttal, mint gykrrel kezdd rszjtkban elrhet egyenslyi kizetseit. Vastag vonal jelzi az egyenslyi utat, teht azt a jtszmt, amely akkor jn ltre, ha mind a kt jtkos az (egyetlen) egyenslyi stratgijt jtssza.
1. jtkos: 5 2. jtkos: 2
m (8, 5) r 2. jtkos e e e e ed e k e e 1. jtkos (6, 1) r (7, 3) e r (3, 2) r (8, 5)e r f f f f f f f f h fb f f f f f f f fr fr fr fr r r r r
l 4 (7, 3) r44 4
r 4
(8, 5)
1. jtkos
4
6 1
3 8
7 3
3 2
2 8
7 8
8 5
3.8. bra. A 3.13. plda jtkfja A 3.12. ttel bizonytsbl ltszik, hogy ha minden jtkosnak csupa
klnbz kizetse van a vgpontokban, akkor csak egyetlen egyenslypont
3.3. NASH-EGYENSLY S RSZJTK TKLETESSG
51
van, hiszen a maximumot ad l kivlasztsa ebben az esetben minden dntsi pontban egyrtelm. Vegyk szre, hogy a visszafel indukci, mint mdszer az egyenslypont(ok) meghatrozsra mennyire fgg a tkletes informci s a kztudott racionalits felttelezstl. A jtkosok ltal hozott maximalizl dntsek csak akkor lljk meg a helyket, ha valamennyien felttelezik, hogy a jtk a tovbbiakban szintn ilyen maximalizl dntsek eredmnyekppen halad tovbb. Ezek a felttelezsek bizonyos esetekben olyan eredmnyekhez is vezethetnek, amelyek intuitv elfogadsa elg nehz.
3.14. plda
(Szzlb jtk)
.
Kt jtkos a kvetkez jtkot jtssza. Egy
egy rme van.
A dnthet gy, hogy elveszi a nagyobbikat, vagy tadja a lps jogt Blnak. Az els esetben vget r a jtk, A a nagyobbik oszlopot, B aa nagyobbik oszlophoz s tadja a lps jogt is tadhatja a kvetkez lps jogt bik oszlophoz tesz hozz kt rmt tadva
jtkvezet kt pnzoszlopot helyez
Anna el, az egyikben kett, a msikban
kisebbiket kapja. A msodik esetben a jtkvezet kt pnzrmt hozztesz a jtkbl s elviheti a nagyobbik oszlopot, a kisebbiket
A-nak hagyva. De A-nak. Ekkor a jtkvezet a kisebs A most is vagy a nagyobb oszlopot50lpspr
B-nek,
aki szintn kiszllhat
vlasztja s azt elviszi nyeremnyknt, vagy folytatja a jtkot a lps jogt
B-nek.
A jtkvezet pedig felvltva hol a nagyobbik oszlophoz, hol
a kisebbikhez tesz hozz kt rmt. A jtk gy folytatdik s
(100 lb) utn vget r azzal, hogy aki ppen soron van, elviszi a nagyobbik pnzoszlopot, a msik pedig a kisebbet. A jtkfa a 3.9. brn lthat.
A q
Be
qB
Be
qB
Be
q(102,101)
Ki (2,1)q q
Ki (1,4)q
Ki (99,102)3.9. bra. Szzlb jtk
A fenti jtkra alkalmazva a visszafel indukcit, azt a meglep eredmnyt kapjuk, hogy a jtk szinte el sem kezddik, mert az egyetlen egyenslypontban
A
mr az els lpsben kiszll s elviszi a kt rmt,
B-re sor sem kerl
s meg kell elgedjk egy rmvel. Ez azrt meglep, mert minden lpsben
52
3. FEJEZET. JTKOK EXTENZV FORMBAN
kettvel n a kt jtkos ssznyeresge, s ha elg sokig jtszank a jtkot, akkor nagyobb nyeresget rhetnnek el mindketten, mint az egyenslyi stratgiikkal. A bizalom hinya mindkt jtkost sjtja, hasonlan, mint a
Fogolydilemm ban.
3.4. Kevert s viselkedsi stratgikHa egy extenzv formban adott jtk nem tkletes informcis, akkor semmi garancia nincs arra, hogy a tiszta stratgik halmazn egyenslypontja legyen. Itt is lehet azonban alkalmazni egy ltalnos egzisztenciattelt (2.14. ttel), amely szerint a kevert bvtsnek van egyenslypontja. Ha teht felrjuk a jtkot (teljes vagy reduklt lsd a 3.3. feladatot) norml formban, akkor a kevert bvts minden stratgija egy valsznsgeloszls a tiszta stratgik vges halmazn. Mskppen is elkpzelhet a randomizls egy extenzv formban adott jtkban (lsd a 3.7. dencit). Tekintsk az minden informcis halmazhoz, ahol az sgeloszlst, amely szerint az
i jtkost. Rendeljnk hozz i jtkosnak kell lpnie, egy valszn-
i jtkos vletlenszeren vlaszt tovbbhaladsi
irnyt. A vlasztsok az egyes informcis halmazokon egymstl fggetlenek s a jtkosok vlasztsai is fggetlenek egymstl. Ez tulajdonkppen egy stratgia, magatartsterv, amely azonban csak egy valsznsgeloszls erejig ad utastst az egyes informcis halmazoknl arra, hogy merre haladjon tovbb a jtk. Egy ilyen stratgit xed) stratgitl. A viselkedsi stratgik sokkal letszerbbek, mint a kevert stratgik. A randomizlshoz nem kell elvgezni a legtbbszr risi, praktikusan sokszor lehetetlen tmenetet az extenzv formbl a norml formba. A viselkedsi stratgik sokkal kzelebb llnak ahhoz a vletlenszer tovbbhalads vlasztshoz, ahogyan valdi jtkosok (pl. a sakkozk) keverik vlasztsi lehetsgeiket. Mi a viszony a kevert s a viselkedsi stratgik kztt? Teljes ekvivalencit a kett kztt nem vrhatunk, hiszen az nak
viselkedsi
(behavioral) stratginak
neveznk, megklnbztets vgett a tiszta stratgikon kpzett
kevert
(mi-
i
jtkos viselkedsi stratgii-
Bi halmaza j (cij 1) j cij 1 dimenzis, ahol cijlasztsi lehetsgek szma.
dimenzis, mg a kevert stratgik az
Ki
halmaza
i
jtkos
j
informcis halmazban lev v-
Hogy rtsk akkor az ekvivalencit? Azt mondjuk, hogy egy kevert s egy viselkedsi stratgia
eredmny-ekvivalens, ha ugyanazt a valsznsgeloszlst
generljk a jtkfa vgpontjain, vagyis ha brmely vgpont elrsnek valsznsge ugyanaz a kevert s a viselkedsi stratgia alkalmazsa esetn. A
3.4. KEVERT S VISELKEDSI STRATGIK
53
viselkedsi stratgibl termszetes mdon tudunk egy eredmny-ekvivalens kevert stratgit ellltani. Els ltsra gy tnik, mintha minden kevert stratgit is el lehetne lltani eredmny-ekvivalens viselkedsi stratgival. Ennek a problmnak az ltalnos trgyalsa a kompliklt jellsek miatt nehzkes, ezrt kt pldt mutatunk be, mieltt mondannk.
Kuhn
msodik ttelt ki-
3.15. plda.vlaszt
Tekintsk a 3.10. brn lthat extenzv formban adott jt-
kot, amelyben az
1.
jtkos, majd a
2.
jtkos s utna ismt az
1.
jtkos
J
s
B
kztt. Az
1.
jtkosnak
3
(trivilis) informcis halmaza, a
2.
jtkosnak egy kt pontbl ll informcis halmaza van. A teljes norml formban a
2. jtkosnak kt tiszta stratgija van: B s J . Az 1. jtkosnak 8 darab: JJJ , JJB , JBJ , JBB , BJJ , BJB , BBJ , s BBB (pl. a JBJ azt jelenti, hogy az 1. pontban J , a 3.-ban B a 4.-ben J az 1. jtkos vlasztsa) Tekintsk azt a viselkedsi stratgiaprost, amelyben az 1. jtkos v, t s s valsznsggel vlasztja a J -t s 1 v, 1 t, 1 s valsznsggel a B -t az 1., 3., s 4. dntsi pontokban, mg a 2. jtkos az egyetlen informcis halmazban w valsznsggel vlasztja J -t s 1 w valsznsggel a B -t. (0 v, t, s, w 1). Legyen most a (p1 , p2 , p3 , p4 , p5 , p6 , p7 , p8 ) valsznsgi vektor (a sorrend fontos, teht pl. p6 a BJB tiszta stratgia valsznsgi slyt jelli) az 1. jtkos, (w, 1 w) pedig a 2. jtkos egy kevert stratgija. Ekkor a hatvgpont elrsi valsznsgeit felrhatjuk a viselkedsi s a kevert stratgik alapjn is. Vgpont elrsi valsznsgek kevert s viselkedsi stratgikkal szmolva:
V egpont Kevert V iselkedsi e a w(p1 + p2 ) wvt b w(p3 + p4 ) wv(1 t) c (1 w)(p1 + p2 + p3 + p4 ) (1 w)v d w(p5 + p6 + p7 + p8 ) w(1 v) e (1 w)(p5 + p7 ) (1 w)(1 v)s f (1 w)(p6 + p8 ) (1 w)(1 v)(1 s)Vegyk most az
1.
jtkost. Egyszer szmolssal igazolhatjuk, hogy a
viselkedsi stratgikbl nyert
(vts, vt(1 s), v(1 t)s, v(1 t)(1 s), (1 v)ts, (1 v)t(1 s), (1 v)(1 t)s, (1 v)(1 t)(1 s))
54
3. FEJEZET. JTKOK EXTENZV FORMBAN
kevert stratgia ugyanazokat a vgpont elrsi valsznsgeket adja, mint a kevert stratgibl szmolt
v = p1 + p2 + p3 + p4 p1 + p2 t= p1 + p2 + p3 + p4 p5 + p7 s= p5 + p6 + p7 + p8viselkedsi stratgia.
v 4 J 4 4 r4 2. e e w e1w e er 3. r f c f t J f1 t Bf fr r 4
r 4
1. 1 B v r
1. jtkose e eB J e e r 4. 1. jtkos r f d f s B f1 s J f fr r
2. jtkos
a
b
e
f
3.10. bra. A 3.15. plda jtkfja Lthattuk, hogy a fenti pldban a viselkedsi s a kevert stratgik eredmny-ekvivalensek voltak. Nincs azonban ez mindig gy.
3.16. plda.elszr a Mivel a
Tekintsk azt az extenzv formban adott jtkot, amelyben 1 lp s valsznsggel megy jobbra vagy balra, a jtk 2 tovbbi lefolyst a 3.11. bra mutatja.
V letlen 2.
jtkosnak csak egy dntsi pontja van, a kevert s viselked1 valsznsggel indul (J)obbra si stratgii egybeesnek. Tegyk fel, hogy 2 vagy (B)alra. Az 1. jtkos viselkedsi stratgii egy (v, u) szmprossal jellemezhetk, ahol halmazban
v
annak a valsznsgt jelenti, hogy a fels informcis
u pedig azt a valsznsget, amellyel az als informcis halmazban megy J irnyba. Legyen az 1. jtkos egy kevert stra1 tgija az, amelyben valsznsggel vlasztja a JB s a BJ stratgijt 2irnyba megy, (az els bet a fels informcis halmazban, a msodik az als informcis halmazban val vlasztst mutatja). Megmutatjuk, hogy nincs olyan viselkedsi stratgia, amely ezzel eredmny-ekvivalens lenne. Szmoljuk ki a hat vgpont elrsi valsznsgeit a viselkedsi s az adott kevert stratgia
J
3.4. KEVERT S VISELKEDSI STRATGIK
55
alapjn. A vgpont elrsi valsznsgek kevert s viselkedsi stratgikkal szmolva:
V egpont Kevert a b c d e f 1 4 1 4 0 1 8 1 8 1 4
V iselkedsi e 1 v 2 1 (1 v)u 2 1 (1 v)(1 u) 2 1 u 4 1 (1 u) 4 1 4 v s u rtkre sem lehet egyenl,
Ennek a tblzatnak a kt oszlopa semmilyen ekvivalens.
teht ezzel a kevert stratgival egyetlen viselkedsi stratgia sem eredmny-
r 41 2
V
4
4 4J
B
1 2
4 r 2. jtkos 4 r4 jtkos 1. e e e e e 1 1 v Bee 1 v J 2 J B e 2 e e e r 1. jtkos r er e e r f f a f f f u f 1 u Bf f f J f f fr fr r r
b
c
d
e
3.11. bra. A 3.16. plda jtkfja Mi lehet ennek az oka? Mi a klnbsg a 3.15. s a 3.16. pldban vizsglt
56
3. FEJEZET. JTKOK EXTENZV FORMBAN
jtkok kztt? A 3.15. plda jtka tkletes emlkezet volt, mg a 3.16. pldban szerepl jtk nem, hiszen az
1.
jtkosnak, amikor msodszor lp,
tudnia kellene, hogy az informcis halmaznak melyik pontjban van, ha gyelemmel ksrte volna, hogy mi trtnt addig s ezt nem felejtette el. Ez a klnbsg ltalban is dnt abban, hogy van-e minden kevert stratgihoz vele eredmny-ekvivalens viselkedsi stratgia.
3.17. ttel (Kuhn). Minden tkletes emlkezet jtkban, minden kevert stratgihoz van egy vele eredmny-ekvivalens viselkedsi stratgia.Bizonyts.A bizonyts tlsgosan terjedelmes s technikai. Az rdekld olvas megtallhatja pldul [Forg et al. (1999)]-ban.
3.5. Feladatok
3.1. feladat. 3.2. feladat. 3.3. feladat.
rjuk fel extenzv formban a 3.6. pldban megadott jtkot
mskppen (V s
B
sorrendjnek felcserlsvel).
Adjunk pldt arra, hogy kt, klnbz extenzv formban
adott jtk teljes norml formi megegyeznek. Elszr egy denci: Legyen
G = {N, {Si }iN , {fi }iN } egy norml formban adott jtk. Nevezzk az i jtkos tetszleges si s si stratgiit ekvivalenseknek, ha minden si Si -re fi (si , si ) = fi (si , si ).az
3.18. denci.
G jtk reduklt norml formja a G = {N, {Si }iN , {fi }iN }, ahol Si i jtkos stratgiinak si ekvivalenciaosztlyai ltal alkotott halmaz, s minden i N -re fi : iN Si R olyan fggvny, hogy fi (s) = fi (s) minden s s-re.A Adjunk pldt arra, hogy kt, klnbz extenzv formban adott jtk teljes norml formi nem egyeznek meg, de reduklt norml formik megegyeznek.
3.4. feladat.
rjuk fel a 3.6.
pldban szerepl jtk azon stratgiaprol-
jait, amelyek a teljes norml formban szerepelnek, de a reduklt norml formban nem.
3.5. feladat. Mutassuk meg, hogy a 3.14. pldban ismertetett jtk esetn A (Be, . . . , Be, Ki, Ki) stratgija ellentmond a kztudott racionalitsfeltevsnek.
3.5. FELADATOK
57
3.6. feladat.
Adjunk pldt arra, amikor egy extenzv formban adott jtk
teljes norml formjban kt klnbz kevert stratgihoz tartoz viselkedsi stratgik megegyeznek.
3.7. feladat.
Kt jtkos a kvetkez jtkot jtssza (egyszerstett snbli).
Egymstl fggetlenl, gy, hogy a msik ne lssa,
0, 1
vagy
2
pnzrmt
rejtenek el. Elbb az els jtkos tippeli meg, hogy sszesen hny pnz van elrejtve. A msik jtkos ezt hallja, majd is tippel, de azt amit hallott mr nem tippelheti. el. Blls nem megengedett, teht nem szabad olyant tippelni, ami a sajt elrejtett pnzek szmt adottnak vve nem fordulhat Aki tall, nyer egy egysget a msik