Strategie kwantowe w teorii gier

Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier

Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia

Adam Wyrzykowski

Uniwersytet Jagielloński

adam.wyrzykowski@uj.edu.pl

18 stycznia 2015

Adam Wyrzykowski Strategie kwantowe w teorii gier

Plan prezentacji

1 Gra w odwracanie monety (PQ penny flip)

2 Podstawy klasycznej teorii gierWojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

3 Strategie kwantowe w Wojnie płciKwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

4 Kwantowy Paradoks więźnia

Gra w odwracanie monety (PQ penny flip)

Zasady gry

Gracze Q i P nie znają bieżącej orientacjimonety ani ruchów przeciwnika.Początkowo moneta jest ustawionareszką do góry. Ruch każdego z graczypolega na odwróceniu monety lubpozostawieniu jej stanu bez zmian.Kolejność ruchów jest następująca:

pierwszy ruch gracza Q,

ruch gracza P,

kończący rozgrywkę ruch gracza Q.

Jeżeli końcowy stan monety to reszka,wygrywa Q, jeżeli orzeł – wygrywa P.

NN NF FN FFN -1 1 1 -1F 1 -1 -1 1

Tabela : Tabela wypłat gracza P

Kwantowanie gry w odwracanie monety

|ψ >= a|R > +b|O >

aa∗ + bb∗ = 1

|R >↔(

)|O >↔

Strategie klasyczne

Liniowa kombinacja odwróceniamonety z prawdopodobieństwemp i pozostawienia jej stanu bezzmian z pr-stwem (1− p):

UP = p

(0 11 0

)+(1−p)

(1 00 1

Strategie kwantowe

Operacje unitarne:

(c dd∗ −c∗

gdzie |c|2 + |d |2 = 1.Adam Wyrzykowski Strategie kwantowe w teorii gier

Przewaga strategii kwantowych

|ψ1 >= UQ |R >= 1√2

(1 11 −1

)= 1√

2(|R > +|O >) (1)

|ψ2 >= UP |ψ1 >= 1√2

(0 11 0

)+ (1− p)

(1 00 1

)= 1√

|ψ3 >= UQ |ψ2 >= 1√2

(1 11 −1

)= |R > (3)

Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci

Wojna płci

Rysunek : Macierz wypłat (źródło obrazka [2]).

α > β > γ

Definicje i pojęcia (cz. 1)

Statyczna gra o pełnej informacji

Każdy z graczy zna dostępne strategie innych i wynikające znich wypłaty, ale poznają wybrane przez nich strategie dopierowraz z końcem gry. Należy określić:

liczbę graczy i = 1, 2, ...,N;

zbiory strategii dla każdego gracza {sαi };funkcje wypłaty $i = $i (s1, s2, ..., sN), które przypisują i−temugraczowi liczbę rzeczywistą (wypłatę) w zależności odstrategii wybranych przez wszystkich graczy.

W przypadku Wojny płci i = 2, zbiór strategii Alicji (Boba) to{O,T}, zaś funkcje wypłaty $1(s1, s2) oraz $2(s1, s2) są określoneprzez macierz wypłaty, np. $1(O,O) = $2(T ,T ) = α.

Mocna dominacja strategii

Strategię i−tego gracza si nazywamy ściśle zdominowaną przezstrategię s̃i , jeżeli:

$i (s1, ..., si , ..., sN) < $i (s1, ..., s̃i , ..., sN)

dla każdego wyboru (s1, ..., si−1, si+1, ..., sN).

Równowaga Nasha

Zespół strategii (s?1 , s?2 , ..., s

?N) stanowi równowagę Nasha, jeżeli dla

każdego gracza i zachodzi:

$i (s?1 , ..., s

?i−1, s

?i , s

?i+1, ..., s

?N) $i (s

?1 , ..., s

?i−1, si , s

?i+1, ..., s

dla każdej strategii si dostępnej dla i−tego gracza.Adam Wyrzykowski Strategie kwantowe w teorii gier

Strategie mieszane

Strategia mieszana dla i−tego gracza to rozkładprawdopodobieństwa, który przypisuje pr-stwo pαi każdej czystejstrategii sαi ze zbioru strategii i−tego gracza. Wówczas$i (s1, s2, ..., sN) jest zastępowane przez funkcję oczekiwanejwypłaty:

$̄i ({p1}, {p2}, ..., {pN}) =∑

α1,α2,...,αN

pα11 pα2

2 ...pαNN $i (s

α11 , sα2

2 , ..., sαNN )

Równowagi Nasha w Wojnie płci

p−prawdopodobieństwo, że Alicja wybierze operę, p ∈ [0, 1]q−prawdopodobieństwo, że Bob wybierze operę, q ∈ [0, 1]

$̄A(p, q) = p[q(α− 2γ + β) + γ − β] + β + q(γ − β) (4)

$̄B(p, q) = q[p(α− 2γ + β) + γ − α] + α + p(γ − α) (5){$̄A(p?, q?)− $̄A(p, q?) = (p? − p)[q?(α + β − 2γ)− β + γ] 0

$̄B(p?, q?)− $̄B(p?, q) = (q? − q)[p?(α + β − 2γ)− α + γ] 0(6)

p?(1) = 1, q?(1) = 1

$̄A(1, 1) = α

$̄B(1, 1) = β

p?(2) = 0, q?(2) = 0

$̄A(0, 0) = β

$̄B(0, 0) = α

p?(3) = α−γα+β−2γ

q?(3) = β−γα+β−2γ

$̄A = $̄B = αβ−γ2

α+β−2γ

Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci

Kwantowanie gry (cz. 1)

Reguła 1

Przestrzeń strategii Alicji SA (Boba SB) jest dwuwymiarowąprzestrzenią Hilberta:

|ψ >= a|O > +b|T >, |a|2 + |b|2 = 1 .

Na początku gry ustala się dowolny początkowy stan |ψin > zprzestrzeni S = SA ⊗ SB = (|OO >, |OT >, |TO >, |TT >).

Reguła 2

Ruch Alicji (Boba) polega na wykonaniu operacji unitarnej A ∈ SA

(B ∈ SB) na jej (jego) kubicie stanu |ψin >. Końcowy stan wynosi|ψfin >= A⊗ B|ψin >.

Kwantowanie gry (cz. 2)

Reguła 3

Wartości $̄A i $̄B znajduje się obliczając kwadraty modułów rzutówstanu |ψfin > na wektory bazowe |OO >, |OT >, |TO >, |TT >,a następnie dodając uzyskane liczby przemnożone przezodpowiednie współczynniki z macierzy wypłat.

Reguła 4

Ostatecznie Alicja musi zagrać klasyczną strategię, która wynika zpomiaru na końcowym stanie kwantowym, tzn. z rzutowania|ψfin > na wektory bazowe SA. Podobnie Bob.

Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 1)

Skoro |ψin > jest faktoryzowalny, można przyjąć bez stratyogólności |ψin >= |OO >.

W bazie {|O >, |T >} operacje Alicji i Boba mają postać:

(a b−b∗ a∗

(c d−d∗ c∗

gdzie |a|2 + |b|2 = |c |2 + |d |2 = 1.

Stan końcowy wynosi zatem:

|ψfin >= A⊗ B|ψin >=

= ac |OO > −ad∗|OT > −b∗c|TO > +b∗d∗|TT >

Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 2)

Zgodnie z Regułą 3 znajdujemy więc:

$̄A = |a|2[(α + β − 2γ)|c|2 − β + γ] + β + (γ − β)|c |2 (7)

$̄B = |c|2[(α + β − 2γ)|a|2 − α + γ] + α + (γ − α)|a|2 (8)

Wynik ten jest identyczny jak uzyskany w klasycznej teorii gier,jeżeli p = |a|2 oraz q = |c |2. Równowagi Nasha:

(|a|2 = 0, |c |2 = 0) |ψfin >= |TT > $̄A = β $̄B = α

(|a|2 = 1, |c |2 = 1) |ψfin >= |OO > $̄A = α $̄B = β(|a|2 = α−γ

α+β−2γ , |c |2 = β−γ

α+β−2γ

)$̄A = $̄B = αβ−γ2

α+β−2γ

|ψfin >=(√α−γ|O>−

√β−γ|T>)⊗(

√β−γ|O>−

√α−γ|T>)

α+β−2γ

Nowe równowagi Nasha – stany splątane

|ψin >= a|OO > +b|TT >, |a|2 + |b|2 = 1

ρA(B)fin = pIρ

A(B)in I †+(1−p)Cρ

A(B)in C † (C |O >= T , C |T >= O)

1 p?(1) = q?(1) = 1

$̄A(1, 1) = α|a|2 + β|b|2 $̄B(1, 1) = β|a|2 + α|b|2

2 p?(2) = q?(2) = 0

$̄A(0, 0) = β|a|2 + α|b|2 $̄B(0, 0) = α|a|2 + β|b|2

3 p?(3) = (α−γ)|a|2+(β−γ)|b|2α+β−2γ q?(3) = (α−γ)|b|2+(β−γ)|a|2

α+β−2γ

$̄A(p?(3), q?(3)) = $̄B(p?(3), q

?(3)) =

αβ + (α− β)2|a|2|b|2 − γ2

α + β − 2γ

Ostateczny kompromis

1. Brak samotnych wieczorów

$̄A(1, 1) + $̄B(1, 1) = $̄A(0, 0) + $̄B(0, 0) = α + β

2. Równowagi Nasha 1 i 2 można ”połączyć”

{$̄A(1, 1)− $̄A(0, 0) = (α− β)(|a|2 − |b|2)

$̄B(1, 1)− $̄B(0, 0) = (α− β)(|b|2 − |a|2)

kompromis=⇒ |a| = |b| = 1√

3. Najlepsza strategia

|ψin >=1√2

(|OO > +|TT >) = |ψfin >

(p? = 0, q? = 0) albo (p? = 1, q? = 1) ⇒ $̄A = $̄B =α + β

2Adam Wyrzykowski Strategie kwantowe w teorii gier

Paradoks więźnia – klasyczne i kwantowe sformułowanie

Bob: C Bob: DAlice: C (3,3) (0,5)Alice: D (5,0) (1,1)

|ψf >= J†(UA ⊗ UB)J|CC > (9)

U(θ, φ) =

(e iφ cos θ/2 sin θ/2− sin θ/2 e−iφ cos θ/2

U(0, 0) = C =

(1 00 1

)U(π, 0) = D =

(0 1−1 0

)U(0, π2

)= Q =

(i 00 −i

J = exp[iγD ⊗ D

]γ ∈ [0, π/2] – wsp. splątania (11)

Paradoks więźnia - gra separowalna (γ = 0)

Rysunek : Wypłata Alicji w grze separowalnej. Na wykresie wybrano specjalnąparametryzację, w której UA i UB zależą tylko od jednego parametrut ∈ [−1, 1]: przyjmujemy UA = U(tπ, 0) dla t ∈ [0, 1] oraz UA = U(0,−tπ/2)dla t ∈ [−1, 0) (podobnie dla Boba). Zdrada D odpowiada t = 1, współpraca Cto t = 0, a strategia Q jest reprezentowana przez t = −1 (źródło obrazka [3]).

Paradoks więźnia - maksymalne splątanie (γ = π/2)

Rysunek : Wypłata Alicji w grze o maksymalnym splątaniu (źródłoobrazka [3]).

Podsumowanie

Poszerzenie przestrzeni dostępnych strategii o strategiekwantowe może prowadzić do powstawania nowych równowagNasha i znikania dotychczasowych.

Zastosowanie strategii kwantowych może prowadzić dorozwiązań korzystniejszych dla obu graczy, klasycznieniedostępnych.

Szczególną rolę w grach kwantowych spełnia splątanie stanu,na krórym operacje mogą wykonywać gracze.

Gracz dysponujący strategią kwantową grający przeciwkograczowi korzystającemu wyłącznie ze strategii klasycznych naogół będzie posiadać przewagę.

Literatura

[1] David A. Meyer (1999)

Quantum strategies

Physical Review Letters 82 (5), 1052–1055.

[2] L. Marinatto, T. Weber (2000)

A quantum approach to static games of complete information

Physics Letters A 272, 291–303.

[3] J. Eisert, M. Wilkens, M. Lewenstein (1999)

Quantum games and quantum strategies

Physical Review Letters 83 (15), 3077–3080.

http://mindyourdecisions.com/blog/2012/09/11/quantum-coin-flipping-game-theory/

Strategie kwantowe w teorii gier

Documents

Wstęp do Teorii Gier. Zeus and Athena Zeus Music is a...

Kwantowe Nanostruktury Półprzewodnikowe do Zastosowań w...

Tom 58 2009 Numer 3–4 (284–285) Strony...

Festiwal gier

Wstęp do Teorii Gier. Segregacja Dwa miasta: Est (E) and...

Algorytmy wspomagania decyzji -...

Teoria gier i teoria wymiany w naukach - Festiwal Nauki...

Popularnosc gier...

Modely závislosti - · teorii rozhodování, teorii...

Wprowadzenie do gier n-osobowych. Teoria gier, a polityka....

Kropki kwantowe

Programowanie Gier MMO

ZAŁĄCZNIK 2 Autoreferat przedstawiający opis...

Kwantowe przelewy bankowe – foton na usługach biznesu

GRYstaff.uz.zgora.pl/mpatan/materialy/badoper/wyklady/druk.....

Programowanie gier. Kompendium