Transcript
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Strategie kwantowe w teorii gier
Adam Wyrzykowski
Uniwersytet Jagielloński
adam.wyrzykowski@uj.edu.pl
18 stycznia 2015
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Plan prezentacji
1 Gra w odwracanie monety (PQ penny flip)
2 Podstawy klasycznej teorii gierWojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
3 Strategie kwantowe w Wojnie płciKwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
4 Kwantowy Paradoks więźnia
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Gra w odwracanie monety (PQ penny flip)
Zasady gry
Gracze Q i P nie znają bieżącej orientacjimonety ani ruchów przeciwnika.Początkowo moneta jest ustawionareszką do góry. Ruch każdego z graczypolega na odwróceniu monety lubpozostawieniu jej stanu bez zmian.Kolejność ruchów jest następująca:
pierwszy ruch gracza Q,
ruch gracza P,
kończący rozgrywkę ruch gracza Q.
Jeżeli końcowy stan monety to reszka,wygrywa Q, jeżeli orzeł – wygrywa P.
NN NF FN FFN -1 1 1 -1F 1 -1 -1 1
Tabela : Tabela wypłat gracza P
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie gry w odwracanie monety
|ψ >= a|R > +b|O >
aa∗ + bb∗ = 1
|R >↔(
10
)|O >↔
(01
)
Strategie klasyczne
Liniowa kombinacja odwróceniamonety z prawdopodobieństwemp i pozostawienia jej stanu bezzmian z pr-stwem (1− p):
UP = p
(0 11 0
)+(1−p)
(1 00 1
)
Strategie kwantowe
Operacje unitarne:
UQ =
(c dd∗ −c∗
),
gdzie |c|2 + |d |2 = 1.Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Przewaga strategii kwantowych
|ψ1 >= UQ |R >= 1√2
(1 11 −1
)(10
)= 1√
2
(11
)= 1√
2(|R > +|O >) (1)
|ψ2 >= UP |ψ1 >= 1√2
(p
(0 11 0
)+ (1− p)
(1 00 1
))(11
)= 1√
2
(11
)(2)
|ψ3 >= UQ |ψ2 >= 1√2
1√2
(1 11 −1
)(11
)=
(10
)= |R > (3)
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
Wojna płci
Rysunek : Macierz wypłat (źródło obrazka [2]).
α > β > γ
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
Definicje i pojęcia (cz. 1)
Statyczna gra o pełnej informacji
Każdy z graczy zna dostępne strategie innych i wynikające znich wypłaty, ale poznają wybrane przez nich strategie dopierowraz z końcem gry. Należy określić:
liczbę graczy i = 1, 2, ...,N;
zbiory strategii dla każdego gracza {sαi };funkcje wypłaty $i = $i (s1, s2, ..., sN), które przypisują i−temugraczowi liczbę rzeczywistą (wypłatę) w zależności odstrategii wybranych przez wszystkich graczy.
W przypadku Wojny płci i = 2, zbiór strategii Alicji (Boba) to{O,T}, zaś funkcje wypłaty $1(s1, s2) oraz $2(s1, s2) są określoneprzez macierz wypłaty, np. $1(O,O) = $2(T ,T ) = α.
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
Definicje i pojęcia (cz. 2)
Mocna dominacja strategii
Strategię i−tego gracza si nazywamy ściśle zdominowaną przezstrategię s̃i , jeżeli:
$i (s1, ..., si , ..., sN) < $i (s1, ..., s̃i , ..., sN)
dla każdego wyboru (s1, ..., si−1, si+1, ..., sN).
Równowaga Nasha
Zespół strategii (s?1 , s?2 , ..., s
?N) stanowi równowagę Nasha, jeżeli dla
każdego gracza i zachodzi:
$i (s?1 , ..., s
?i−1, s
?i , s
?i+1, ..., s
?N) $i (s
?1 , ..., s
?i−1, si , s
?i+1, ..., s
?N)
dla każdej strategii si dostępnej dla i−tego gracza.Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
Definicje i pojęcia (cz. 3)
Strategie mieszane
Strategia mieszana dla i−tego gracza to rozkładprawdopodobieństwa, który przypisuje pr-stwo pαi każdej czystejstrategii sαi ze zbioru strategii i−tego gracza. Wówczas$i (s1, s2, ..., sN) jest zastępowane przez funkcję oczekiwanejwypłaty:
$̄i ({p1}, {p2}, ..., {pN}) =∑
α1,α2,...,αN
pα11 pα2
2 ...pαNN $i (s
α11 , sα2
2 , ..., sαNN )
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Wojna płciDefinicje i pojęciaRównowagi Nasha w Wojnie płci
Równowagi Nasha w Wojnie płci
p−prawdopodobieństwo, że Alicja wybierze operę, p ∈ [0, 1]q−prawdopodobieństwo, że Bob wybierze operę, q ∈ [0, 1]
$̄A(p, q) = p[q(α− 2γ + β) + γ − β] + β + q(γ − β) (4)
$̄B(p, q) = q[p(α− 2γ + β) + γ − α] + α + p(γ − α) (5){$̄A(p?, q?)− $̄A(p, q?) = (p? − p)[q?(α + β − 2γ)− β + γ] 0
$̄B(p?, q?)− $̄B(p?, q) = (q? − q)[p?(α + β − 2γ)− α + γ] 0(6)
p?(1) = 1, q?(1) = 1
$̄A(1, 1) = α
$̄B(1, 1) = β
p?(2) = 0, q?(2) = 0
$̄A(0, 0) = β
$̄B(0, 0) = α
p?(3) = α−γα+β−2γ
q?(3) = β−γα+β−2γ
$̄A = $̄B = αβ−γ2
α+β−2γ
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Kwantowanie gry (cz. 1)
Reguła 1
Przestrzeń strategii Alicji SA (Boba SB) jest dwuwymiarowąprzestrzenią Hilberta:
|ψ >= a|O > +b|T >, |a|2 + |b|2 = 1 .
Na początku gry ustala się dowolny początkowy stan |ψin > zprzestrzeni S = SA ⊗ SB = (|OO >, |OT >, |TO >, |TT >).
Reguła 2
Ruch Alicji (Boba) polega na wykonaniu operacji unitarnej A ∈ SA
(B ∈ SB) na jej (jego) kubicie stanu |ψin >. Końcowy stan wynosi|ψfin >= A⊗ B|ψin >.
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Kwantowanie gry (cz. 2)
Reguła 3
Wartości $̄A i $̄B znajduje się obliczając kwadraty modułów rzutówstanu |ψfin > na wektory bazowe |OO >, |OT >, |TO >, |TT >,a następnie dodając uzyskane liczby przemnożone przezodpowiednie współczynniki z macierzy wypłat.
Reguła 4
Ostatecznie Alicja musi zagrać klasyczną strategię, która wynika zpomiaru na końcowym stanie kwantowym, tzn. z rzutowania|ψfin > na wektory bazowe SA. Podobnie Bob.
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 1)
Skoro |ψin > jest faktoryzowalny, można przyjąć bez stratyogólności |ψin >= |OO >.
W bazie {|O >, |T >} operacje Alicji i Boba mają postać:
A =
(a b−b∗ a∗
)B =
(c d−d∗ c∗
),
gdzie |a|2 + |b|2 = |c |2 + |d |2 = 1.
Stan końcowy wynosi zatem:
|ψfin >= A⊗ B|ψin >=
= ac |OO > −ad∗|OT > −b∗c|TO > +b∗d∗|TT >
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Równowagi Nasha – faktoryzowalne stany |ψin > (cz. 2)
Zgodnie z Regułą 3 znajdujemy więc:
$̄A = |a|2[(α + β − 2γ)|c|2 − β + γ] + β + (γ − β)|c |2 (7)
$̄B = |c|2[(α + β − 2γ)|a|2 − α + γ] + α + (γ − α)|a|2 (8)
Wynik ten jest identyczny jak uzyskany w klasycznej teorii gier,jeżeli p = |a|2 oraz q = |c |2. Równowagi Nasha:
(|a|2 = 0, |c |2 = 0) |ψfin >= |TT > $̄A = β $̄B = α
(|a|2 = 1, |c |2 = 1) |ψfin >= |OO > $̄A = α $̄B = β(|a|2 = α−γ
α+β−2γ , |c |2 = β−γ
α+β−2γ
)$̄A = $̄B = αβ−γ2
α+β−2γ
|ψfin >=(√α−γ|O>−
√β−γ|T>)⊗(
√β−γ|O>−
√α−γ|T>)
α+β−2γ
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Nowe równowagi Nasha – stany splątane
|ψin >= a|OO > +b|TT >, |a|2 + |b|2 = 1
ρA(B)fin = pIρ
A(B)in I †+(1−p)Cρ
A(B)in C † (C |O >= T , C |T >= O)
1 p?(1) = q?(1) = 1
$̄A(1, 1) = α|a|2 + β|b|2 $̄B(1, 1) = β|a|2 + α|b|2
2 p?(2) = q?(2) = 0
$̄A(0, 0) = β|a|2 + α|b|2 $̄B(0, 0) = α|a|2 + β|b|2
3 p?(3) = (α−γ)|a|2+(β−γ)|b|2α+β−2γ q?(3) = (α−γ)|b|2+(β−γ)|a|2
α+β−2γ
$̄A(p?(3), q?(3)) = $̄B(p?(3), q
?(3)) =
αβ + (α− β)2|a|2|b|2 − γ2
α + β − 2γ
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Kwantowanie Wojny płciKwantowa Wojna płci pod nieobecność splątaniaWpływ splątania na kwantową Wojnę płci
Ostateczny kompromis
1. Brak samotnych wieczorów
$̄A(1, 1) + $̄B(1, 1) = $̄A(0, 0) + $̄B(0, 0) = α + β
2. Równowagi Nasha 1 i 2 można ”połączyć”
{$̄A(1, 1)− $̄A(0, 0) = (α− β)(|a|2 − |b|2)
$̄B(1, 1)− $̄B(0, 0) = (α− β)(|b|2 − |a|2)
kompromis=⇒ |a| = |b| = 1√
2
3. Najlepsza strategia
|ψin >=1√2
(|OO > +|TT >) = |ψfin >
(p? = 0, q? = 0) albo (p? = 1, q? = 1) ⇒ $̄A = $̄B =α + β
2Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Paradoks więźnia – klasyczne i kwantowe sformułowanie
Bob: C Bob: DAlice: C (3,3) (0,5)Alice: D (5,0) (1,1)
|ψf >= J†(UA ⊗ UB)J|CC > (9)
U(θ, φ) =
(e iφ cos θ/2 sin θ/2− sin θ/2 e−iφ cos θ/2
)(10)
U(0, 0) = C =
(1 00 1
)U(π, 0) = D =
(0 1−1 0
)U(0, π2
)= Q =
(i 00 −i
)
J = exp[iγD ⊗ D
2
]γ ∈ [0, π/2] – wsp. splątania (11)
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Paradoks więźnia - gra separowalna (γ = 0)
Rysunek : Wypłata Alicji w grze separowalnej. Na wykresie wybrano specjalnąparametryzację, w której UA i UB zależą tylko od jednego parametrut ∈ [−1, 1]: przyjmujemy UA = U(tπ, 0) dla t ∈ [0, 1] oraz UA = U(0,−tπ/2)dla t ∈ [−1, 0) (podobnie dla Boba). Zdrada D odpowiada t = 1, współpraca Cto t = 0, a strategia Q jest reprezentowana przez t = −1 (źródło obrazka [3]).
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Paradoks więźnia - maksymalne splątanie (γ = π/2)
Rysunek : Wypłata Alicji w grze o maksymalnym splątaniu (źródłoobrazka [3]).
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Podsumowanie
Poszerzenie przestrzeni dostępnych strategii o strategiekwantowe może prowadzić do powstawania nowych równowagNasha i znikania dotychczasowych.
Zastosowanie strategii kwantowych może prowadzić dorozwiązań korzystniejszych dla obu graczy, klasycznieniedostępnych.
Szczególną rolę w grach kwantowych spełnia splątanie stanu,na krórym operacje mogą wykonywać gracze.
Gracz dysponujący strategią kwantową grający przeciwkograczowi korzystającemu wyłącznie ze strategii klasycznych naogół będzie posiadać przewagę.
Adam Wyrzykowski Strategie kwantowe w teorii gier
Gra w odwracanie monety (PQ penny flip)Podstawy klasycznej teorii gier
Strategie kwantowe w Wojnie płciKwantowy Paradoks więźnia
Literatura
[1] David A. Meyer (1999)
Quantum strategies
Physical Review Letters 82 (5), 1052–1055.
[2] L. Marinatto, T. Weber (2000)
A quantum approach to static games of complete information
Physics Letters A 272, 291–303.
[3] J. Eisert, M. Wilkens, M. Lewenstein (1999)
Quantum games and quantum strategies
Physical Review Letters 83 (15), 3077–3080.
[4]
http://mindyourdecisions.com/blog/2012/09/11/quantum-coin-flipping-game-theory/
Adam Wyrzykowski Strategie kwantowe w teorii gier
top related