軍備拡張ゲームにおける スパイ均衡

軍備拡張ゲームにおける
スパイ均衡
Arms Races and Espionage
軍備拡張ゲーム
2.2
Baliga and Sjöström (2004) で定義された軍備拡張ゲームの
構造は以下のように表される。B は ”Build a new weapon ”, N
は ”No new weapon ” の頭文字である。
B
N
公共システムプログラム
12 01350 磯部 宇彰 Yasuaki Isobe
指導教員 河崎 亮 Ryo Kawasaki
研究背景
1
2013 年、アメリカは 3.5 兆ドルの国家予算のうち 526 億ドル
を CIA や NSA などの情報機関に与えた [1]。またイスラエルも、
約 3950 億ドルの国家予算のうち約 19 億ドルの予算を情報機関
につぎ込んでいる [3]。このようにスパイ活動は現在も活発に行
われているが、ゲーム理論においてスパイ活動の影響を分析した
研究は少ない。
2 人双行列ゲームにおいてスパイ活動をモデルに組み込んだ
研究として Solan and Yariv (2004) がある。Solan and Yariv
(2004) では、情報完備な 2 人双行列ゲームにおいてプレイヤー
1 がプレイヤー 2 の戦略についての情報をスパイすることができ
るゲームを分析している。
本研究は、Baliga and Sjöström (2004) によって定義された軍
備拡張ゲーム (arms race game) にスパイ活動を組み込むことに
よって「平和的な均衡」を導き出すものである。このモデルは 2
国間の兵器開発競争を表したものであり、Baliga and Sjöström
(2004) はチープトークを行うことによって、行わない場合より
も高い確率で平和的な均衡が実現されることを示した。
先行研究
2
2.1
スパイゲーム
プレイヤーの集合を {1,2} とし、I = {1, 2, ..., n} をプレイ
ヤー 1 の戦略の集合、J = {1, 2, ..., m} をプレイヤー 2 の戦略
の集合とする。A = (aij ), B = (bij ) を戦略の組 (i, j) に対応す
るプレイヤー 1 とプレイヤー 2 の利得とする。(A, B) は通常の
双行列ゲームである。これに対し、以下のような拡張モデル (ス
パイゲーム)G = (A, B, S, Q, ϕ) を考える。
1. (A,B) は通常の双行列ゲーム
2. S はシグナルの集合を表し、有限集合であるとする。
3. Q は関数 q : J → ∆(S) の集合。ただし ∆(S) は S 上の確
率分布の集合。
4. ϕ : Q → R は費用関数
ゲームは以下の 4 段階でプレイされる。
Stage 1 プレイヤ− 2 が行動 j ∈ J を選ぶ。
Stage 2 プレイヤー 1 があるスパイ q ∈ Q を選択する。
Stage 3 プレイヤー 1 がシグナル s ∈ S を受け取る。ただし
Pr(s|j) = q(j)[s]。
Stage 4 プレイヤー 1 が 行動 i ∈ I を選ぶ。
Stage 1 から Stage 4 の結果、プレイヤー 1,2 の利得の組は
(aij −ϕ(q), bij ) となる。
Q はスパイの集合であり、q は 1 人のスパイに対応するもの
である。Stage 2 でプレイヤー 1 はスパイの集合 Q の中からあ
るスパイ q を選んで採用する。スパイはプレイヤー 1 に対して
あるシグナル (情報)s ∈ S を送る。そして、プレイヤー 1 はスパ
イの情報に基づいて行動を選択する。スパイゲームにおける完全
ベイジアン均衡をスパイ均衡と称する。
B
−c1 , −c2
−d, µ − c2
N
µ − c1 , −d
0, 0
d > c 1 , d > c2 , d > µ
d > 0 は相手国のみ兵器開発をした場合の自国の損失、µ > 0 は
自国のみ兵器開発をした場合の利得、c1 ≥ 0, c2 ≥ 0 はプレイ
ヤー 1,2 の兵器開発コストをそれぞれ表している。また、c1 , c2
の値は各プレイヤーの私的情報であるとし、その分布関数を F (c)
とする。つまり F (c) = Pr(ci < c), ∀c ∈ [0, c̄] である。
3.1 ではまず c1 , c2 の情報不完備性を取り除いたモデルを仮定
し分析する。次に 3.2 及び 3.3 では µ < c1 を共有知識、c2 は
プレイヤー 2 の私的情報であるとして分析する。
軍備拡張ゲームのスパイ均衡
3
以下の例では、費用関数 ϕ(q) について
ϕ( 12 ) = 0, limq→1 ϕ(q) = ∞, ϕ′ (q) ≥ 0, ϕ′′ (q) > 0 が成り立つ
と仮定する。
3.1
情報完備のケース
ゲームを以下の手順で行う。
Stage 1 プレイヤ− 2 が行動 j ∈ {B, N } を選択する。
Stage 2 プレイヤー 1 があるスパイ q ∈ [ 12 , 1) を選択する。プ
レイヤー 1 は費用 ϕ(q) を支払う。
Stage 3 プレイヤー 1 がシグナル s ∈ {B, N } を受け取る。た
だし Pr(s = B|j = B) = Pr(s = N |j = N ) = q.
Stage 4 プレイヤー 1 が行動 i ∈ {B, N } を選択する。
このようなゲームにおいて以下の結果が成り立つ。
結果 1 情報完備な軍備拡張ゲームにおいて (1)c1 ≤ µ ならば、
プレイヤー 1 は Stage 2 で q = 12 を選択し、Stage 4 で行動
B を選択する。これに対しプレイヤー 2 は Stage 1 で B を選択
する。よって、戦略の組 (( 12 , B), B) が均衡となる。(2)c1 > µ
ならば、プレイヤー 2 は Stage 1 において純粋戦略 B,N のい
ずれかを選択し、プレイヤー 1 は Stage 2 で q = 21 、Stage 4
で純粋戦略 B,N のうちプレイヤー 2 と同じものを選択すること
が最適である。つまり戦略の組 (( 21 , B), B), (( 12 , N ), N ) が均衡
となる。
3.2
情報不完備のケース
Solan and Yariv (2004) では情報完備なゲームに対する分析
のみを行っていたが、本研究ではスパイゲームの概念を情報不完
備ゲームにも拡張する。拡張の方法として 3.2.1 と 3.2.2 を考
える。また、c1 > µ を仮定する。
3.2.1
相手の行動を探る場合
c2 を私的情報とし、次の Stage 0 から Stage 4 の 5 段階で
ゲームを行う。
Stage 0 自然が c2 ∈ [0, c̄] を決定する。c2 は累積分布関数 F (c)
に従う。
Stage 1 プレイヤ− 2 が行動 j ∈ {B, N } を選択する。
Stage 2 プレイヤー 1 がスパイ q ∈ [ 12 , 1) を選択する。プレイ
ヤー 1 は費用 ϕ(q) を支払う。
Stage 3 プレイヤー 1 がシグナル s ∈ {B, N } を受け取る。た
だし Pr(s = B|j = B) = Pr(s = N |j = N ) = q.
Stage 4 プレイヤー 1 が行動 i ∈ B, N を選択する。
• Stage 4 において、(1)s =Hawk のときに事後確率を用い
て算出される行動 B の期待利得が行動 N の期待利得を上回
り、(2)s =Dove のときに事後確率を用いて算出される行動
N の期待利得が行動 B の期待利得を上回っている。
このとき、以下の戦略の組 (i), (ii) がスパイ均衡となるための
条件を求める。
(i) プレイヤー 2 はある値 c∗ を定めて、c2 ≤ c∗ ならば B を、
c2 > c∗ ならば N を選択する。
• Stage 2 において、戦略 (ii’) を用いた時の期待利得が純
粋戦略 B,N 及びすべての q ̸= q ∗ を用いた時の期待利得を
上回っている。
∗
(ii) プレイヤー 1 はスパイ q を選択する。その結果 s = B な
ら B を選択し、s = N なら N を選択する。
• Stage 1 において、c2 ≤ c∗ のとき B の期待利得が N の期
待利得を上回り、c2 > c∗ のとき N の期待利得が B の期待
利得を上回る。
(i), (ii) がスパイ均衡となるためには、以下の条件が必要である。
• Stage 4 において、(1)s =B のときに事後確率を用いて算
出される行動 B の期待利得が行動 N の期待利得を上回り、
(2)s =N のときに事後確率を用いて算出される行動 N の期
待利得が行動 B の期待利得を上回っている。
結果 3 条件 (∗) が満たされていれば (i’), (ii’) が均衡戦略とし
て存在する。
ただし、
• Stage 2 において、戦略 (ii) を用いた時の期待利得が純粋
戦略 B,N 及びすべての q ̸= q ∗ を用いた時の期待利得を上
回っている。
• Stage 1 において、c2 ≤ c∗ のとき B の期待利得が N の期
待利得を上回り、c2 > c∗ のとき N の期待利得が B の期待
利得を上回る。
結果 2 軍備拡張ゲームにおいて c2 の値がプレイヤー 2 の私的
情報であるとしたとき、
q ∗ ϕ′ (q ∗ ) − ϕ(q ∗ ) > F (c∗ )(d − c1 ),
q ∗ ϕ′ (q ∗ ) − ϕ(q ∗ ) > (1 − F (c∗ ))(c1 − µ),
µ − c1
1
p3 <
< p1 , ϕ′ ( ) < F (c∗ )(d + µ − 2c1 ) + c1 − µ
µ−d
2
が満たされていれば (i), (ii) が均衡戦略として存在する。(上記
の条件を条件 (∗) とする)
ただし、
ϕ′ (q ∗ ) = F ((1 − q ∗ )(µ + d))(d + µ − 2c1 ) + c1 − µ,
c∗ = (1 − q ∗ )(µ + d),
F (c∗ )q ∗
,
+ (1 − F (c∗ ))(1 − q ∗ )
F (c∗ )(1 − q ∗ )
p3 = Pr(B|s = N ) =
.
F (c∗ )(1 − q ∗ ) + (1 − F (c∗ ))q ∗
p1 = Pr(B|s = B) =
3.2.2
F (c∗ )q ∗
相手のタイプを探る場合
スパイが相手プレイヤーのタイプ、すなわち c2 の値について
の情報を探るモデルを考察する。次の Stage 0 から Stage 4 の
5 段階でゲームを行う。
Stage 0 自然が c2 ∈ [0, c̄] を決定する。c2 は累積分布関数 F (c)
に従う。
Stage 1 プレイヤ− 2 が行動 j ∈ {B, N } を選択する。
Stage 2 プレイヤー 1 がスパイ q ∈ [ 12 , 1) を選択する。プレイ
ヤー 1 は費用 ϕ(q) を支払う。
Stage 3 プレイヤー 1 がシグナル s ∈ {Hawk, Dove} を受け
取る。ただし q = Pr(s = Hawk|c2 ≤ c∗ ) = Pr(s =
Dove|c2 > c∗ ). とし、c∗ は外生的に決定されるとする。
Stage 4 プレイヤー 1 が行動 i ∈ {B, N } を選択する。
このとき、以下の戦略の組 (i’) ,(ii’) がスパイ均衡となるための
条件を求める。
(i’) プレイヤー 2 は c2 ≤ c∗ ならば B を、c2 > c∗ ならば N を
選択する。
ϕ′ (q ∗ ) = F ((c∗ )d + q ∗ µ)(d + µ − 2c1 ) + c1 − µ,
(1 − q)d + qµ ≤ c∗ < (1 − q)µ + qd,
F (c∗ )q ∗
,
+ (1 − F (c∗ ))(1 − q ∗ )
F (c∗ )(1 − q ∗ )
p3 = Pr(c2 ≤ c∗ |s = Dove) =
.
∗
F (c )(1 − q ∗ ) + (1 − F (c∗ ))q ∗
p1 = Pr(c2 ≤ c∗ |s = Hawk) =
4
F (c∗ )q ∗
結論
情報完備を仮定した軍備拡張ゲームにおけるスパイ均衡は、ス
パイの情報を活用しないものになる (結果 1)。軍備拡張ゲームに
情報不完備性を組み込んだゲームでは、特定の条件が満たされれ
ば、スパイの情報を利用する均衡が存在する (結果 2)。軍備拡張
ゲームにおいて相手のタイプについての情報を探るゲームにおい
ても、特定の条件が満たされれば、スパイの情報を利用する均衡
が存在する (結果 3)。
結果 2 と結果 3 を比較する。q ∗ = 12 の場合を除くと結果 2 の
∗
c の方が小さい。特に q ∗ が 1 に近づけば、c∗ も 0 に近づく。
つまり、3.2 のゲームでは c2 の値が非常に小さくても行動の組
(N,N) が成立する場合がある。このことは、スパイ活動が軍備競
争を緩和する可能性があることを示している。
3.2 のプレイヤー 2 はプレイヤー 1 に対して「自分は平和主義
者である」というシグナル (N を選択すること) を送ることができ
る。それに対して 3.3 のゲームでは、プレイヤー 2 はプレイヤー
1 に対してシグナルを送ることができない。このため、c2 ≤ µ で
あるようなプレイヤー 2 がどんなに平和 (N,N) を願っていたと
しても、プレイヤー 1 が B を選択してくる以上 B を選択せざる
を得なくなる。このため c∗ の値が 3.2 と比較して大きくなって
しまうのである。
本研究では c1 > µ を共有知識としたが、Baliga and Sjöström
(2004) で定義されているように c1 の値も私的情報であるとした
場合についても分析が必要である。その場合、プレイヤーが互い
にスパイを送り合うモデルも考えられる。両プレイヤーが互い
に相手の行動を探る場合、各プレイヤーは事前に「暫定的な行
動」を選択する必要がある。この暫定的な行動は、Baliga and
Sjöström (2004) におけるチープトークと似た役割を果たすと考
えられる。
参考文献
[1] Andrews, W. and T. Lindeman. The Black Budget. Washington Post, Aug 29, 2013. http://www.washingtonpost.com/wpsrv/special/national/black-budget/ (accessed February 8,
2016).
[2] Baliga, S. and T. Sjöström (2004). Arms Races and Negotiations. Review of Economic Studies 71, 351-369.
(ii’) プレイヤー 1 はスパイ q ∗ を選択する。その結果 s = Hawk
なら B を選択し、s = Dove なら N を選択する。
[3] Gohen. G. Shin Bet and Mossad Budget Approaches $2 Billion.
HAARETZ, Jun 09, 2014. http://www.haaretz.com/israelnews/.premium-1.597598 (accessed February 8, 2016).
(i’), (ii’) がスパイ均衡となるためには、以下の条件が必要で
ある。
[4] Solan, E. and L. Yariv(2004). Games with espionage. Games
and Economic Behavior 47, 172-199.