ルール生成ゲーム Rule-Generating Games

ルール生成ゲーム
Rule-Generating Games
牛澤
隆司
Ryuji Ushizawa
1
はじめに
タルコット・パーソンズ(1937)によって名付けられた「秩序問題」(Parsons 1937: 89)
とは,
「万人は万人に対する戦争」
(Hobbes 1651: ⅩⅩⅢ. 192)というホッブズが描いた自
然状態において,秩序や規範といったものの成り立ちとその適切さを問題にする.
ホッブズ(1651)は自然状態を「万人は万人に対する戦争」
「人間は人間にとって狼」
(ホ
ッブズ 2008: 4)であると捉えた.自然状態では,能力の平等な個々人が互いに自然権を行
使した結果,自然法が十分に機能しなかったため,万人の万人に対する戦争状態が生じて
いたとした.この状態を脱するために,個々人はお互いに自然状態で有していた自然権を
譲渡することを信約(covenant)し,一つの人格に結合され,コモンウェルス(国家)=
リヴァイアサンが生成する.こうして、社会契約により平和と安全保障ための社会秩序は
実現するのである1.
パーソンズはホッブズの示した解答に対して,行為がどうあるべきかという規範性の思
考が欠落しているとする.そこで用いられる理性は「情念の下僕」であるとして,社会契
約論の不十分さを指摘するのである(Parsons 1937: 89-93).
それでは「秩序問題」を考え,解決するために,どれだけ規範やルールといったものが
貢献するのだろうか.またそれはどのような種類のものなのか.ここでは,秩序や規範の
成り立ちとその諸条件を検討する上でゲーム理論モデルを用いて分析を行う.人々の社会
的インターラクションの中で,どのように行為の規範性が生成するのかを考察する.
また,秩序問題を考える上で,行為の規範性のみに重点を与えるのではなく,社会契約
論の可能性も再考する.社会契約論を国家ないし共同体の成立を説明するための理論とし
てだけではなく,規範(ルール)
,秩序を生み出す側面を強調することが有効であることを
示す.
いま,
「秩序問題」に直面して個々人が誰ともなくルールを考えよう,決めようと提案し,
議論をしている状況を想定してみる.他の誰かがそれに応じて,同意したとき,それはル
ール生成状況にコミットしたということであり,いわば契約・約束(合意)2をしたことを
意味している.これにより,ルール生成状況がスタートする.ルール生成において,明示
的であれ暗示であれ少なくとも契約(約束)にコミットすることが重要なのである.個々
人がルールを主張し,議論して最適なルールを考えることは,効率的な結果をもたらすか
もしれない.ルール形成にコミットすることで,ジレンマとしての「秩序問題」が解決さ
れるかもしれないのである.この論文では,個々人の相互のインターラクションの中,自
発的な行動調整のインターラクションによって,ルールや規範が生成する可能性をモデル
によって示す.
ジョセフ・ヒース(2008)は非常に単純かつ直接的に規範やルールを意思決定の枠組み
1
2
Hobbes(1651)の chap.13-9 を要約.
道徳性と合意(社会契約論)については Gauthier(1986).
2
に導入した3.ルールが行為に対して価値を与える合理的な意思決定モデルを提示した.す
なわち,規範が社会的な選択において義務的制約として機能する方法のきわめて明快な表
現を与えたのである.
欲求が結果,信念が状態に結びついた志向的状態であるように,規範・ルールを行為に
結びついた志向的状態と措定する.行為を指定する志向的状態を「原理(principle)
」 と
する.また,可能な状態が確からしさでランク付けされるように,許される行為は適切で
ランク付けされうるので,適宜性(appropriateness)と表される.主体の価値関数は次の
ようになる.
n
v(a)   n(a)+  k 1 u k (a)
k 1
割引因子を  とすると ut は時点 t で行為 a から得られる期待効用,n(a) は原理, は根本
的選択性向を示している.これは,効用との比較で,原理に割り当てる重みを表す.
C
C
D
3,3 1, 4
D 4,1 2.2
ヒースが示した囚人のジレンマの例を考える.この例では、-2の適宜性(規範的制約)
が与えられている(かぎカッコの値).かぎカッコはマトリックスの外に置かれる.それぞ
れのプレイヤーが  1  1 , 2  1 の根本的選択性向を示すと,結果として右の図の利得にな
る.
C 0
D  2
C  0 D  2
3,3
1, 4
4,1
2.2

C
C
D
3,3 1, 2
D 2,1 0.0
こうして,個々人は規範に同調することで協力的な均衡 (C , C ) が達成されたのである.
「秩序問題」のジレンマは解消されたのである.
では,このかぎカッコ=適宜性の値はどこから与えられるのだろうか.この値は外生変
数である訳だが,どのようなプロセスを経て生起するのか.国家が強制的に与えたものな
のか,慣習,黙約のようなものなのか.ヒースはこれに対する解答を残念ながら示してい
ないのである.いずれにせよ,このゲーム状況に関する十分な情報を保有していなければ,
規範やルールは不適切なものになりうる.
3
特に Heath (2008) の chap.3 など.
3
ここでは,元のゲームの前に(pre-play)個々人が自発的かつ自律的に自らルールを示す
状況にコミットする2段階ゲームを提出する.
モデル
ルール生成ゲームは次のようになる(図 1)
.
ステージ 1
それぞれのプレイヤーは同時に行動調整を示す.
ステージ 2
プレイヤーは元のゲームをプレイする.
N  1,
, n をプレイヤーの集合とする.セカンド・ステージにおけるプレイヤー i の有
限 純 粋 戦 略 は , Si に よ っ て 表 さ れ る ( S  i Si ) と し , 混 合 戦 略 を ( Si ) と す る
(   i ( Si ) ). Si , S , ( Si ) ,そして  の要素をそれぞれ si , s , i ,そして  と
する.セカンド・ステージのプレイヤー i の利得は,フォン・ノイマン=モルゲンシュテル
ン効用関数 vi : S   で与えられる.
ファースト・ステージにおけるプレイヤー i の行動調整関数 ri は, ri : Si   と表す.
r  (r1 ,
, rn ) とする.また, ri  0 , r 0  (r10 ,
, rn0 ) とおく.
プレイヤー i の行動調整関数 ri とセカンド・ステージのプレイ s が与えられると, i とっ
て利得は, Ui (s, ri )  vi (s)+ri (si ) となる.
そのとき,行動調整関数 ri とセカンド・ステージでの混合戦略  が与えられると, プ
レイヤー i にとっての期待効用は次のようになる.
EU i (  , ri )   i i ( si ) vi ( s)+ri ( si ) 
s
いま, r が与えられたときのセカンド・ステージにおける(純粋または混合)戦略ナッシュ
均衡を NE (r ) と表す.
ファースト・ステージでの行動調整関数には,混合戦略は定義されていない.これを導
入すると非常に複雑なものになってしまうからである.
通常,拘束力のある(binding)契約とは,契約を含むミクロ経済学モデルやゲーム理論
モデル,契約理論(contract theory)4において,法的効力を備えた約束であり,関係法規
4
契約理論のサーヴェイとして Hart and Holmstrom (1987) や Milgrom and Roberts (1992) などを参照.
4
や裁判所によって実効力のある(enforceable)5状態となる.
ここでは,ルール生成ゲームにおける契約を拘束力に応じて次のように分類する(必ず
しも順番は拘束力の大きさを表していない)6.
1.暗黙的な当事者間の契約
2.明示的な当事者間の契約
3.2及び当事者以外の第三者
4.2又は3と法律・裁判システムなど
5.2又は3と国家やそれに準じた(国際)機関など
基本的に契約ないし約束にコミットした義務感・負い目,破棄したときに非難されると
いう恐れなどで拘束力をもつ.1~3はインフォーマルなルールであり,習慣や道徳など
が生成する.4~5はフォーマルなルールで,実定法や法的効力を有する契約などが生ま
れることになる.1は当事者間で相互の行動を拘束し合っていると事後的に見出される状
態である.何らかの形で相互に了解している必要がある.ヒュームの黙約7,暗黙の契約理
論8なども含まれる.2は口頭や文章で相互に確認がなされ,自発的で相互の拘束と監視に
よって拘束力をもつ.ある規模のグループのときには,ジャン=ジャック・ルソー(1762)
が考えた共和制を生み出す社会契約も含まれる.3は当事者相互の拘束と監視のほか,第
三者による監視や実施がおこなわれる9.第三者が権威ないし力を保有する場合には,トマ
ス・ホッブズ(1651)やジョン・ロック(1698)が考えた社会契約になりえる10.4にお
いて,法律などは契約理論や契約を含むモデルが想定している経済取引や商取引に実効力
をもたせる.法律が法律,法律が法律行為である契約を生み出すケースである.5では,
当事者による自発的な契約を直接に国家などによって拘束力をもたせる.必ずしも当事者
と国家との契約は必要ではない.ここでの国家はルールにフォーマルな機能をもたせるだ
けであり,服属契約は含んでいない.その他に,すべてのケースで (取引)費用11と懲罰が拘
束力ないし実効力をもたせる.
1~3においては,慣習などのインフォーマルなルールは,国家などの権威により不文
5
6
契約の拘束力と実効化可能について Aoki(2001)を参照.
Williamson(2000)はレベルに応じて規範や法と制度を分類している.
7
Convention は黙約のほか慣習などと訳される (Hume 1739-40: Ⅲ.2.2.9 )
8
暗黙の契約理論 (implicit contract theory) は Azariadis(1975).
オストロムの提示した私費契約実施ゲーム(self-financed contract-enforcement) における仲裁者
(arbitrator)など(Ostrom 1990: 15-17).
9
10
社会契約論とゲーム理論について、Gauthier(1986),Binmore(1994)などを参照.
11
取引費用については、Coase(1937, 1960), Williamson(1975, 1996)など.
5
法の中の慣習法となる.3~4の場合,プリンシパルエージェント問題12と同様なことが起
こりうる.
分析
ここで,囚人ジレンマゲームを考えてみる.ヒースが示したものとは利得が異なる.
C
C
D
3,3 0, 4
D 4, 0
2.2
ファースト・ステージにおいて,例えば行プレイヤーが-1 の行動の調整を示すと,列プ
レイヤーも同様に-1 の行動調整を行うのが最適反応になる.行動調整 (1) で表す.セカ
ンド・ステージで (C , C ) がプレイされ,ファースト・ステージで双方-1 の行動調整を行う
のがサブゲーム完全均衡になる.
[1st stage]
C
D(1)
3,3
0, 4
D(1) 4, 0
2.2
C
[2nd stage]

C
C
D
3, 3 0 , 3
D 3, 0
1 . 1
コーディネーション・ゲームの場合は次のようになる.
A
B
A 2, 2 0, 0
B 0, 0 1.1
例えば,ファースト・ステージで行プレイヤーが-2の行動調整を示したとする.その
とき,セカンド・ステージの唯一の均衡は ( A, A) となる.こうして, ( A, A) はサブゲーム
完全均衡になるのである.
12
プリンシパル=エージェント問題については、Jensen and Meckling(1976)や契約理論を参照.
6
[1st stage]
A
A
[2nd stage]
B
2, 2 0, 0

A
B(2) 0, 0 1.1
A
B
2 , 2
0 , 0
B 2 , 0 
1 . 1
ところで,もう一度ヒースの示した囚人のジレンマを考えてみよう.
C
C
D
3,3 1, 4
D 4,1 2.2
ファースト・ステージで行プレイヤーが自ら逸脱するインセンティヴをもたないように
するために,-1 の行動調整をしたとする.そのとき,列プレイヤーは-1 の行動調整をす
るどころか,何もしないことが最適になる.そうして,セカンド・ステージのナッシュ均
衡は(C.D)となってしまうのである. (2) の行動調整でも同様である.
[1st stage]
C
C
D
3,3 1, 4
[2nd stage]
C

C
D(1) 4,1 2.2
D
3,3 1, 4
D 3,1 1.2
囚人のジレンマにおいて,元々非協力戦略が支配戦略であるが,このケースでは自ら非
協力へのインセンティヴを下げるために行動調整を行うと支配戦略ではなくなり(または
支配戦略が協力戦略に変わってしまい)
、相手が非協力戦略のときにも協力戦略をとること
が最適反応になってしまうのである.そのため,効率的な利得は均衡として達成されない
のである.
一般化した囚人のジレンマ
C
D
a, a
c, b
D b, c
d, d
C
a  b, a  d , c  d
7
一般化した囚人のジレンマでは、均衡結果は次のようになる。
それぞれの i について, b  a  d  c であるとき,かつそのときに限り s  (C, C ) ,
ri  ((d  c), (b  a)] はサブゲーム完全均衡になる.
もし,それぞれの i について, s  (C, C ) , ri  ((d  c), (b  a)] はサブゲーム完全均
衡であるなら,そのとき b  a  d  c になることを示す.いま, b  a  d  c であると仮
定する. c  (d  rj )  (b  a)  (d  c)  0 なので,ある i が ri から逸脱すると, ( D, C ) が
均衡になり, r での利得よりよい.これは矛盾である.
次 に , そ れ ぞ れ の i に つ い て , b  a  d  c で あ る と き , s  (C ,C ),
ri  ((d  c), (b  a)] はサブゲーム完全均衡になることを示す.
均衡経路外において, rj  rj のときに ri  ri とすると,均衡は (C, D) か ( D, D) で i の利
得はせいぜい利得 d となる. rj  rj のときに ri  ri とすると,任意の均衡.均衡経路にお
いて rj  rj のときに ri  ri だと,均衡は (C , C ) .
b  a  d  c より, c  (d  rj )  (b  a)  (d  c)  0 なので,ある i が r から ri  ri に
逸脱しても利得は d 以下で改善できない.
一般化したコーディネーション・ゲーム
一般化したコーディネーション・ゲームでの均衡結果は次のようになる。
A
B
A a , a  c, c 
B b, b  d , d 
a  b, a   c , d  c, d   b 
それぞれの i について,a  d かつ a  d  であるとき,かつそのときに限り,s  ( A, A)
は r1  (d  c) または r2  (d   b) でサブゲーム完全均衡になる.
もし、それぞれの i について, s  ( A, A) は r1  (d  c) または r2  (d   b) でサブゲ
8
ーム完全均衡であるなら,そのとき a  d かつ a  d  になることを示す.いま, a  d ま
たは a  d  であると仮定してみる. プレイヤー1 は r2  r2 のときに均衡は ( A, A) .r2  r2
のときに, a  d または a  d  なので, r から r1  r1 に逸脱すると,均衡は ( B, B) で利得
は最大 d になる.これは矛盾である。プレイヤー2は r1  r1 のときに均衡は ( A, A) .r1  r1
のときに, a  d または a  d  なので, r から r2  r2 に逸脱すると,均衡は ( B, B) で利得
は最大 d  になる.これは矛盾である.
もし、それぞれの i について,a  d かつ a  d  であるとき,s  ( A, A) は r1  (d  c)
または r2  (d   b) でサブゲーム完全均衡になることを示す.
プレイヤー1は r2  r2 のときに r1  r1 とすると,均衡は ( A, A) .r2  r2 のときに r1  r1 と
すると,任意の均衡で,a  d かつ a  d  なので利得はせいぜい a .r2  r2 のときに r1  r1
だと,均衡は ( A, A) .プレイヤー1が r から r1  r1 に逸脱しても改善できない.プレイヤ
ー2は r1  r1 のときに r2  r2 とすると,均衡は ( A, A) . r1  r1 のときに r2  r2 とすると,
任意の均衡で, a  d かつ a  d  なので利得はせいぜい a  . rj  rj のときに ri  ri だと,
均衡は ( A, A) .プレイヤー2が r から r2  r2 に逸脱しても改善できない.
結語
個々人が自発的にルール生成状況に同意してコミットすることで,ルール生成ゲームは
始まる.個々人の相互のインターラクションの中,自発的な行動調整のインターラクショ
ンによって,ルールは生成するのである.ルールがルールとして成立するには,行動調整
から生じた規則性と契約による拘束力ないし実効力が必要なのである.
このモデルにおいて,個々人の自発的かつ自律的なルール主張のインターラクションに
よって,効率的な結果をもたらすルールが生成することを示した.コーディネーション・
ゲームにおいて,元のゲームの効率的な均衡はサブゲーム完全均衡となる.しかし,囚人
のジレンマでは,一部利得構造により効率的な利得をサブゲーム完全均衡として導くこと
ができない.これはジレンマ構造の根深さを示している.
9
C
1
C
C
C
2
D
C
C
D
D
𝑟2
C
2
1
C
C
C
2
D
C
C
D
D
1
𝑟1
C
C
C
1
C
2
D
C
C
D
D
𝑟2
C
C
1
2
C
C
D
C
D
D
図 1 ルール生成ゲーム
10
参考文献
Aoki, Masahiko, 2001, Toward a Comparative Institutional Analysis, MIT Press. (=2001,
瀧澤弘和・谷口和弘訳『比較制度分析に向けて』NTT 出版.)
Azariadis, Costas, 1975, “Implicit Contracts and Underemployment Equilibria,” The
Journal of Political Economy, 83(6): 1183-1202.
Binmore, Ken, 1994, Playing fair, Game theory and the social contract, Vol.1, MIT
Press.
Coase, Ronald H., [1937] 1988. The Nature of the Firm. In The Firm, the Market, and
the Law, University of Chicago Press: 33-55. (=1992,宮沢健一・後藤晃・藤垣芳
文訳『企業・市場・法』東洋経済新報社,39-64.)
――――1960, “The Problem of Social Cost,” Journal of Law and Economics, 3: 1-44.
Gauthier, David, 1986, Morals by Agreement, Clarendon Press.(=1999,小林公訳『合
意による道徳』木鐸社.)
Hart,Oliver and Bengt Holmstrom, 1987,“The Theory of Contracts,” Truman F. Bewley
ed.,Advances in Economic Theory,Cambridge University Press, 71-155.
Heath, Joseph, [2008] 2011, Following the Rules: Practical Reasoning and Deontic
Constraint, Oxford University Press.(=2013,瀧澤弘和訳『ルールに従う―社会科学
の規範理論序説』NTT 出版.)
Hobbes, Thomas, [1651] 2012, Leviathan, Noel Malcolm ed., Clarendon Press.(=1992,
水田洋訳『リヴァイアサン』(1)~(4)
,岩波文庫.
)
Hume, David,[1739-40]2007, A treatise of human nature, David Fate Norton, Mary J.
Norton eds., Clarendon Press.(=1995,大槻 春彦訳『人性論』(1)~(4),岩波
書店.)
Jackson, Matthew O. and Wilkie, Simon, 2005, “Endogenous Games and Mechanisms:
side Payments Among Players,” Review of Economic Studies, 72: 543-566.
Jensen, Michael and William Meckling (1976),Theory of the Firm: Managerial
Behavior,Agency Costs,and Capital Structure,Journal of Financial Economics
3: 305-360.
Milgrom, Paul and John Roberts, 1992,Economics, Organization and Management,
Prentice HaIl.(=1997,奥野正寛他訳『組織の経済学』NTT 出版.
)
Ostrom, Elinor, 1990, Governing the Commons: the Evolution of Institutions for
Collective Action, Cambridge University Press.
Parsons, Talcott, [1937] 1949, The Structure of Social Action: A Study in Social Theory
with Special Reference to a Group of Recent European Writers, Free Press.(=
1974-1989, 稲上毅・厚東洋輔・溝部明男訳『社会的行為の構造』木鐸社.)
11
Rubinstein, Ariel, 1982, “Perfect Equilibrium in a Bargaining Model,” Econometrica, 50:
97-109.
Williamson, Oliver, 1975, Market and Hierarchies: Analysis and Antitrust Implications,
Free Press.(=1980,浅沼高里、岩崎晃訳『市場と経済組織』日本評論社.)
――――1996, The mechanisms of governance, Oxford University Press.
――――2000, "The New Institutional Economics: Taking Stock, Looking Ahead,"
Journal of Economic Literature, 38(3): 595-613.
Locke, John [1698] 2003, Two treatises of government and A letter concerning toleration,
Ian Shapiro ed., Yale University Press. (=2010,加藤 節訳『統治二論』岩波書店.
)
ジャン=ジャック・ルソー,1982,桑原 武夫・前川 貞次郎訳『社会契約論』岩波書店.
――――1991,作田啓一・原好男訳『社会契約論・人間不平等起源論』白水社.
トマス・ホッブズ,2008,本田裕志訳『市民論』京都大学学術出版会.
12