講 演 Lecture Thesis 社会学の新しい 析道具 進化ゲーム理論とエージェント・ベースト・モデル 佐 藤 嘉 倫 Yoshimichi SATO 情 報 科 学 第25号(別刷) 札幌学院大学情報科学研究所 札幌学院大学電子計算機センター 2005 社会学の新しい 析道具 進化ゲーム理論とエージェント・ベースト・モデル 東北大学大学院 文学研究科 佐 藤 嘉 倫 要旨:本稿では,進化ゲーム理論とエージェント・ベースト・モデルが社会現象を説明するのに 適した 析道具であるという主張をする.両者は,社会現象をミクロレベルの相互作用から説明 しようとするミクロ・マクロ・アプローチと適合的であり,このアプローチを実質的に推進する ものである.Axelrod の遺伝アルゴリズムによるしっぺ返し戦略の頑 性の検証と佐藤による信 頼関係・コミットメント関係の生成・崩壊モデルを題材に,進化ゲーム理論とエージェント・ベー スト・モデルの基本的な え方を解説しつつ,両者の有効性を示す. キーワード:進化ゲーム理論,エージェント・ベースト・モデル,しっぺ返し戦略,信頼 1.社会学の基本的発想 ミクロ・マクロ問 個人主義では,社会はそれを構成する個人に還元で 題 きると 社会学とはいかなる学問であろうか.この問いは える.この方法論の代表選手は Homans (1973)である.彼は個人行動に関する厳密な 理か あまりに漠然としているので,もう少し焦点を ろ ら社会現象を説明する命題を導出しようとした. う.社会学が解くべき問い(research questions)は これらの方法論にはそれぞれ問題がある.方法論 何だろうか.もちろん社会学者によってこの問いに 的全体主義では,社会の中の個々人の行為と社会の 対する解答はいろいろあるだろう.しかし何らかの 挙動との関係が見えにくい.逆に,方法論的個人主 意味での「社会現象」を研究対象とするという点で 義では,社会現象を個々人の行為に還元してしまう は,多くの社会学者の同意を得るだろう.だがその ため,後述する囚人のジレンマゲームのように個々 社会現象を「どのように説明するか」となると,社 人の相互作用から生じる社会現象を的確に扱えな 会学者の意見は大きく2つに かれる.方法論的全 い. 体主義(方法論的社会主義)と方法論的個人主義で しかし近年では,両者を架橋するアプローチが出 ある. てきている.それはミクロ・マクロ・アプローチな 方法論的全体主義は,社会はそれを構成する個人 いしは多水準アプローチと呼ばれる え方である. を超えたものであると想定し,個人の集積からは社 この え方は,基本的に方法論的個人主義に立つが, 会 現 象 を 説 明 で き な い と 主 張 す る.Durkheim 社会の挙動を個々人の行為の集積ではなく, 「相互行 (1895) が典型例である.彼は,個人を超越したもの 為」ないしは「相互作用」の集積から説明しようと として制度を捉えている.これに対して,方法論的 する.さらに先行する制度の影響なども 慮に入れ 1 て,制度と人々の行為選択との関係をも射程に入れ ている.ある意味では,方法論的全体主義と方法論 的個人主義を合わせたような方法である. 抽象的に述べると かりにくいので,このアプ ローチの主唱者の一人である Coleman(1990)が取 り上げている例を紹介しよう.彼は Max Weber の 図1 多水準で見たウェーバー理論の解釈 『プロテスタンティズムの倫理と資本主義の 精神>』 出所:Coleman(1990:8,Figure 1. 2) を題材に,このアプローチの解説をしている.彼に 2.新しい道具 よれば,Weber の主張は「宗教改革でプロテスタン 進化ゲーム理論とエージェ ント・ベースト・モデル トになった社会を特徴づける宗教倫理は,資本主義 的経済組織の成長を促進した価値を含んでいた」と 前節で紹介したミクロ・マクロ・アプローチは概 いうマクロ現象に関する命題のように見える.つま 念的なものであり,このままでは実質的な社会学的 り「資本主義経済組織の成長」という社会現象を「宗 析を進めることができない.このための道具が, 教倫理」という別の社会現象で説明しようというも 本節で紹介する進化ゲーム理論とエージェント・ のである.しかし Weber の理論を詳細に検討する ベースト・モデルである.この2つが唯一の道具と と,それは3つの命題に 解できる,と Coleman は いうわけではない.Coleman 自身は経済学の一般 主張する. すなわち⑴プロテスタントの宗教教義は, 衡理論にヒントを得た数理モデルを展開している その支持者に特定の価値を植え付ける,⑵その特定 し,佐藤(1998)は社会計画や社会運動の の価値を持った個人は,経済活動に対してある方向 来のゲーム理論を用いている. 析に従 付け(オリエンテーション)を受ける,⑶個人にお このような道具と比べた場合の進化ゲーム理論と ける経済活動に対する方向付けは,社会の中に資本 エージェント・ベースト・モデルの特徴は,さまざ 主義的経済組織が生じることを促す,という3つの まな特性を持った人々の 命題である.これら3つの命題は社会レベル(マク 捉えることができることである.もちろん他にもこ ロレベル)と個人レベル(ミクロレベル)の移行に のような特徴を持ったモデルはあるが, 布の時間 関わるものである.Coleman はこれらを図1のよう 的変化というマクロレベルの変動を個人の淘汰や学 に整理している.命題1はプロテスタントの宗教教 習というミクロレベルの事象から説明するという点 義というマクロな要因が個人レベルで価値を植え付 において,上述のミクロ・マクロ・アプローチに適 けるというマクロ―ミクロ移行を表現している.命 切にしたがっている. 布の時間的変化を的確に 題2は,個人レベルにおける価値と活動との関係を さて以下では,進化ゲーム理論とエージェント・ 表している.そして命題3は,そのような経済活動 ベースト・モデルの基本的な え方を紹介しよう. がマクロレベルで資本主義経済組織の成長を促すと なお両者の関係については論者によって異なるが, いうミクロ―マクロ移行を表している. 本稿では進化ゲーム理論は数理モデル,エージェン この解説から かるように,ミクロ・マクロ・ア ト・ベースト・モデルはコンピュータ・モデルとい プローチは,マクロからミクロへの移行,ミクロレ うように い ベルでの過程,ミクロからマクロへの移行,という モデルに変換したものではない.進化ゲーム理論で 3つのメカニズムに焦点を当てたアプローチであ は解析できないようなモデルや予測できないような る.そしてこのアプローチに適した道具が次に述べ モデルを構築することで,進化ゲーム理論とは重な る進化ゲーム理論とエージェント・ベースト・モデ りながらも独自の領域を持っている. ルである. ける.ただし後者は単に前者を計算 まず進化ゲーム理論の 2 え方を説明しよう .進 化ゲーム理論では,慣習的に行為者のことを個体と と想定する.進化ゲームでよく想定する戦略決定規 呼ぶ.個体は人間の場合もあれば組織のような集合 則は,遺伝子による決定と学習による決定である. 体の場合もある.そして社会にはたくさんの個体が 前者の場合,黙秘(自白)することが個体の持つ遺 いて,それぞれの個体は戦略を持っている.ここで 伝子によって決められていると える.後者の場合, いう「戦略」とは個体の取る行為のことである.有 個体が黙秘(自白)することを学んでいると える. 名な囚人のジレンマゲームを例に用いて説明しよ いずれの場合でも,個体は,取調官に司法取引を持 う.このゲームでは,2人組の強盗AとBが銀行を ちかけられてから,黙秘するか自白するか熟 の上 襲撃して大金を奪うことに成功したところから話が きめるのではなく,持ちかけられる前から, 「黙秘し 始まる.その後に2人は警察に逮捕されたが,確た よう」または「自白しよう」と決めているのである. る物的証拠がないために,取調官は2人を別々の取 進化ゲームでは,このように戦略を持った個体が 調室に呼び,次のような司法取引を持ちかけた. 「お たくさん社会にいると想定する.そしてランダムに, 前たちが2人とも黙秘し続けるならば別件でそれぞ ないしは一定の規則にしたがって,個体同士のペア れ懲役3年を求刑する.しかし相方が黙秘し続けて ができ,それぞれのペアがゲームを行う.そしてペ いてお前が自白するならば,お前は無罪放免にして アになった個体が持っていた戦略の組み合わせに基 やる.相方には懲役7年を求刑する.しかしお前が づいて,利得を得る.たとえば,黙秘戦略を持って 黙秘し続けていて相方が自白するならば,相方は無 いる個体と自白戦略を持っている個体がペアになり 罪放免だが,お前には懲役7年を求刑する.2人と 囚人のジレンマゲームを行えば,前者は−7の利得 も自白するならば,それぞれ懲役5年を求刑する. を得て,後者は0の利得を得る. さあどちらを選ぶ. 」 次に個体は自 この状況で,AとBが取りうる行為は「黙秘」と の利得に基づいて戦略を変 る.進化ゲームで用いられる主な変 す 規則は自然選 「自白」 である.これがAとBの戦略である.そして 択と学習である.前者の場合,より高い利得を得た 上の取調官の持ちかけた司法取引の内容から かる 個体はより多くの子孫を残せ,そうでない個体はよ ように,この戦略の組み合わせによって,AとBの り少ない子孫を残す.したがって次世代では,前者 懲役年数が決まる.単純化のために,求刑どおりの の遺伝子を持った個体の割合が増え,後者の遺伝子 判決が出ると仮定すれば,これらの懲役年数をAと を持った個体の割合は減る.学習の場合,自 の経 Bの「利得」と えることができる.したがって戦 験に基づく学習と他の個体の経験に基づく学習があ 略の組み合わせと利得の関係を下の表1のようにま る.前者の場合,低い利得を得た個体は自 とめることができる.このような表を「利得行列」 を別のものに変 しようとし,高い利得を得た個体 と呼ぶ(ここでは懲役年数がマイナスの利得となっ は自 の戦略を維持しようとする.後者では,個体 ていることに注意されたい). はある特性を持った他の個体(たとえばもっとも利 進化ゲームでは,個体は「黙秘」か「自白」のど の戦略 得の高い個体)の戦略を模倣する.このような学習 ちらを選ぶか,ゲームの前にあらかじめ決めている 過程を経て,次の時点における戦略の割合が決まる. この戦略の割合を「戦略 布」と呼ぼう.進化ゲー 表1 囚人のジレンマゲームの利得行列 ムではこの戦略 布の時間的変化と戦略 布がどの ような 布に収束していくかが重要な研究関心とな る.上の囚人のジレンマゲームでいえば,黙秘と自 白の 布がどこに落ち着くか(これを「 衡」と呼 ぶ)が重要なテーマである.表1から かるように, 相手の個体がどちらの戦略を持っているとしても, 出所:佐藤(2004:688,表1) 3 自白戦略を持っている個体の方が黙秘戦略を持って ぺ返し戦略はゲーム理論研究者のみならず社会科学 いる個体よりも利得が高い.したがって自然選択に 者全般の注目を浴びることになった. せよ学習にせよ,十 な時間がたてば,自白戦略を しかし Axelrod は,ある疑問を抱いた.それは, 持っている個体が社会を占めるようになる . 当たり戦で応募者が自 の戦略を提出する際に他 エージェント・ベースト・モデルは進化過程をコ の応募者がどのような戦略を提出するか予測したこ ンピュータ上で実現する手法なので, その え方も, とがしっぺ返し戦略の成功につながったのではない 基本的に進化ゲーム理論の え方と同様である.な か,という疑問である.戦略に関するこのような先 おこの手法では個体を「エージェント」と呼ぶのが 入観のない状況で果たしてしっぺ返し戦略は成功を 慣習となっている.基本的にモデルは,初期化,マッ 収めるのだろうか.この問題に取り組むために,彼 チング,相互作用,特性変 という4つの段階から は遺伝アルゴリズムを用いた研究を展開した なる.初期化段階ではエージェントにさまざまな特 (Axelrod, 1997). 性が付与される. 「黙秘戦略を選ぶ」とか「自白戦略 Axelrod の 行った シ ミュレーション は 次 の よ う を選ぶ」というのも特性である.次のマッチング段 になる.まずエージェントの選択は 70個の遺伝子で 階では, ランダムに,ないしは一定の規則にしたがっ 統制される.エージェントは囚人のジレンマゲーム て, エージェントが他のエージェントとペアになる. を同じ相手と 151回繰り返してプレーする .エー 第3の相互作用の段階では,ペアになったエージェ ジェントは過去3回に実現した社会状態に基づいて ント同士が何らかの相互作用(たとえば囚人のジレ 今回の選択を決める(以下では,「黙秘」を「協力」 , ンマゲーム) を行う.この相互作用においてエージェ 「自白」を「裏切り」と一般的に記述しよう).たと ントは自己の特性に基づいて行動する.この相互作 えば(協力,協力),(裏切り,協力),(裏切り,裏 用の結果,エージェントは利得を得る.そして第4 切り)という直前3回の流れに対して協力か裏切り の特性変 を選ぶ.1回に実現しうる社会状態の数は4つなの の段階では,この利得に基づいてエー ジェントの特性が変 される.そして新しい特性を で,直前3回に実現しうる社会状態の数は4×4× 持ったエージェントはマッチング段階に戻り次の回 4=64通りある.これらの社会状態1つ1つに応じ が始まる.そして進化ゲーム理論と同様に,戦略 て協力か裏切りか選択するので,64個の遺伝子が必 布の時間的変化や 衡が 析の対象となる. 要になる.しかしこれだけでは,初めの3回の選択 が決まらない.そこでゲームが始まる前に仮想の 3.Axelrod のエージェント・ベースト・モデル ゲームが3回行われたと想定して,その3回 の自 前節で解説したエージェント・ベースト・モデル と相手の選択を遺伝子として表現する.自 と相 の一例として Axelrod(1997)の研究を紹介しよう. 手がそれぞれ3回選択しているので,6つの遺伝子 彼は,エージェント・ベースト・モデルの一種であ が必要になる.これらと上記 64個の遺伝子を合わせ る遺伝アルゴリズムの手法を用いて,しっぺ返し戦 て,エージェントの染色体には 70個の遺伝子が並ぶ 略がランダムな初期状態から進化するかどうか検討 ことになる. した.囚人のジレンマゲームが同じエージェントに シミュレーションでは 20のエージェントを用い よって繰り返してプレーされるとしよう.しっぺ返 る.初期状態として,染色体上の 70個の位置にラン し戦略とは,この繰り返しゲームで初めは黙秘を選 ダムに協力か裏切りの遺伝子を割り当てる.そして び,2回目以降は前回の相手の戦略を真似るという 各エージェントは,他のエージェントではなく, ものである.そしてこの戦略は,いくつかの戦略を 当たり戦に参加した戦略のうち代表的な戦略8つと 集めた 当たり戦で他の戦略よりも高い利得を得る 対戦する.この対戦によって各エージェントの利得 ことができた (Axelrod,1984) .この結果から,しっ が得られる.そしてエージェントは得点によって, 4 図2 差の例(佐藤,2004:691,図1) ⒜利得が平 利得よりも1標準偏差以上大きいエー 社会が形成され,子孫たちは8つの代表的戦略と対 ジェント,⒝利得が(平 利得+1標準偏差)と(平 戦して,次の世代の子孫を生み出す.こうして社会 利得−1標準偏差)の間にあるエージェント,⒞ 利得が平 における戦略 利得よりも1標準偏差以上小さいエー ジェントの3種類に 布が時間的に変動していく.この時 間的変動を見ることで,しっぺ返し戦略がランダム けられる.⒜のエージェント な初期状態から進化していくかどうか見ることがで は他の⒜のエージェントと2回の 配を行う.⒝の きる. エージェントは⒝のエージェントと1回の 配を行 シミュレーションの結果は基本的にしっぺ返し戦 う.⒞のエージェントは 配ができない.また1回 略の頑 性を示すものだった.シミュレーションで の 配につき2人の子孫を残せる .このように利 進化した戦略の多くは,しっぺ返し戦略が 得の大きさによって,残せる子孫数に格差を設けて 戦で成功したのと類似した特性を持っていた.この いる. 結果は Axelrod の疑問に対する明快な答えを提示 子孫は 差によって親の遺伝子を受け継ぐ.親の 当たり している.彼は, 当たり戦でしっぺ返し戦略が成 染色体上の1つ以上の場所で 差(crossover)が起 功したのは, 募に応じた戦略の作者が他の作者の こり,新しい遺伝子配列の染色体を持った子孫が生 出方を予測していたからではないかという疑問を抱 まれる. 差とは,有性生殖のように,2つの遺伝 いていた.しかしエージェント・ベースト・モデル 子配列のある部 で遺伝子配列が入れ替わることを に基づいたシミュレーション結果はこの疑問が杞憂 いう.たとえば図2のように,10個の遺伝子を持つ だったことを示している.ランダムな初期状態から 親の 配から子どもが生まれる時,4番目と5番目 しっぺ返し戦略の特性に類似した特性を持った戦略 の遺伝子の間で遺伝子配列が入れ替わる(どこで が進化したからである. 差するかは確率的に決まる).この結果,まったく新 4.信頼のエージェント・ベースト・モデル しい遺伝子配列を持った子どもが生まれる. なお Axelrod のモデルでは,突然変異も想定され 前節で紹介したモデルでは,ペアになったエー ていて,これによって,染色体上の遺伝子が協力か ジェントが必ずゲームを行うことを想定している. ら裏切りに,または裏切りから協力に変化しうる. しかし現実社会では,ゲームをする前に相手が協力 このようにして子孫の持つ戦略 布の下で新しい するか裏切るかある程度の予測をすることが多い. 5 言い換えれば,ゲームの前に相手が信頼できるかど はどのような行動にでるだろうか.これが佐藤(2005 うかチェックする.そして信頼できなければ,ゲー の設定した問題である.ここでいう市場の魅力と b) ムを行わない.本節では,このような信頼を導入し は,より望ましい財を持っている取引相手が市場に たモデルを紹介しよう. いることを意味する.したがって市場が魅力的にな 佐藤(2005b)は,市場の魅力が信頼行動にいかな るほど,コミットメント関係に入っている企業に る影響を及ぼすか検討した.先行研究では,不確実 とって機会費用が高くなる.このため,より望まし な状況に対処する方策として,人間はコミットメン い取引相手と出会うために,コミットメント関係か ト関係を築くか信頼関係を形成することが知られて ら離脱して,市場において他の企業と信頼関係を結 いる (Kollock,1994;山岸,1998).コミットメント ぼうとするだろう.この仮説の妥当性を検討するた 関係とは長期的な取引関係であり,いったんこの関 めに,佐藤はエージェント・ベースト・モデルを用 係に入ると相手を裏切るようなことはしない.これ いたシミュレーションを行った. に対して,信頼関係は見知らぬ他人同士の関係であ このモデルの概略は次のようになる.社会には, り,相手に裏切られる可能性がある.これら2つの エージェントが N 人いる.エージェントには2つ 関係には一長一短がある.コミットメント関係の場 のタイプがある.コミットメント関係に入っている 合,相手に裏切られる可能性はないが,関係の外部 エージェントとそうでないエージェントである.前 にあるより良い機会を逃してしまう危険がある.た 者のエージェントはコミットメント関係でつながっ とえば日本に見られる下請け関係を例にとろう.発 ている相手と取引する.しかし後者のエージェント 注企業は受注企業が注文どおりの製品を納品するこ は,まず市場で他のエージェントとペアになる.ペ とに疑いを持たない.見た目は同じでも質の悪い製 アになったエージェントは相手と取引するか否か決 品を納品するとは思わない.なぜならそのようなこ める.そしてペアになったエージェントのどちらも とをすると,受注企業の命取りになるからである. 取引すると決めた場合のみ,2人は次に述べる 換 ここで,その製品と同等に見えるものをより安い価 ゲームを行う.お互いに取引しようと決めることは, 格で納品するという企業が市場に現れたとしよう. 相互信頼関係が成立することを意味する.ただしペ 発注企業は簡単にこの新しい企業に乗り換えるわけ アになったエージェントが必ず 換ゲームを行うと にはいかない.それは2つの理由による.第1は, は限らない.いずれか一方のエージェントが相手を 先の受注企業とコミットメント関係を結んでいるの 信頼しなければ, 換ゲームは行われない.このよ で,簡単に乗り換えることは信義を裏切ることにな うに,このモデルは,前節で紹介した Axelrod のモ るからである.第2は,新しい企業が注文どおりの デルとは異なり,ゲームを行う前に相手を信頼する 製品を納品するとは限らないからである.あくまで か否かの意思決定をすると仮定する. も「同等に見える」製品を納品可能なだけで,実は 換ゲームでは,エージェント i(i=1,2,..., 質の劣る製品をつかまされる可能性がある.経済学 N )に2つの選択肢がある.1つは相手に自 の持 の用語を用いれば,コミットメント関係にある発注 つ財1単位を渡すことであり,もう1つは相手に何 企業は,取引費用を節約できるかわりに,高い機会 も渡さないことである.前者は相手の信頼に応える 費用を払っていることになる.一方,市場において ことであり,後者は相手の信頼を裏切ることである. 新しい取引相手を信頼できる企業は,機会費用を節 相手のエージェント j(j≠i)にも同様の選択肢があ 約できる.しかし裏切られる可能性があるので,コ る.そして相手 j が自 に相手の財1単位を渡して ミットメント関係にいる場合よりも,取引費用は高 くれた場合は,自 は v (>1)の利得を得る . くなる. 以上から,エージェント i の得る利得は,彼/彼女 それでは,市場が魅力的な場合,このような企業 の選択と取引相手の選択によって,次のようになる. 6 自 が財を提供し相手のエージェント j も財を提供 それでは市場の魅力はどのように定式化できるだ するならば,自 は v の利得を得る.しかし相手に ろうか.本稿では,第1に財の散らばり具合で市場 自 の財1単位を渡すので,合計して v −1の利得 の魅力を表現する.v の散らばりが大きいほど,各 を得る.自 が財を提供し相手が財を提供しない場 エージェントにとって望ましい財を得られる可能性 合,相手の財を得られないので,利得は−1となる. が高くなるので,市場は魅力的になる.もちろん逆 自 が財を提供せず相手が財を提供する場合,自 に望ましくない財を得る可能性も高くなる.この意 の利得は v になる.自 が財を提供せず相手も財を 味では,v の散らばりが大きくなるほど,市場はリ 提供しない場合,現状のままなので自 の利得は0 スキーであると同時に魅力的になる.この v の散ら となる.この利得構造は表1の囚人のジレンマゲー ばりはモデルの外生的条件として設定する.第2に, ムの利得行列と同じ構造を持っている.すなわち財 社会が動き始めると,コミットメント関係に入って を提供しないことが合理的な選択である.しかし いるエージェントにとって市場の魅力は市場におけ エージェントは 換ゲームの結果(利得)に基づい る財の平 値と現在の取引相手の持っている財の価 て学習し,次ラウンドの 換ゲームにおける選択を 値との差になる.エージェントは市場におけるもっ 決める.このため学習の結果によっては, 換が成 とも望ましい財と現在の取引相手の持っている財と 立する可能性がある. を比較するかもしれない.しかし現在のコミットメ さて,ペアになったエージェントが 換ゲームを ント関係から離れても,その財を持っているエー 行った場合, 両エージェントが財を 換するならば, ジェントと相互信頼関係に入り 換ゲームでその財 両者はコミットメント関係に入る.すなわち両者は を得られるとは限らない.そこで本稿では,市場に 次ラウンドでもペアとなり,財を 換する.モデル おける財の平 では不確実な状況を想定している.次ラウンドで新 がって,現在の取引相手の持っている財が望ましく しくペアになった相手と相互信頼関係に入れるか ないほど,市場は魅力的になる. からないし,相互信頼関係に入り 換ゲームを行っ との比較をすると仮定する.した なおエージェントは, 換ゲームで自 の財を提 たとしても,相手が信頼に応えて財を提供してくれ 供する性向(協力性向) ,ペアになった相手の協力性 るかどうか からない.このような状況では,エー 向を見極める性向 (見極め性向),コミットメント関 ジェントは信頼できる相手(すなわち 換ゲームで 係を維持する性向(コミットメント性向)について 財を提供してくれた相手)と取引したら,次のラウ 学習する.自 ンドも同じ相手と 換ゲームをすると えられる. 合は,自 の利得などに基づいて,性向を変化させ の累積利得が取引相手よりも高い場 一方,コミットメント関係に入っていたエージェ る.そうでない場合は,1%の確率で相手の性向を ントは,まず取引によって相手のエージェント j か 模倣する.またペアになったが信頼関係を築けな ら v 単位の財をもらい, 換に自 の財1単位を相 かったエージェント(孤立したエージェント)は, 手に渡す.したがって合計 v −1の利得を得る.た 社会の中でもっとも高い累積利得を得ているエー だし次回もコミットメント関係に入って同じ相手と ジェント(これを最大累積利得者と呼ぼう)を比較 取引するとは限らない. 市場が魅力的ならば, コミッ 対象として,自 の累積利得が彼/彼女のそれより トメント関係から離脱する可能性がある.したがっ も大きいか等しいならば,自 の利得などに基づい て現在のコミットメント関係に入っている2人の て,性向を変化させる.そうでない場合は,1%の エージェント両方が次回もコミットメント関係を維 確率で彼/彼女の性向を模倣する. 持しようとするときにのみ,その関係は維持される. さて佐藤(2005b)は,このモデルを用いてシミュ そうでないならば,関係は解消し,両エージェント レーションを行った.シミュレーションのデザイン は次回は市場で新しい相手とペアになる. は次のようになる.社会には 1000人のエージェント 7 がいると想定する.そして財の正規 布の標準偏差 い価値の財をもっているエージェント同士がコミッ を操作して,市場の魅力がコミットメント関係に及 トメント関係を形成すると,相手の財の価値は市場 ぼす影響を見る.1つの標準偏差の値に対して 20回 における財の価値の平 よりも大きいので,コミッ の試行を行う.標準偏差は 0.1から 1.8まで 0.1ず トメント関係を維持する傾向にある.するとエー つ増加させるので, 計で 360回の試行を行う. 1回 ジェントは毎回高い利得を得て,蓄積利得も高くな の試行では 2000ラウンドのシミュレーションを行 る.したがって最大蓄積利得者はコミットメント関 う.初期段階のゆらぎを回避するために,最後の 500 係を形成しているエージェントの中に見つかる傾向 ラウンドのデータを収集する. も高くなる.すると,孤立しているエージェントは さて,上で検討した仮説が正しいとすれば,市場 コミットメント関係に入っている最大蓄積利得者の の魅力が高まるほど,コミットメント関係の割合は 性向を模倣する可能性が高くなる.そもそもコミッ 小さくなるはずである.そこで横軸に財の 布の標 トメント関係に入るには,見極め性向と協力性向が 準偏差をとり,縦軸にコミットメント関係の平 あるていど高くなければならない.したがってコ パーセントをとったグラフを作成した (図3) .明ら ミットメント関係に入っている最大蓄積利得者のこ かに標準偏差が大きくなるほど,コミットメント関 れらの性向も高い.孤立しているエージェントはこ 係の平 パーセントは高くなる.これは仮説に反す の高い性向を模倣することになる.模倣したエー る結果である. ジェントは,次のラウンドで同じような性向を持っ なぜこのようなことが起こるのだろうか.詳細は たエージェントとペアになれば,信頼関係を形成し, 省略するが,信頼行動および協力行動と市場の魅力 換ゲームで財を 換し,コミットメント関係に入 との関係を 析した結果,次のようなストーリーが る可能性が高い.もちろんこのコミットメント関係 浮かび上がった.まず財の 布の標準偏差の大きさ は次のラウンドで解消する可能性があるが,別の孤 に関係なく,エージェントが信頼関係を形成し,財 立したエージェントが次のラウンドでコミットメン を相互 換し,高い利得を得ると,見極め性向と協 ト関係を形成する可能性もある.いずれにしても, 力性向を増加させコミットメント関係を形成する. 最大蓄積利得者がコミットメント関係に入っている そして標準偏差が大きい場合,最大蓄積利得者はコ 限り,孤立したエージェントが彼/彼女の高い見極 ミットメント関係にいる傾向が高い.その理由は次 め性向・協力性向を模倣する可能性があり,それが のようになる.標準偏差が大きい場合,お互いに高 コミットメント関係の形成を促進する.このため, 財の 布の標準偏差が大きいと,コミットメント関 係の平 パーセントが大きくなる. このストーリーは,社会における模倣の重要性を 示している.コミットメント関係に入っている最大 蓄積利得者は,高い蓄積利得を得るためには如何に 振舞うべきかという「モデル」を孤立したエージェ ントに提示する.そして孤立したエージェントは, この「モデル」から他者を信頼し他者と協力するこ とを学ぶ.この意味では,コミットメント関係は間 接的に信頼関係を促進する,と言えよう.本節の冒 頭で紹介した,Kollock(1994)も山岸(1998)もこ のことには気づいていなかったと えられる. 図3 コミットメント関係と市場の魅力との関係 (佐藤,2005b:図2) 8 5.結 び ⑶ 本節は佐藤(2004)に基づいている. ⑷ 151回というのは,Axelrod(1984)で行った 当たり 戦で用いられた繰り返しゲームの平 繰り返し数であ 本稿では,Axelrod(1994)と佐藤(2005b)の研 究を紹介しながら,進化ゲーム理論とエージェン る. ⑸ ト・ベースト・モデルの え方を解説した.上で述 ただし社会の規模を一定にするために比率に応じた人 数調整を行う. べたように,これらの道具を用いることで,しっぺ ⑹ 返し戦略に基づく協力関係の形成や信頼関係・コ 本節は佐藤(2005b)に基づいている. ⑺ なぜ相手 j が1単位の財をくれると,自 は v の利得 を得るのだろうか.本章のモデルでは,心理学の実験のよ ミットメント関係の生成と崩壊に関して詳細な 析 うに,相手 j が1単位の財をエージェント i に提供する を行うことができる.しかし進化ゲーム理論とエー と,実験者が v −1の財を上乗せしてエージェント i に財 ジェント・ベースト・モデルの可能性はそれだけに を渡すと想定する.いわば大人数を被験者とした心理学 止まらない.社会学のさまざまな問題にアタックす 的実験をコンピュータ上で行っていると えてもよいだ ろう.ただし表記を単純化するために, 「エージェント j は るのに有効な道具である.その一例として,社会構 v の財を持っている」と表現することにする. 造の生成問題があげられる. 参 社会学において社会構造は重要な概念である.特 に社会構造が行為者の行為にいかなる影響を及ぼす のか,また行為者が社会構造の位置にいかに配置さ 学 バクテリアから国際関係まで』HBJ 出版局 2.Axelrod, R. (1997) The Complexity of Cooperation, れるのかといった問題は,社会学で繰り返し問われ Princeton UniversityPress=(2003)寺野隆雄(監訳) 『対立と協調の科学 エージェント・ベース・モデルに てきた問題である.私の えでは,進化ゲーム理論 よる複雑系の解明』ダイヤモンド社 とエージェント・ベースト・モデルはこの問題の 3.Coleman,J.S.(1990)Foundations of Social Theory, 析にも用いることができる. The Belknap Press of Harvard University Press= (2004)久慈利武(監訳) 『社会理論の基礎(上)』青木書 社会学で用いられる社会構造概念は大きく2種類 店 ある.社会システム論に基づく地位・役割構造と社 4.Durkheim, ́ E. (1895) Les Regeles de la methode sociologique, Presses Universitaires de France= 会ネットワーク 析に基づくネットワーク構造であ る. 今のところ,後者に関してはさまざまな進化ゲー (1978)宮島喬(訳)『社会的方法の基準』岩波書店 5.Homans, G. C.(1973)Social Behaviour: Its Elementary Forms,Routledge K.Paul=(1978)橋本茂(訳) ム理論的モデルやエージェント・ベースト・モデル が提示されている(佐藤・平 ,2005) .前節で解説 『社会行動 したコミットメント関係の生成もこの領域に入る. また友人関係の生成過程の 文献 1.Axelrod, R. (1984) The Evolution of Cooperation, 『つきあい方の科 Basic Books=(1987) 田裕之(訳) その基本形態』誠信書房 6.Kollock, P. (1994) The Emergence of Exchange Structures: An Experimental Study of Uncertainty, 析も盛んに行われてい Commitment, and Trust, American Journal of る.これに対して,前者の研究はあまり進んでいな Sociology, Vol. 100, No. 2:313-345 7.佐藤嘉倫(1998) 『意図的社会変動の理論 い.しかし地位・役割構造の生成過程の 析は社会 合理的選 択理論による 析』東京大学出版会 学における中心問題の一つであり,これに進化ゲー 8.Sato, Y. (2003) Can Evolutionary Game Theory ム理論やエージェント・ベースト・モデルが貢献す Evolve in Sociology?:Beyond Solving the Prisoners 『理論と方法』Vol.18,No.2:185-196 Dilemma, ることが期待される(Sato, 2003). 9.佐藤嘉倫(2004) 「社会学における進化論」 『人工知能 学会誌』Vol.19,No.6:686-693 10.佐藤嘉倫(2005a)「社会 析の道具としてのゲーム理 注 ⑴ 本稿の進化ゲーム理論の解説は主に佐藤(2004;2005 論」数土直紀・今田高俊(編著)『数理社会学入門』勁草 a)に基づいている. ⑵ すべての個体が黙秘戦略を持っている社会からスター 11.佐藤嘉倫(2005b)「市場における信頼関係とコミット トすると,自白戦略を持っている個体が占める社会には メント関係」佐藤嘉倫・平 闊(編著)『ネットワーク・ ならない.しかし突然変異の可能性をわずかに加えると, ダイナミクス そのようになる. 書房(印刷中) 書房 9 社会ネットワークと合理的選択』勁草 12.佐藤嘉倫・平 闊(編著) (2005) 『ネットワーク・ダ イナミクス 13.山岸俊男(1998) 『信頼の構造 社会ネットワークと合理的選択』勁草書 ゲーム 房(印刷中) 10 』東京大学出版会 こころと社会の進化 New Analytical Tools in Sociology:Evolutionary Game Theory and Agent-based Modeling by Yoshimichi SATO Abstract: We argue that evolutionary game theory and agent-based modeling are excellent analytical tools with which we explain social phenomena. They are closely related to the micro-macro approach that tries to explain social phenomena from the interactions between actors at the micro level and,thus,contribute to developing substantial theories based on the approach. We pick up two examples of evolutionary game theory and agent-based modeling to explain their basic logic and to show their potential in sociology:Axelrod s genetic algorithm that shows the robustness of the tit-for-tat strategy and Sato s learning model that explains the emergence and collapse of trust and commitment relationships. Keywords:Evolutionary Game Theory, Agent-based Modeling, Tit-for-tat Strategy, and Trust 11
© Copyright 2024 Paperzz