Bradley-Terry モデルを用いたサッカーW 杯の分析 03D8103002L 田村 直也 中央大学理工学部情報工学科 田口研究室 2007 年 3 月 1 はじめに サッカーにおいて,各国代表チームの強さや W 杯各大会の面白さは,各個人の主観によって評価が 異なる.そこで,Bradley-Terry モデル[1](BT モ デル)を用いて代表チームの強さを推定するととも に W 杯の分析を行う. 2 Bradley-Terry モデル 2.1 「強さ」について 全部で m 個のチームが互いに何回か対戦すると し,チーム i がチーム j に勝つ確率を pij と表す.た だし,引き分けはないと仮定する.ここで,各チー ムに対して「強さ」 π 1 , π 2 , L , π m が存在して,全て の i , j の組み合わせに対し,確率 pij が, πi p ij = (1) πi +π j で表されると想定する. 2.2 BT モデルの意味 チーム i と j の「勝負」を,別のチーム k を介し た対戦結果で決める.このとき,各チーム間に「カ モ・苦手」関係がないとすれば, p ij = p ik p kj (2) p ik p kj + p ki p jk が成り立ち, p (3) π i = im (i = 1,2, L , m − 1) ,π m = 1 p mi とおくことで,式(1)が成立する. 2.3 勝ち数の分布と尤度 チーム i と j の間の試合数を n ij ( = n ji ) とし, i の j に対する勝ち数を確率変数 X ij で表す. X ij が 2 項分布に従い,BT モデルが成り立つときに, i の 総勝ち数 Ti を用いて,未知母数 π の尤度関数は, m ∏∏ (π +π j) − nij ⋅ ∏π Ti (4) i< j i =1 となる.この場合に各チームの「強さ」を求めるた めには,試合数の他に各チームの総勝ち数 Ti を知れ ばいいことになる. 2.4 「強さ」の推定 「強さ」π の推定に最尤方程式を用いる.適当な 定数 k をおき, π の総和とする.この場合の最尤方 程式の解はラグランジュの未定乗数法によって定 められる.すなわち,式(3)の対数尤度から,λ をラ グランジュ乗数として, T i − πˆ i ∑ πˆ j ≠i n ij i + πˆ j i i − λ = 0 (i = 1,2, L , m ) (5) 4 BT モデルを用いた強さ推定 4.1 BT モデルを用いた FIFA ランキングの推定 2003 年 1 月 1 日∼2006 年 7 月 24 日の期間で, 全敗でない 194 チームについて,BT モデルを用い て強さを推定する.その強さの推定ランキングを作 成し,FIFA ランキングと比較する(表 1). FIFA ランキングよりも,推定ランキングは欧州 のチームを上位に占めている.しかし,2 つのラン キングの順位の相関係数は 0.8956 となり,正の相 関関係が見られる. 表 1 推定ランキングと FIFA ランキング 順位 1 2 3 4 5 6 7 8 9 10 推定ランキング 国名 強さ フランス 9.42 イタリア 8.00 スペイン 7.56 チェコ 6.12 イングランド 6.06 オランダ 5.40 ポルトガル 5.33 アイルランド 4.98 アルゼンチン 4.85 ブラジル 4.55 1 11 21 31 41 51 61 71 81 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 推定ランキング(1年毎) m ∑π̂ i =1 i =k (6) が得られる.式(5),(6)より, πˆ i に適当な初期近似 値を代入し, πˆ i が収束するまで繰り返し計算する ことで, π を推定できる. FIFA ランキング 国名 成績 pt. ブラジル 1,630 イタリア 1,550 アルゼンチン 1,472 フランス 1,462 イングランド 1,434 オランダ 1,322 スペイン 1,309 ポルトガル 1,301 ドイツ 1,229 チェコ 1,223 4.2 年度別と監督別強さ推定 各国代表チームから対象チームを 1 チーム選び, 年度別に別々のチームと考え,BT モデルを用いて 年度別強さを推定し,その順位と FIFA ランキング の順位の推移を比較する.図 1 に日本の各ランキン グの推移を示す.また,日本について,就任監督(加 茂,岡田,トルシエ,ジーコ)によって別々のチー ムと考え,BT モデルを用いて監督別日本代表の強 さを推定する(図 2). FIFA ランキングは他チームとの相対的な強さの 順位である.一方,BT モデルにより推定した強さ は絶対的なので,対象チームの年度別強さを比較す る場合,年度別推定ランキングの方が優れている. また,図 2 から,日本はトルシエ監督時代が最も強 く,岡田監督時代が最も弱いことがわかる. 推定ランキング(2年毎) FIFAランキング 図 1 日本の各ランキングの順位の推移 3 2.5 2 強さ L = const.× 開催日,開催国,対戦国,試合結果を文献[2]から集 計した.試合結果は「勝ち」 「負け」 「引き分け」の 3 通りとし, 「引き分け」は 0.5 勝 0.5 敗と扱う. 3.2 FIFA ランキングデータ 1995 年 2 月∼2006 年 7 月の 129 回の FIFA ラン キングを文献[2]から集計した. 順位 あらまし:本研究では,Bradley-Terry モデルを用 いてサッカー各国代表チームの強さを推定し,その 強さを用いて試合の面白さを定義し,W 杯の分析を 行う. キーワード:Bradley-Terry モデル,W 杯 1.5 1 3 使用データ 3.1 試合データ 1995 年 1 月 1 日∼2006 年 7 月 24 日の FIFA 加 盟 207 カ国の国際 A マッチ 9,627 試合について, 0.5 0 加茂 岡田 トルシエ 日本代表監督 ジーコ 図 2 監督別日本代表の強さ 4.3 試合開催地別強さ推定 各国代表チームから対象チームを 1 チーム選び, 「ホーム(H)」 「アウェー(A) 」 「中立(N)」の試 合によって別々のチームと考え,BT モデルを用い て試合開催地別強さを推定する.図 3 に,試合開催 地別強さの順序別チーム数を示す. 対象チームとなった 130 チーム中 116 チームの 試合開催地別強さが「H>A」となり, 「ホーム有利」 が BT モデルによる推定からも説明できる. 決勝トーナメントの,現実の面白さ I Real ,最大の面 白さ I max ,最小の面白さ I min ,面白さの期待値 I を 示す. 決勝トーナメントは,どの大会の I Real も I を上回 ったが,1998 年 W 杯が最も面白く,2002 年 W 杯 が最も面白くないことがわかる.また, I も I Real と 同様の順になっている. 180 160 60 140 120 面白さ チーム数 50 40 100 80 60 30 40 20 20 0 10 1998年W杯 IReal 0 H>N>A H>A>N N>H>A N>A>H A>H>N A>N>H 4.4 大陸連盟をチームと考えた強さ推定 1995 年 1 月 1 日∼2006 年 7 月 24 日に行われた 試合を,各国代表チームが所属する 6 つの大陸連盟 毎に集計し,大陸連盟をチームと考え,BT モデル によって強さを推定する.その際,オーストラリア がオセアニア所属(ケース 1)とアジア所属(ケー ス 2)の 2 つの場合で推定する(図 4) . ケース 1 とケース 2 を比べると,オーストラリア の移籍によって,オセアニアは大幅に弱体化したが, アジアへの影響は小さいことがわかる. ケース2 1.75 1.5 1.25 強さ 2006年W杯 I 図 5 W 杯決勝トーナメントの面白さの評価 図 3 試合開催地別強さの順序別チーム数 ケース1 2002年W杯 I max I min 1 0.75 5.2.3 決勝トーナメント進出チームの評価 グループリーグから決勝トーナメント 1 回戦の 対戦表 f が決まる確率を p f ,対戦表 f から求まる I を E f として,グループリーグから決勝トーナメ ント進出チームを考慮した E f の期待値 E は, E = ∑p ⋅Ef (10) と求まる.図 6 に,1998 年,2002 年,2006 年 W 杯の,現実の決勝トーナメント進出チームによる期 待値 E Real ,最大の期待値 E max ,最小の期待値 E min , E f の期待値 E を示す. E は,1998 年 W 杯が最も高く,2002 年 W 杯が 最も低い.また,複数の強豪国がグループリーグ敗 退した 2002 年 W 杯のみ, E Real が E を下回った. f f 0.5 160 0.25 140 0 欧州 南米 オセアニア アフリカ アジア 120 北中米カリブ海 5 BT モデルを用いた W 杯の分析 5.1 試合の面白さ 対戦する 2 チームがより強く,勝利チームが予想 し難い試合ほど面白いとして,チーム i 対チーム j の試合の面白さ I ij を, πi +π j I ij = ⋅ (− p ij (log( p ij )) − p ji (log( p ji )) ) (7) 2 と定義する. 5.2 W 杯の分析 5.2.1 W 杯本大会について 1998 年,2002 年,2006 年に開催された W 杯は, 32 チームによるグループリーグと,16 チームによ る決勝トーナメントで構成されている.なお,決勝 トーナメント 1 回戦は,グループとその順位から組 み方があらかじめ決められている. 5.2.2 決勝トーナメントの評価 トーナメントの回戦による重みを w とする.決勝 トーナメントで行われる 15 試合の面白さを式(7)か ら計算し, I m ( m = 1,2,…,15)とする.このとき,決 勝トーナメント全試合の対戦表 t がわかっていると き,決勝トーナメントの面白さ I t を, 15 It = ∑w⋅I (8) とする.また,それが実現する確率を p t として,1 回戦の対戦表が決まったときの決勝トーナメント の面白さの期待値 I は, m m =1 16384 I = ∑p t =1 t ⋅ It (9) となる.図 5 に,1998 年,2002 年,2006 年 W 杯 面白さ 図 4 大陸連盟の強さ 100 80 60 40 20 0 1998年W杯 2002年W杯 EReal Emax Emin 2006年W杯 E 図 6 決勝トーナメント進出チームによる面白さの評価 5.3 動的計画法を用いたトーナメントの最適割当 決勝トーナメント進出チームが決定したとき,1 回戦の対戦表を任意に決定できると仮定し,式(9) の I が最大となるような 1 回戦の対戦表(最適割当) を求める.ただし,全通りを考えるには組合せが多 いため,動的計画法[3]を用いて計算を高速化させる. その結果,定められた組合せ方よりも良い割当が存 在することがわかった. 6 おわりに BT モデルを用いてサッカーの各国代表チームの 強さを推定した.さらに,推定した強さを用いて, 過去 3 大会の W 杯の分析を行った.決勝トーナメ ントは,1998 年 W 杯が最も面白く,2002 年 W 杯 が最も面白くなかった.また,決勝トーナメント進 出チームを考慮すると,2002 年 W 杯のみ,期待以 下の面白さであることがわかった. 参考文献 [1] 竹内啓,藤野和健,スポーツの数理科学,共立 出版社,東京,1988. [2] 国際サッカー連盟,<http://www.fifa.com>. [3] 浅野孝夫,今井浩,計算とアルゴリズム,オー ム社,東京,2000.
© Copyright 2024 Paperzz