概要 - 情報工学科・専攻

Bradley-Terry モデルを用いたサッカーW 杯の分析
03D8103002L 田村 直也
中央大学理工学部情報工学科 田口研究室
2007 年 3 月
1
はじめに
サッカーにおいて,各国代表チームの強さや W
杯各大会の面白さは,各個人の主観によって評価が
異なる.そこで,Bradley-Terry モデル[1](BT モ
デル)を用いて代表チームの強さを推定するととも
に W 杯の分析を行う.
2 Bradley-Terry モデル
2.1 「強さ」について
全部で m 個のチームが互いに何回か対戦すると
し,チーム i がチーム j に勝つ確率を pij と表す.た
だし,引き分けはないと仮定する.ここで,各チー
ムに対して「強さ」 π 1 , π 2 , L , π m が存在して,全て
の i , j の組み合わせに対し,確率 pij が,
πi
p ij =
(1)
πi +π j
で表されると想定する.
2.2 BT モデルの意味
チーム i と j の「勝負」を,別のチーム k を介し
た対戦結果で決める.このとき,各チーム間に「カ
モ・苦手」関係がないとすれば,
p ij =
p ik p kj
(2)
p ik p kj + p ki p jk
が成り立ち,
p
(3)
π i = im (i = 1,2, L , m − 1) ,π m = 1
p mi
とおくことで,式(1)が成立する.
2.3 勝ち数の分布と尤度
チーム i と j の間の試合数を n ij ( = n ji ) とし, i の
j に対する勝ち数を確率変数 X ij で表す. X ij が 2
項分布に従い,BT モデルが成り立つときに, i の
総勝ち数 Ti を用いて,未知母数 π の尤度関数は,
m
∏∏ (π
+π j)
− nij
⋅
∏π
Ti
(4)
i< j
i =1
となる.この場合に各チームの「強さ」を求めるた
めには,試合数の他に各チームの総勝ち数 Ti を知れ
ばいいことになる.
2.4 「強さ」の推定
「強さ」π の推定に最尤方程式を用いる.適当な
定数 k をおき, π の総和とする.この場合の最尤方
程式の解はラグランジュの未定乗数法によって定
められる.すなわち,式(3)の対数尤度から,λ をラ
グランジュ乗数として,
T
i −
πˆ i
∑ πˆ
j ≠i
n ij
i
+ πˆ j
i
i
− λ = 0 (i = 1,2, L , m ) (5)
4 BT モデルを用いた強さ推定
4.1 BT モデルを用いた FIFA ランキングの推定
2003 年 1 月 1 日∼2006 年 7 月 24 日の期間で,
全敗でない 194 チームについて,BT モデルを用い
て強さを推定する.その強さの推定ランキングを作
成し,FIFA ランキングと比較する(表 1).
FIFA ランキングよりも,推定ランキングは欧州
のチームを上位に占めている.しかし,2 つのラン
キングの順位の相関係数は 0.8956 となり,正の相
関関係が見られる.
表 1 推定ランキングと FIFA ランキング
順位
1
2
3
4
5
6
7
8
9
10
推定ランキング
国名
強さ
フランス
9.42
イタリア
8.00
スペイン
7.56
チェコ
6.12
イングランド
6.06
オランダ
5.40
ポルトガル
5.33
アイルランド
4.98
アルゼンチン
4.85
ブラジル
4.55
1
11
21
31
41
51
61
71
81
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
推定ランキング(1年毎)
m
∑π̂
i =1
i
=k
(6)
が得られる.式(5),(6)より, πˆ i に適当な初期近似
値を代入し, πˆ i が収束するまで繰り返し計算する
ことで, π を推定できる.
FIFA ランキング
国名
成績 pt.
ブラジル
1,630
イタリア
1,550
アルゼンチン
1,472
フランス
1,462
イングランド
1,434
オランダ
1,322
スペイン
1,309
ポルトガル
1,301
ドイツ
1,229
チェコ
1,223
4.2 年度別と監督別強さ推定
各国代表チームから対象チームを 1 チーム選び,
年度別に別々のチームと考え,BT モデルを用いて
年度別強さを推定し,その順位と FIFA ランキング
の順位の推移を比較する.図 1 に日本の各ランキン
グの推移を示す.また,日本について,就任監督(加
茂,岡田,トルシエ,ジーコ)によって別々のチー
ムと考え,BT モデルを用いて監督別日本代表の強
さを推定する(図 2).
FIFA ランキングは他チームとの相対的な強さの
順位である.一方,BT モデルにより推定した強さ
は絶対的なので,対象チームの年度別強さを比較す
る場合,年度別推定ランキングの方が優れている.
また,図 2 から,日本はトルシエ監督時代が最も強
く,岡田監督時代が最も弱いことがわかる.
推定ランキング(2年毎)
FIFAランキング
図 1 日本の各ランキングの順位の推移
3
2.5
2
強さ
L = const.×
開催日,開催国,対戦国,試合結果を文献[2]から集
計した.試合結果は「勝ち」
「負け」
「引き分け」の
3 通りとし,
「引き分け」は 0.5 勝 0.5 敗と扱う.
3.2 FIFA ランキングデータ
1995 年 2 月∼2006 年 7 月の 129 回の FIFA ラン
キングを文献[2]から集計した.
順位
あらまし:本研究では,Bradley-Terry モデルを用
いてサッカー各国代表チームの強さを推定し,その
強さを用いて試合の面白さを定義し,W 杯の分析を
行う.
キーワード:Bradley-Terry モデル,W 杯
1.5
1
3 使用データ
3.1 試合データ
1995 年 1 月 1 日∼2006 年 7 月 24 日の FIFA 加
盟 207 カ国の国際 A マッチ 9,627 試合について,
0.5
0
加茂
岡田
トルシエ
日本代表監督
ジーコ
図 2 監督別日本代表の強さ
4.3 試合開催地別強さ推定
各国代表チームから対象チームを 1 チーム選び,
「ホーム(H)」
「アウェー(A)
」
「中立(N)」の試
合によって別々のチームと考え,BT モデルを用い
て試合開催地別強さを推定する.図 3 に,試合開催
地別強さの順序別チーム数を示す.
対象チームとなった 130 チーム中 116 チームの
試合開催地別強さが「H>A」となり,
「ホーム有利」
が BT モデルによる推定からも説明できる.
決勝トーナメントの,現実の面白さ I Real ,最大の面
白さ I max ,最小の面白さ I min ,面白さの期待値 I を
示す.
決勝トーナメントは,どの大会の I Real も I を上回
ったが,1998 年 W 杯が最も面白く,2002 年 W 杯
が最も面白くないことがわかる.また, I も I Real と
同様の順になっている.
180
160
60
140
120
面白さ
チーム数
50
40
100
80
60
30
40
20
20
0
10
1998年W杯
IReal
0
H>N>A H>A>N N>H>A N>A>H A>H>N A>N>H
4.4 大陸連盟をチームと考えた強さ推定
1995 年 1 月 1 日∼2006 年 7 月 24 日に行われた
試合を,各国代表チームが所属する 6 つの大陸連盟
毎に集計し,大陸連盟をチームと考え,BT モデル
によって強さを推定する.その際,オーストラリア
がオセアニア所属(ケース 1)とアジア所属(ケー
ス 2)の 2 つの場合で推定する(図 4)
.
ケース 1 とケース 2 を比べると,オーストラリア
の移籍によって,オセアニアは大幅に弱体化したが,
アジアへの影響は小さいことがわかる.
ケース2
1.75
1.5
1.25
強さ
2006年W杯
I
図 5 W 杯決勝トーナメントの面白さの評価
図 3 試合開催地別強さの順序別チーム数
ケース1
2002年W杯
I max
I min
1
0.75
5.2.3 決勝トーナメント進出チームの評価
グループリーグから決勝トーナメント 1 回戦の
対戦表 f が決まる確率を p f ,対戦表 f から求まる
I を E f として,グループリーグから決勝トーナメ
ント進出チームを考慮した E f の期待値 E は,
E =
∑p
⋅Ef
(10)
と求まる.図 6 に,1998 年,2002 年,2006 年 W
杯の,現実の決勝トーナメント進出チームによる期
待値 E Real ,最大の期待値 E max ,最小の期待値 E min ,
E f の期待値 E を示す.
E は,1998 年 W 杯が最も高く,2002 年 W 杯が
最も低い.また,複数の強豪国がグループリーグ敗
退した 2002 年 W 杯のみ, E Real が E を下回った.
f
f
0.5
160
0.25
140
0
欧州
南米
オセアニア
アフリカ
アジア
120
北中米カリブ海
5 BT モデルを用いた W 杯の分析
5.1 試合の面白さ
対戦する 2 チームがより強く,勝利チームが予想
し難い試合ほど面白いとして,チーム i 対チーム j
の試合の面白さ I ij を,
πi +π j
I ij =
⋅ (− p ij (log( p ij )) − p ji (log( p ji )) ) (7)
2
と定義する.
5.2 W 杯の分析
5.2.1 W 杯本大会について
1998 年,2002 年,2006 年に開催された W 杯は,
32 チームによるグループリーグと,16 チームによ
る決勝トーナメントで構成されている.なお,決勝
トーナメント 1 回戦は,グループとその順位から組
み方があらかじめ決められている.
5.2.2 決勝トーナメントの評価
トーナメントの回戦による重みを w とする.決勝
トーナメントで行われる 15 試合の面白さを式(7)か
ら計算し, I m ( m = 1,2,…,15)とする.このとき,決
勝トーナメント全試合の対戦表 t がわかっていると
き,決勝トーナメントの面白さ I t を,
15
It =
∑w⋅I
(8)
とする.また,それが実現する確率を p t として,1
回戦の対戦表が決まったときの決勝トーナメント
の面白さの期待値 I は,
m
m =1
16384
I =
∑p
t =1
t
⋅ It
(9)
となる.図 5 に,1998 年,2002 年,2006 年 W 杯
面白さ
図 4 大陸連盟の強さ
100
80
60
40
20
0
1998年W杯
2002年W杯
EReal
Emax
Emin
2006年W杯
E
図 6 決勝トーナメント進出チームによる面白さの評価
5.3 動的計画法を用いたトーナメントの最適割当
決勝トーナメント進出チームが決定したとき,1
回戦の対戦表を任意に決定できると仮定し,式(9)
の I が最大となるような 1 回戦の対戦表(最適割当)
を求める.ただし,全通りを考えるには組合せが多
いため,動的計画法[3]を用いて計算を高速化させる.
その結果,定められた組合せ方よりも良い割当が存
在することがわかった.
6
おわりに
BT モデルを用いてサッカーの各国代表チームの
強さを推定した.さらに,推定した強さを用いて,
過去 3 大会の W 杯の分析を行った.決勝トーナメ
ントは,1998 年 W 杯が最も面白く,2002 年 W 杯
が最も面白くなかった.また,決勝トーナメント進
出チームを考慮すると,2002 年 W 杯のみ,期待以
下の面白さであることがわかった.
参考文献
[1] 竹内啓,藤野和健,スポーツの数理科学,共立
出版社,東京,1988.
[2] 国際サッカー連盟,<http://www.fifa.com>.
[3] 浅野孝夫,今井浩,計算とアルゴリズム,オー
ム社,東京,2000.