概要 - 情報工学科・専攻

Bradley-Terry モデルを用いたサッカーW 杯の分析
03D8103002L 田村直也
中央大学理工学部情報工学科田口研究室
2007 年 3 月
1
はじめに
サッカーにおいて，各国代表チームの強さや W
杯各大会の面白さは，各個人の主観によって評価が
異なる．そこで，Bradley-Terry モデル[1]（BT モ
デル）を用いて代表チームの強さを推定するととも
に W 杯の分析を行う．
2 Bradley-Terry モデル
2.1 「強さ」について
全部で m 個のチームが互いに何回か対戦すると
し，チーム i がチーム j に勝つ確率を pij と表す．た
だし，引き分けはないと仮定する．ここで，各チー
ムに対して「強さ」 π 1 , π 2 , L , π m が存在して，全て
の i ， j の組み合わせに対し，確率 pij が，
πi
p ij =
(1)
πi +π j
で表されると想定する．
2.2 BT モデルの意味
チーム i と j の「勝負」を，別のチーム k を介し
た対戦結果で決める．このとき，各チーム間に「カ
モ・苦手」関係がないとすれば，
p ij =
p ik p kj
(2)
p ik p kj + p ki p jk
が成り立ち，
p
(3)
π i = im (i = 1,2, L , m − 1) ，π m = 1
p mi
とおくことで，式(1)が成立する．
2.3 勝ち数の分布と尤度
チーム i と j の間の試合数を n ij ( = n ji ) とし， i の
j に対する勝ち数を確率変数 X ij で表す． X ij が 2
項分布に従い，BT モデルが成り立つときに， i の
総勝ち数 Ti を用いて，未知母数 π の尤度関数は，
m
∏∏ (π
+π j)
− nij
⋅
∏π
Ti
(4)
i< j
i =1
となる．この場合に各チームの「強さ」を求めるた
めには，試合数の他に各チームの総勝ち数 Ti を知れ
ばいいことになる．
2.4 「強さ」の推定
「強さ」π の推定に最尤方程式を用いる．適当な
定数 k をおき， π の総和とする．この場合の最尤方
程式の解はラグランジュの未定乗数法によって定
められる．すなわち，式(3)の対数尤度から，λ をラ
グランジュ乗数として，
T
i −
πˆ i
∑ πˆ
j ≠i
n ij
i
+ πˆ j
i
i
− λ = 0 (i = 1,2, L , m ) (5)
4 BT モデルを用いた強さ推定
4.1 BT モデルを用いた FIFA ランキングの推定
2003 年 1 月 1 日∼2006 年 7 月 24 日の期間で，
全敗でない 194 チームについて，BT モデルを用い
て強さを推定する．その強さの推定ランキングを作
成し，FIFA ランキングと比較する（表 1）．
FIFA ランキングよりも，推定ランキングは欧州
のチームを上位に占めている．しかし，2 つのラン
キングの順位の相関係数は 0.8956 となり，正の相
関関係が見られる．
表 1 推定ランキングと FIFA ランキング
順位
1
2
3
4
5
6
7
8
9
10
推定ランキング
国名
強さ
フランス
9.42
イタリア
8.00
スペイン
7.56
チェコ
6.12
イングランド
6.06
オランダ
5.40
ポルトガル
5.33
アイルランド
4.98
アルゼンチン
4.85
ブラジル
4.55
1
11
21
31
41
51
61
71
81
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
推定ランキング(1年毎）
m
∑π̂
i =1
i
=k
(6)
が得られる．式(5)，(6)より， πˆ i に適当な初期近似
値を代入し， πˆ i が収束するまで繰り返し計算する
ことで， π を推定できる．
FIFA ランキング
国名
成績 pt.
ブラジル
1,630
イタリア
1,550
アルゼンチン
1,472
フランス
1,462
イングランド
1,434
オランダ
1,322
スペイン
1,309
ポルトガル
1,301
ドイツ
1,229
チェコ
1,223
4.2 年度別と監督別強さ推定
各国代表チームから対象チームを 1 チーム選び，
年度別に別々のチームと考え，BT モデルを用いて
年度別強さを推定し，その順位と FIFA ランキング
の順位の推移を比較する．図 1 に日本の各ランキン
グの推移を示す．また，日本について，就任監督（加
茂，岡田，トルシエ，ジーコ）によって別々のチー
ムと考え，BT モデルを用いて監督別日本代表の強
さを推定する（図 2）．
FIFA ランキングは他チームとの相対的な強さの
順位である．一方，BT モデルにより推定した強さ
は絶対的なので，対象チームの年度別強さを比較す
る場合，年度別推定ランキングの方が優れている．
また，図 2 から，日本はトルシエ監督時代が最も強
く，岡田監督時代が最も弱いことがわかる．
推定ランキング(2年毎）
FIFAランキング
図 1 日本の各ランキングの順位の推移
3
2.5
2
強さ
L = const.×
開催日，開催国，対戦国，試合結果を文献[2]から集
計した．試合結果は「勝ち」
「負け」
「引き分け」の
3 通りとし，
「引き分け」は 0.5 勝 0.5 敗と扱う．
3.2 FIFA ランキングデータ
1995 年 2 月∼2006 年 7 月の 129 回の FIFA ラン
キングを文献[2]から集計した．
順位
あらまし：本研究では，Bradley-Terry モデルを用
いてサッカー各国代表チームの強さを推定し，その
強さを用いて試合の面白さを定義し，W 杯の分析を
行う．
キーワード：Bradley-Terry モデル，W 杯
1.5
1
3 使用データ
3.1 試合データ
1995 年 1 月 1 日∼2006 年 7 月 24 日の FIFA 加
盟 207 カ国の国際 A マッチ 9,627 試合について，
0.5
0
加茂
岡田
トルシエ
日本代表監督
ジーコ
図 2 監督別日本代表の強さ
4.3 試合開催地別強さ推定
各国代表チームから対象チームを 1 チーム選び，
「ホーム（H）」
「アウェー（A）
」
「中立（N）」の試
合によって別々のチームと考え，BT モデルを用い
て試合開催地別強さを推定する．図 3 に，試合開催
地別強さの順序別チーム数を示す．
対象チームとなった 130 チーム中 116 チームの
試合開催地別強さが「H>A」となり，
「ホーム有利」
が BT モデルによる推定からも説明できる．
決勝トーナメントの，現実の面白さ I Real ，最大の面
白さ I max ，最小の面白さ I min ，面白さの期待値 I を
示す．
決勝トーナメントは，どの大会の I Real も I を上回
ったが，1998 年 W 杯が最も面白く，2002 年 W 杯
が最も面白くないことがわかる．また， I も I Real と
同様の順になっている．
180
160
60
140
120
面白さ
チーム数
50
40
100
80
60
30
40
20
20
0
10
1998年W杯
IReal
0
H＞N＞A H＞A＞N N＞H＞A N＞A＞H A＞H＞N A＞N＞H
4.4 大陸連盟をチームと考えた強さ推定
1995 年 1 月 1 日∼2006 年 7 月 24 日に行われた
試合を，各国代表チームが所属する 6 つの大陸連盟
毎に集計し，大陸連盟をチームと考え，BT モデル
によって強さを推定する．その際，オーストラリア
がオセアニア所属（ケース 1）とアジア所属（ケー
ス 2）の 2 つの場合で推定する（図 4）
．
ケース 1 とケース 2 を比べると，オーストラリア
の移籍によって，オセアニアは大幅に弱体化したが，
アジアへの影響は小さいことがわかる．
ケース2
1.75
1.5
1.25
強さ
2006年W杯
I
図 5 W 杯決勝トーナメントの面白さの評価
図 3 試合開催地別強さの順序別チーム数
ケース1
2002年W杯
I max
I min
1
0.75
5.2.3 決勝トーナメント進出チームの評価
グループリーグから決勝トーナメント 1 回戦の
対戦表 f が決まる確率を p f ，対戦表 f から求まる
I を E f として，グループリーグから決勝トーナメ
ント進出チームを考慮した E f の期待値 E は，
E =
∑p
⋅Ef
(10)
と求まる．図 6 に，1998 年，2002 年，2006 年 W
杯の，現実の決勝トーナメント進出チームによる期
待値 E Real ，最大の期待値 E max ，最小の期待値 E min ，
E f の期待値 E を示す．
E は，1998 年 W 杯が最も高く，2002 年 W 杯が
最も低い．また，複数の強豪国がグループリーグ敗
退した 2002 年 W 杯のみ， E Real が E を下回った．
f
f
0.5
160
0.25
140
0
欧州
南米
オセアニア
アフリカ
アジア
120
北中米カリブ海
5 BT モデルを用いた W 杯の分析
5.1 試合の面白さ
対戦する 2 チームがより強く，勝利チームが予想
し難い試合ほど面白いとして，チーム i 対チーム j
の試合の面白さ I ij を，
πi +π j
I ij =
⋅ (− p ij (log( p ij )) − p ji (log( p ji )) ) (7)
2
と定義する．
5.2 W 杯の分析
5.2.1 W 杯本大会について
1998 年，2002 年，2006 年に開催された W 杯は，
32 チームによるグループリーグと，16 チームによ
る決勝トーナメントで構成されている．なお，決勝
トーナメント 1 回戦は，グループとその順位から組
み方があらかじめ決められている．
5.2.2 決勝トーナメントの評価
トーナメントの回戦による重みを w とする．決勝
トーナメントで行われる 15 試合の面白さを式(7)か
ら計算し， I m ( m = 1,2,…,15)とする．このとき，決
勝トーナメント全試合の対戦表 t がわかっていると
き，決勝トーナメントの面白さ I t を，
15
It =
∑w⋅I
(8)
とする．また，それが実現する確率を p t として，1
回戦の対戦表が決まったときの決勝トーナメント
の面白さの期待値 I は，
m
m =1
16384
I =
∑p
t =1
t
⋅ It
(9)
となる．図 5 に，1998 年，2002 年，2006 年 W 杯
面白さ
図 4 大陸連盟の強さ
100
80
60
40
20
0
1998年W杯
2002年W杯
EReal
Emax
Emin
2006年W杯
E
図 6 決勝トーナメント進出チームによる面白さの評価
5.3 動的計画法を用いたトーナメントの最適割当
決勝トーナメント進出チームが決定したとき，1
回戦の対戦表を任意に決定できると仮定し，式(9)
の I が最大となるような 1 回戦の対戦表（最適割当）
を求める．ただし，全通りを考えるには組合せが多
いため，動的計画法[3]を用いて計算を高速化させる．
その結果，定められた組合せ方よりも良い割当が存
在することがわかった．
6
おわりに
BT モデルを用いてサッカーの各国代表チームの
強さを推定した．さらに，推定した強さを用いて，
過去 3 大会の W 杯の分析を行った．決勝トーナメ
ントは，1998 年 W 杯が最も面白く，2002 年 W 杯
が最も面白くなかった．また，決勝トーナメント進
出チームを考慮すると，2002 年 W 杯のみ，期待以
下の面白さであることがわかった．
参考文献
[1] 竹内啓，藤野和健，スポーツの数理科学，共立
出版社，東京，1988．
[2] 国際サッカー連盟，<http://www.fifa.com>．
[3] 浅野孝夫，今井浩，計算とアルゴリズム，オー
ム社，東京，2000．

Download Report