MMRC DISCUSSION PAPER SERIES 顧客嗜好の時間的変化を

MMRC
DISCUSSION PAPER SERIES
No. 229
顧客嗜好の時間的変化を組み込んだ音楽 CD 選好モデルの
構築と CRM への応用
東京大学大学院経済学研究科 経営専攻 博士課程
勝又 壮太郎
東京大学大学院経済学研究科 教授
阿部 誠
2008 年 4 月
東京大学ものづくり経営研究センター
Manufacturing Management Research Center (MMRC)
ディスカッション・ペーパー・シリーズは未定稿を議論を目的として公開しているものである。引用・
複写の際には著者の了解を得られたい。
http://merc.e.u-tokyo.ac.jp/mmrc/dp/index.html
顧客嗜好の時間的変化を組み込んだ音楽 CD 選好モデルの構築と CRM への応用
A Dynamic preference model for music CD purchase data and its application to CRM
勝又 壮太郎 KATSUMATA Sotaro
東京大学大学院経済学研究科
経営専攻 博士課程
購買履歴データから顧客の嗜好を把握することは、CRM(顧客関係管理)における基礎と
なるもので、この推定を高精度で行うことは、多くの顧客を抱える企業にとって非常に重
要な課題となっている。本研究では、階層ベイズモデルを用いて顧客の嗜好を推定するモ
デルを構築する。また、モデルに時間的な変化を導入し、時間の経過が顧客個人の嗜好に
与える影響についても考察する。さらに、時間変化を組み込まないモデルと、その当ては
まりの良さや予測精度を比較する。
To pursue effective CRM, it is important for a firm to understand the preference of
individual customers from their purchase history data. In this research, a hierarchical
Bayes model is proposed to capture individual preferences that change dynamically
from their transaction data. The model is compared against the static preference model
for fit and prediction.
キーワード:CRM, Point of Sale (POS), 階層ベイズモデル
Key Words: CRM, Point of Sale (POS), Hierarchical Bayes Model
顧客嗜好の時間的変化を組み込んだ
音楽 CD 選好モデルの構築と CRM への応用
勝又壮太郎
(東京大学大学院経済学研究科)
阿部誠
(東京大学大学院経済学研究科)
1
はじめに
顧客個人の嗜好把握は,購買予測やそれに伴うプロモーションなどの基礎となるものであり,この
推定精度の善し悪しは,それを利用した CRM 施策の成否に大きく影響する。顧客が本当に興味を持
つような製品やブランドを紹介し続けることができれば,顧客の離反を抑えることができる。また,
特定ブランドの購買傾向の高い顧客を見つけて囲い込むことができれば,競合に対して優位を保つ
こともできる。
顧客の嗜好は,一般的には,ID 付き POS データなどの購買履歴データを分析することで推定する
ことができる。手法としては,Berry and Linoff(1997, 2000) などで紹介されている,決定木やニュー
ラルネットワークのようなデータマイニング手法をはじめ,Frances and Paap(2002) にまとめられ
ているような計量モデルなどが使われている。さらに,近年では,MCMC(Markov Chain Monte
Carlo: マルコフ連鎖モンテカルロ) 法によってパラメータを推定する階層ベイズモデルを使った分析
事例が多くみられるようになっている。MCMC 法による個人単位の分析事例は,Rossi, Allenby and
McCulloch(1996) をはじめとして,Abe(2008, forthcoming) や Ansari and Mela(2003) など, 多くの
研究があり,Rossi, Allenby and McCulloch(2005), 阿部 (2003), Rossi and Allenby(2003) によって
まとめられている。階層ベイズモデルを用いる利点として,個人の分析に対する柔軟な拡張性があ
る。従来型の手法では分析できないような小標本のデータであっても,階層化することでパラメータ
の推定が可能となり,分析期間中の購買数が少ない製品に対しても,個人単位の嗜好推定モデルを構
築することができる。
本研究で取り上げる音楽 CD のように,顧客ごとの嗜好の異質性が大きい製品においでは,特に,
顧客個人単位の嗜好を推定が重要となる。音楽 CD は,価格が低いものが購買される製品ではなく,
顧客に興味のないジャンルの CD は,いくら値下げやプロモーションをかけても購買されない。し
かし一方で,顧客に明確な嗜好が存在するため,顧客の嗜好を正確に把握することができれば,製
品の推薦などによって,顧客を囲い込んだり,潜在需要を掘り起こすことができる。映画や音楽 CD
を対象にした研究では,たとえば,廉 (2007) では,協調フィルタリングが用いられている。また,
MCMC 法が用いられた研究としては,Ansari, Essegaier and Kohli(2000) や,勝又 (2007) がある。
これらの 3 研究でも,モデルをもとに,プロモーションやレコメンデーションシステムとしての応用
方法についても論じている。
1
しかしながら,嗜好を推定するモデルであっても,顧客嗜好の時間変化は考慮されていないものは
多い。顧客の嗜好は時間とともに変化するもので,分析期間中であっても,変化し続けていると仮
定するのが妥当である。時間的な変化に焦点を当てた POS データの解析では,主に時系列解析手法
が用いられており,Sato, Higuchi and Kitagawa(2004) や,近藤 (1999) などによって研究され,阿
部・近藤 (2005) でもまとめられているが,個人の嗜好に応用された研究は少ない。
本研究では,顧客嗜好の時間変化を考慮したモデルを構築し,その活用方法を探ることを目的とす
る。モデルの構築においては,勝又 (2007) による分析手法を継承しながら,時間変化要素を組み込
み,顧客嗜好を,時間変化をする部分と変化しない部分に分解する。顧客の嗜好を分解することで,
顧客個人の購買行動を,より精緻に表現するモデルを構築する。また,既存研究によって提案された
モデルと,当てはまりや予測精度を比較し,時間変化を考慮したモデルの優位性を検証する。
モデル概要
2
2.1
先行研究
本節では,勝又 (2007) による研究の特徴を概説する。特に,本研究においても分析方法を継承す
る部分を挙げる。
アーティストスコアの利用
音楽 CD の市場では,多くのアーティストの CD が販売されている。アーティストを一つの製品
と考えると,数百∼数千単位の選択肢があることになる。選択肢の数が多すぎるため,通常の離散選
択モデルで分析することは困難である。そこで,アーティストごとに多次元連続型のアーティストス
コアを与える。この値を求めることで,アーティストスコアを用いて連続型の回帰モデルを構築する
ことができる。
デモグラフィック変数による階層化
顧客一人あたりの音楽 CD の年間購買枚数は少ない。ほとんどの顧客は年間購買枚数は 5 枚以下
であり,10 枚以上の購買履歴のある顧客はほとんどいない。一般的な回帰モデルでは標本数が少な
すぎでモデル化が困難である。そこで,MCMC 法による階層ベイズモデルを採用した。モデルの第
1 層で個人ごとの嗜好パラメータの推定を行い,第 2 層にはデモグラフィック変数によって嗜好を説
明する回帰方程式をおいている。顧客個人の嗜好を個人ごとに求める一方で,年齢や性別などによる
大まかな傾向の情報を加え,標本数の少なさを補っている。
本研究においても,アーティストに多次元連続型のスコアを与え,そのスコアを元に個人嗜好を推
定する。また,モデル構築においても,デモグラフィック変数による階層化を行う。具体的な手順に
ついては,次節以降で説明する。
2
2.2
データ概説
本研究で用いるデータは,音楽 CD 小売店の ID 付き POS データである1 。データ収集期間は 2 年
間,また,記録されている顧客個人のデモグラフィック情報は,性別と生年月日である。ここで,前
半 1 年間をモデル構築のための学習期間とし,後半 1 年間を,モデルの予測精度を測る検証期間と
した。
各アーティストについてスコアを導出するために,一定以上の売上枚数のあるアーティストを分析
対象とする。対象とするアーティストは,学習期間 1 年間での売上枚数が多い上位 500 組(人)と
した。これは CD の全売上枚数の 81 %にあたる。また,分析対象とする顧客については,学習期間
1 年間に 3 枚以上の CD を購買した 55,119 人とした。
ここで,データの分割を行う。55,119 人の顧客をランダムに 2 分割し,一方のデータを用いてアー
ティストスコアを導出する。また,分割したもう一方のデータを用いてモデルを構築する2 。
2.3
アーティストスコアの導出
アーティストのスコアは,前述のとおり,分割した一方のデータから導出する。縦軸に顧客,横軸
にアーティストをとり,第 (i, k) 要素に顧客 i によって購買されたアーティスト k の CD の枚数を入
れた購買履歴行列を作成し,その行列を因子分析にかけ,その因子負荷を求めた。因子分析の推定法
は最尤法,回転法はバリマックス回転を採用した。また,因子数の決定には,購買履歴行列の相関行
列の固有値を参考に決定した。本データでは,2 を超えた固有値が 11 あったので,アーティストス
コアの次元 J = 11 とした。
アーティストスコアは,上述の方法で得られた因子負荷を用いて算出する。次節以降で因子負荷を
用いて顧客個人の嗜好を推定するモデルを構築するため,アーティストスコアを変換する。
因子負荷のとり得る値は [−1, 1] なので,正規分布にはなじまない。そこで,ロジット変換を行う。
ロジット変換は,一般には,(0, 1) の値をとるデータ系列を,(−∞, ∞) の値をとるデータ系列に変
換するもので,以下の式を用いて変換する。ここで,変換前のデータを zi ,変換後のデータを xi と
おく。
(
xi = log
zi
1 − zi
)
(1)
ここで,アーティスト k の因子負荷の第 j 要素を lkj とおいたとき,以下の式を用いて,アーティ
ストスコア fkj を算出する。
(
fkj = log
(0.5lkj + 0.5)
1 − (0.5lkj + 0.5)
)
× 10
(2)
lkj のとり得る値は [−1, 1] なので,[0, 1] の範囲におさめるために 0.5 を掛け,0.5 を加えている。
また,これをロジット変換して得られた fkj は,lkj の正負符号を保持し,大小関係も保持している。
さらに,数値を見やすくするため,10 を掛けている。アーティスト k のアーティストスコアは、こ
こから、fk = {fk1 , fk2 , · · · , fkJ }′ となる。
こうして 500 組 (人) のアーティストそれぞれについて,11 次元のアーティストスコアを与えた。
図 1 は,代表的なアーティストのアーティストスコアをグラフ化したものである。これを見ると,直
1 分析に用いたデータは,平成
17 年度データ解析コンペティションにおいて提供されたものである。
2 このデータ分割を行うことによって,アーティストスコアを算出する集合と,個人嗜好の推定を行う集合を完全に分離さ
せ,アーティストスコアを外部から与えられた数値として扱うことができるようになる
3
図 1: 代表的なアーティストのスコア
感的に似ているアーティストは似ている傾向があるということがわかる。また,軸の傾向も大まか
に把握することができる。例えば,ハロー・プロジェクトのアーティスト「モーニング娘。」と「松
浦亜弥」は,第 1 軸がとても高くなっており,ジャニーズ系アーティストの「Kinki Kids」と「タッ
キー&翼」は,第 10 軸が高くなっていることがわかる。
さらに,表 1 は,各軸について,強く振れたアーティストの上位 15 位までを並べたものである。こ
れを見ると,各軸で強く振れているアーティストの傾向を把握することができる。まず,f1 は,モー
ニング娘。などの Hello!Project 系が高い値となっている。また,f2 はサントラ(サウンドトラック)
などの,歌の入っていない音楽が強く振れている。f3 は,j-pop の女性アーティスト,f4 は洋楽が強
く振れている。他にも,f6 が強く振れたアーティストにはテクノ系が多く,f7 は洋楽,f8 は日本の
男性アーティスト,f9 は B’z などのロック,f10 はジャニーズ系などの男性アイドルが多いことがわ
かる。
4
5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
MONGOL 800
ASIAN KUNG-FU GENERATION
ジャパハリネット
175R
太陽族
横山健
FLOW
10-FEET
B-DASH
オレンジレンジ
locofrank
SHAKALABBITS(SHAKA LABBITS)
レミオロメン
ケツメイシ
nobodyknows+
f8
JAY-Z
アッシャー
ミッシー・エリオット
ネリー
R. ケリー
2パック(トゥパック・シャクール)
G−ユニット
50 セント
ケリス
クリスティーナ・ミリアン
カニエ・ウェスト
アウトキャスト
ノディーシャ
アリシア・キーズ
ブランディー
f4
表 1: 各軸強く正に振れたアーティストの上位 15 組 (人)
モーニング娘。さくら組
モーニング娘。おとめ組
モーニング娘。
ミニモニ。
笹川美和
松浦亜弥
後藤真希
Every Little Thing
BoA
20th Century
玉置成実
相川七瀬
m-flo loves BoA
MINMI
アニメ オムニバス
f11
f10
f9
V6
20th Century
KinKi Kids
堂本剛(KinKi Kids)
タッキー&翼
NEWS
嵐
TOKIO
&G
w-inds.
Lead
氷川きよし
SPEED
GLAY
平川地一丁目
ヒラリー・ダフ
アヴリル・ラヴィーン
ゼブラヘッド
オフスプリング
ステイシー・オリコ
リンキン・パーク
フーバスタンク
ブリトニー・スピアーズ
リンプビズキット(リンプ・ビズキット)
ホリー・ヴァランス
ニュー・ファウンド・グローリー
リリックス
BLINK 182
レイジ・アゲインスト・ザ・マシーン
P!NK
B’z
稲葉浩志
TMG(TAK MATSUMOTO GROUP)
TAK MATSUMOTO
TAK MATSUMOTO feat. 倉木麻衣
TAK MATSUMOTO feat.ZARD
エアロスミス
メタリカ
アイアン・メイデン
ボン・ジョヴィ
TM NETWORK
ZARD
ヴァン ヘイレン
ヴェルヴェット・リヴォルヴァー
布袋寅泰
f7
ザ・ストロークス
ケミカル・ブラザーズ
フランツ・フェルディナンド
ジェット
アンダーワールド
ミューズ
レッド・ホット・チリ・ペッパーズ
ザ・ヴァインズ
くるり
ビースティ ボーイズ
ベースメント ジャックス
電気 GROOVE
トラヴィス
プライマル・スクリーム
プリンス
f5
DREAMS COME TRUE
島谷ひとみ
中島美嘉
MISIA
小柳ゆき
柴咲コウ
宇多田ヒカル
浜崎あゆみ
CHEMISTRY
矢井田瞳
倉木麻衣
BoA
I WiSH
安室奈美恵
平原綾香
f3
f6
サントラ オムニバス
クラシック
アニメ オムニバス
アース・ウインド&ファイアー
ヨーヨー マ
サントラ 洋画オリジナル
ボンド
オムニバス
リラクゼーション/ヒーリング
葉加瀬太郎
サントラ−TV(洋楽)
サントラ 邦画オリジナル
サントラ−TV(邦楽)
ジョシュ・グローバン
槇原敬之
モーニング娘。
モーニング娘。おとめ組
モーニング娘。さくら組
ミニモニ。
後藤真希
安倍なつみ
カントリー娘。に紺野と藤本(モーニング娘。)
W
メロン記念日
Hello!Project
松浦亜弥
Berryz 工房
安倍麻美
ソニン
上戸彩
ZONE
dream
BON-BON BLANCO
day after tomorrow
玉置成実
三枝夕夏 IN db
THE ALFEE
Ruppina
大塚愛
move
北出菜奈
相川七瀬
安倍麻美
ソニン
上戸彩
f2
f1
2.4
階層ベイズモデル
本節では,今回用いる 2 種類の階層ベイズモデルについて概説する。
2.4.1
静的モデル:動的変化項を組み込まないモデル
まず,動的変化項を組み込まないモデル (以下,静的モデルと呼ぶ) について説明する。これは,勝
又 (2007) で提案されたモデルである。
静的モデルは,以下の仮定から導出される。まず,顧客 i の第 t 回目の購買において,アーティス
ト k が選ばれたとき,顧客 i の顕在化した嗜好 xit はアーティスト k のスコア fk であるとする。す
なわち,xit = fk とする。また,この値は,顧客 i の潜在的な嗜好 yi が誤差 εit を伴って顕在化した
ものであると仮定する。ここから,個人の潜在的な嗜好 yi と,第 t 回目の購買において顕在化した
嗜好 xit から,次のような関係式を導き出すことができる。
xit = yi + εit
(3)
この回帰方程式は,アーティストスコアの次元と同じ,J 次元の多変量回帰方程式である。
さらに,顧客個人の嗜好 yi が,性別,年齢などのデモグラフィック変数によって,回帰できると
すると,顧客 i の潜在的嗜好 yi と,デモグラフィック変数 ri およびその係数行列 B に,以下の関係
を仮定することができる。
yi = Bri + ui
(4)
ここで,デモグラフィック変数 ri は,以下の変数を用いる。ただし,性別は,男=0,女=1 とおく。


1


 log(購買回数i ) 


ri = 
(5)

 log(年齢i ) 
性別i
これら 2 本の回帰方程式を階層化させることによって,静的モデルを以下のように定式化する。
{
xit = yi + εit , εit ∼ NJ (0, Σi )
(6)
yi = Bri + ui , ui ∼ NJ (0, Φ)
このモデルの未知パラメータは,yi , Σi , B, Φ である。したがって,N 人のモデルでは,求めるべ
きパラメータの数は 2N + 2 個となる。
静的モデルの事前分布は,以下の分布をおく。ここで,IW はインバース・ウィシャート分布,NM
は,M 次元の多変量正規分布,NM ×N は,M × N の行列正規分布を示す。
yi
∼
NJ (Bri , Φ), i = 1, · · · , N
(7)
Σi
∼
IW(s0 , S0 ), i = 1, · · · , N
(8)
B ∼
NJ×D (B0 , Φ, ∆)
(9)
Φ ∼
IW(p0 , P0 )
6
(10)
2.4.2
動的モデル:動的変化項を組み込んだモデル
動的モデルは,静的モデルに動的な変化項を加えたもので,顧客個人の潜在的嗜好を,時間に影響
されない成分と,時間に影響される成分に分解したものである。
顧客 i の第 t 回目の購買における顕在的嗜好 xit は,静的モデルと同じく,その時点で購買したアー
ティストのスコアである。ただし,その時の潜在的嗜好は,時間に影響されない成分 yi と,時間の
影響を受ける成分 wi および誤差項によって構成されているとする。時間の変数を τit としたとき,以
下のように表現できる。
xit = yi + τit wi + εit
(11)
今回の分析では,分析時点から過去を遡った週を 52 で割ったものを τ としてとる。たとえば,分
析時点の 10 週間前の購買のとき,τ = −10/52 ≈ −0.19 となる。52 で割ることで,1年前の購買は
−1,半年前の購買には −0.5 が与えられることになる。モデルによる将来の予測を行うときは,半年
後の嗜好予測であれば,τ = 0.5,1年後の予測であれば τ = 1 とおくことで,将来時点での嗜好の
予測値を求めることができる。
また,yi と wi はそれぞれ,デモグラフィック変数によって回帰できると仮定する。即ち,静的モ
デルと同様に,以下の構造を組み込む。ここで用いるデモグラフィック変数 ri は,静的モデルと同
じものを用いる。
yi = Bri + ui
(12)
wi = Γri + vi
(13)
これら 3 本の式から,モデルを構築する。


 xit = yi + τit wi + εit , εit ∼ N (0, Σi )
yi = Bri + ui , ui ∼ N (0, Φ)


wi = Γri + vi , vi ∼ N (0, Ψ)
(14)
動的モデルで求める未知パラメータは,yi , wi , Σi , B, Φ, Γ, Ψ である。N 人のモデルのとき,求める
べきパラメータの数は 3N + 4 個である。
静的モデルの事前分布は,以下の分布をおく。事後分布は付録に記載する。
yi
∼
NJ (Bri , Φ), i = 1, · · · , N
(15)
wi
∼
NJ (Γri , Ψ), i = 1, · · · , N
(16)
Σi
∼
IW(s0 , S0 ), i = 1, · · · , N
(17)
B ∼
NJ×D (B0 , Φ, ∆)
(18)
Φ ∼
IW(p0 , P0 )
(19)
Γ ∼
NJ×D (Γ0 , Ψ, Θ)
(20)
IW(q0 , Q0 )
(21)
Ψ
2.5
∼
MCMC 設定
静的モデルおよび動的モデルを実データを使った推定は,以下の設定で行う。
人数:N
7
前節で分割した顧客の集合のうち,アーティストスコアの導出に用いなかったほうの顧客から,
1000 人を抽出して推定を行う(N = 1000)。したがって,静的モデルで求める未知パラメータの数
は 2N + 2 なので 2002 個,動的モデルで求める未知パラメータの数は 3N + 4 なので 3004 個となる。
ハイパーパラメータ (静的モデル)
静的モデルのハイパーパラメータは,それぞれ以下の値をおく。ここで,IM は M × M の単位行
列,OM ×N は M × N のゼロ行列をさす。
s0 = J, S0 = IJ , B0 = OJ×D , ∆0 = ID , p0 = J, P0 = IJ
(22)
ハイパーパラメータ (動的モデル)
動的モデルのハイパーパラメータは,それぞれ以下の値をおく。
s0 = J, S0 = IJ , B0 = OJ×D , Γ0 = OJ×D
(23)
∆0 = ID , Θ0 = ID , p0 = J, P0 = IJ , q0 = J, Q0 = IJ
(24)
サンプリング回数:H
シミュレーションの繰り返し回数は 6000 回。そのうちはじめの 1000 回を棄て,後の 5000 回をサ
ンプルとして採った。即ち,サンプリング回数 H = 5000 である。
計算結果と考察
3
3.1
周辺尤度によるモデル比較
まず,それぞれのモデルの周辺尤度を計算し,モデルの当てはまりのよさを比較する。周辺尤度の
計算には,Newton and Raftery(1994) によって提案された方法を用いた。計算された対数周辺尤度
は表 2 のとおりである。
モデル
対数周辺尤度
静的モデル
−558, 417.9
−549, 241.4
動的モデル
表 2: モデルの対数周辺尤度
モデルの対数周辺尤度を比較すると,動的モデルの対数周辺尤度の方が大きいことがわかる。ま
た,各モデルの対数周辺尤度から対数ベイズファクターを計算すると,9176.5 となり,ベイズファク
ターの観点からでも,動的モデルのほうが十分モデルの当てはまりがよいといえる。
8
3.2
デモグラフィック係数 B, Γ
ここでは,デモグラフィック変数にかかる係数 B および Γ について分析を行う。表 3 および表 4 は
それぞれ,静的モデルと動的モデルの第 2 層の係数の推定値である。推定値は,サンプルの平均を用
いた。有意性は,サンプルがどちらの符号に偏ったかで判定している。サンプルの 95 %以上がどち
らかの符号に偏ったとき,太字で記している。また,数値は見やすくするため,102 を掛けている。
B
f1
f2
f3
f4
f5
f6
f7
f8
f9
f10
f11
切片
−1.4
−485.6
123.4
20.4
86.5
−88.1
62.2
278.3
23.7
71.3
7.6
購買回数
年齢
性別
0.5
28.5
2.0
9.7
0.5
3.5
6.5
−8.3
−2.0
−4.6
0.6
1.0
213.2
18.5
22.0
−23.7
56.5
−4.2
−73.4
−7.2
−28.7
−2.5
0.1
5.0
13.2
4.1
−0.3
−18.5
4.0
−8.3
−2.4
0.5
0.1
表 3: 静的モデル:B の推定値
B
f1
f2
f3
f4
f5
f6
f7
f8
f9
f10
f11
切片
購買回数
年齢
0.7
−375.9
131.0
55.1
81.8
−65.0
72.3
249.9
18.3
54.9
6.6
0.3
67.8
6.9
17.9
−2.3
3.5
6.2
−10.7
−3.8
−9.0
0.5
0.4
161.6
12.5
8.7
−20.0
46.0
−9.2
−61.9
−4.2
−21.6
−2.4
性別
−1.0
−1.2
11.9
6.6
−0.9
−14.0
6.4
−4.1
−2.5
2.3
−0.5
Γ
f1
f2
f3
f4
f5
f6
f7
f8
f9
f10
f11
切片
購買回数
2.2
174.9
−53.4
69.0
−0.4
29.9
30.6
−28.0
−7.1
−22.3
−1.8
−0.4
93.5
7.1
15.7
−7.7
6.0
1.2
−9.3
−4.2
−9.7
−0.3
年齢
−0.6
−101.6
5.5
−26.3
6.0
−19.5
−13.3
17.7
5.5
12.0
0.1
性別
−2.3
−8.2
3.4
7.3
−3.0
13.2
6.3
6.6
−1.0
1.8
−0.8
表 4: 動的モデル:B および Γ の推定値
デモグラフィック変数に掛かる係数を比較すると,静的モデルの B と動的モデルの B には,似た
傾向があることがわかる。また,動的モデルの Γ を見ると,購買回数が f2,f5,f8,f9,f10 に影響
を与え,年齢が f2,f7 に影響を与えていることがわかる。これは,購買回数が多い顧客ほど,時間
の経過とともに,f2,f7 に対する選好が強くなり,f5,f8,f9,f10 に対する選好が弱くなっていく傾
向が強いということを示している。ただし,年齢の高い顧客は,時間の経過とともに f2 と f7 対する
選好が弱くなっていくと見られる。
3.3
予測精度の検証
本節では,検証期間として分割した後半 1 年間の購買履歴データを用いて,モデルの予測精度の検
証を行う。予測に際して,顧客のスコアリングを行い,そこから顧客の購買傾向の強さを判断する。
顧客の,あるアーティストへの購買傾向の強さを表す指標として,アーティストスコアと,モデ
ルによって推定された顧客嗜好の二乗差を用いる。この値が小さいほど,そのアーティストと近い
9
嗜好を持っているといえる。すなわち,そのアーティストの CD を購買する傾向が高いとする。第 t
週におけるアーティスト k と顧客 i との距離 dtik は,次のように定義できる。
動的モデルでは,以下のようになる。ただし,yi および wi はサンプリングの平均値を用いた。こ
こで,τt = t/52 であり,モデル係数の推定時点(学習期間中)は負の値だったが,未来の予測では
0 以上の値となっている。
′
dtik = (fk − (yi + τt wi )) (fk − (yi + τt wi ))
(25)
同様に,静的モデルでは,以下のようになる。ただし,ここで,yi はサンプリングの平均値を取っ
ている。
dtik = (fk − yi )′ (fk − yi )
(26)
静的モデルでは,時間の影響を受けない。すなわち,どの時点の予測であっても,静的モデルで予測
した顧客の購買傾向は変わることはない。
また,ここでは,動的モデルと静的モデルに加えて,最も基本的な予測方法である,単純予測によ
る予測も行い,その予測精度を比較する。単純予測は,学習期間中にあるアーティストの CD を多く
購買した顧客ほど,検証期間中にもそのアーティストの CD を購買する傾向が高いとする予測方法
である。この単純予測も,静的モデルと同様,時間の影響は受けない。
予測精度の検証方法としては,累積ゲイン図を描いたときの曲線から求めた面積を用いる3 。累積
ゲイン図の曲線は,左上に膨らんでいるほど予測精度がよいといえる。したがって,この曲線の右下
部分の面積が大きいほど,予測精度がよいといえる。
ある週 t にアーティスト k の購買予測を行ったとき,累積ゲイン図の曲線と,原点から引いた 45 度線
を上回っている面積を Gtk とおく。45 度線を下回っているものには負の値をおく。Gtk は (−0.5, 0.5)
をとり,完全にランダムな予測では 0 となり,それより大きいものは予測能力があるといえる。図 2
は,累積ゲイン図から見た Gtk の領域を示す。
図 2: Gtk の示す面積
また,第 t 週における,あるアーティストの集合 K について,Gtk を平均したものは,Ḡt とおく。
3 累積ゲイン図については Berry and Linoff(2000) に詳しい。類似した手法として,Ansari and Mela(2003) で用いら
れている ROC(Receiver Operating Charactaristics) 曲線がある。ROC 曲線も,曲線下の面積を求めることで,予測精度
の比較をすることができる。これについては,Egan(1975) によってまとめられている。
10
ここで,#(k ∈ K) は,集合 K に含まれるアーティストの数を表す。
Ḡt =
∑
1
Gtk
#(k ∈ K)
(27)
k∈K
さらに,この Ḡ を,u 週先まで将来に向かって予測期間を広げ,それを平均していったとき,u 週
先までの予測 AGu とおく。
1∑
Ḡt
u t=1
u
AGu =
(28)
図 3 は,検証期間の第 1 週(τ = t/52 = 1/52 ≈ 0.019)から,未来へ予測期間を広げていったと
きの,売上上位 10 アーティストの AG である。これを見ると,おおよそ 10 週先までの予測は,動
的モデルの予測精度がよいが,それより先に行くと,静的モデルの予測精度が高くなっていることが
わかる。しかしながら,どちらのモデルも 0 を超えているため,予測能力はあるといえ,また,単純
予測よりも高い予測能力があるといえる。
図 3: 売上上位 10 位以内のアーティストに対する予測精度
周辺尤度では,動的モデルのほうが当てはまりがよいという結果となったが,本節の予測精度比
較では,遠い将来においては,静的モデルのほうが高い予測能力を持っているという結果となった。
ただし,動的モデルも単純予測よりは高い予測能力を持ち,また,売上枚数の多いアーティストの近
い将来の予測に関していえば,静的モデルよりも高い予測能力を持っているといえる。
4
おわりに
音楽 CD をはじめとした,選択肢の数が多く,顧客個人の嗜好が複雑になる製品カテゴリにおける
嗜好推定モデルは,主に前者の特性により,プロビット・ロジットなどの離散選択モデルで分析する
ことは難しいことが多い。しかしながら,アーティストごとにスコアを当てはめ,多次元の回帰方程
式を構築することで,既存の予測モデルよりも高い予測精度を持つモデルを構築することができた。
また,モデル化することで,アーティストスコアの各軸と回帰係数との関係についての知見を得るこ
ともできる。
11
本研究においては,時間要素を取り入れたモデルを構築することで,個人嗜好の各軸とデモグラ
フィック係数間の分析を,より精緻に行うことができた。また,周辺尤度の観点から,時間要素を組
み込んだ動的モデルは,静的モデルよりもモデルの当てはまりがよいといる。ここから,顧客個人嗜
好は,実際に時間変化をするということができ,嗜好推定において,時間要素を考慮することは非
常に重要であるといえる。モデルの係数に関しても,個人嗜好とデモグラフィック変数の関係につい
て,時間によって影響を受ける部分と,時間の影響を受けない部分に分解することができ,個人嗜好
の動的な変化を把握することもできた。
動的モデルの予測結果については,近い未来の予測では高い予測能力があることが示されたが,予
測する期間が長くなると,静的モデルに予測精度で劣るという結果となった。これは,時間に関する
影響が線形であることに由来していると考えられる。顧客嗜好は,近い未来では線形に近い変化をす
るが,遠い未来になると線形でなくなっている可能性がある。今後の課題としては,非線形の嗜好変
化を組み込むことによるモデルの拡張が挙げられる。
12
A
付録: 事後分布
動的モデルの事後分布は以下のとおり。静的モデルの事後分布は勝又 (2007) を参照のこと。事後
分布の導出に関しては,Rossi, Allenby and McCulloch(2005),または和合 (2005) に詳しい。
ここで,N は分析人数,Ti は個人 i の購買回数。D は説明変数 ri の次元,J は yi の次元。また,
IK は K × K の単位行列,OM ×N は M × N のゼロ行列。また,Y, W, R は,次のように,個人ご
とのベクトルを積み上げた行列を示す。



w1′
y1′
 .
 . 
 .
. 
Y=
 . , W =  .
′
′
wN
yN


,


r1′
 . 
. 
R=
 . 
′
rN

動的モデルは,ギブスサンプリングによってパラメータを発生させることができる。以下のパラ
メータを順番に発生させることによって,パラメータの推定値を得る。ここで,インバース・ウィ
シャート分布に従う乱数の発生方法は Rossi, Allenby and McCulloch(2005) または Gamerman(1997)
を参照。行列正規分布の性質および乱数の発生方法は Rowe(2002) に詳しい。
yi |wi , Σi , B, Φ ∼ NJ (yi1 , Φi1 ), i = 1, · · · , N
−1
(Φ−1 + Ti Σ−1
i )


Ti
∑

= Φi1 Φ−1 Bri +
Σ−1
i (xij − τij wi )
Φi1
=
yi1
j=1
wi |yi , Σi , Γ, Ψ ∼ NJ (yi1 , Ψi1 ), i = 1, · · · , N
Ψi1
=
(Ψ−1 +

yi1
=
Ti
∑
2 −1 −1
τij
Σi )
j=1
Ψi1 Ψ−1 Γri +
Ti
∑


Σ−1
i (xij − yi )
j=1
Σi |yi , wi ∼ IW(si1 , Si1 ), i = 1, · · · , N
si1
Si1
= s0 + Ti
Ti
∑
= S0 +
(xij − yi − τij wi )(xij − yi − τij wi )′
j=1
B|Φ, Y ∼ NJ×D (B1 , Φ, ∆1 )
−1
(R′ R + ∆−1
0 )
∆1
=
B1
= (Y′ R + B0 ∆−1
0 )∆1
Φ|Y, B ∼ IW(p1 , P1 )
p1
=
P1
=
p0 + N
N
∑
P0 +
(yi − Bri )(yi − Bri )′ + (B − B0 )(B − B0 )′
i=1
13
Γ|Ψ, W ∼ NJ×D (Γ1 , Ψ, Θ1 )
Θ1
−1
= (R′ R + Θ−1
0 )
Γ1
= (W′ R + Γ0 Θ−1
0 )Θ1
Ψ|W, Γ ∼ IW(q1 , Q1 )
q1
=
Q1
=
q0 + N
N
∑
Q0 +
(wi − Γri )(wi − Γri )′ + (Γ − Γ0 )(Γ − Γ0 )′
i=1
参考文献
阿部誠 (2003) 「消費者行動のモデル化:消費者の異質性」
『オペレーションズ・リサーチ』48, 121-129.
Abe, M. (2008, forthcoming). ””COUNTING YOUR CUSTOMERS” ONE BY ONE: A Hierarchical Bayes Extension to the Pareto/NBD Model”, Marketing Science.
阿部誠,近藤文代 (2005) 『マーケティングの科学-POS データの解析-』朝倉書店.
Ansari, A., Essegair, S. & Kohli, R. (2000). ”Internet Recommendation Systems”, Journal of
Marketing Research, 37, 363-375.
Ansari, A., Mela, C. F. (2003). ”E-Customization”, Journal of Marketing Research, 40, 131-145.
Berry, M. J. A. & Linoff, G. S. (1997). Data Mining Techniques: For Marketing, Sales, and
Customer Relationship Management, Wiley. 邦訳, マイケル J.A. ベリー, ゴードン・リノフ
(1999). 『データマイニング手法 -営業,マーケティング,カスタマーサポートのための顧客分
析-』 江原淳, 佐藤栄作, SAS インスティチュートジャパン (共訳), 海文堂.
Berry, M. J. A. & Linoff, G. S. (2000). Mastering Data Mining: Art and Science of Customer
Relationship Management, Wiley. 邦訳, マイケル J.A. ベリー, ゴードン・リノフ (2002). 『マ
スタリング・データマイング -CRM のアートとサイエンス- 理論編・事例編』 江原淳, 金子武
久, 斎藤史朗, 佐藤栄作, 清水聰, 寺田英治, 守口剛 (共訳), 海文堂.
Egan, J. P. (1975). Signal Detection Theory and ROC Analysis, Academic Press.
Frances, P. H. & Paap, R. (2002). Quantitative Models in Marketing Research, Cambridge University Press.
Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simulation for Bayesian Inference,
Chapman & Hall.
勝又壮太郎 (2007) 「音楽 CD 購買における個人嗜好の推定」『オペレーションズ・リサーチ』52,
725-731.
近藤文代 (1999) 「デイリー POS データにおける曜日変動および値下げ効果の抽出」『オペレーショ
ンズ・リサーチ』44, 154-163.
14
Newton, M. A. & Raftery, A. E. (1994). ”Approximate Bayesian Inference with the Weighted
Likekihood Bootstrap”, Journal of the Royal Statistical Society. Series B, 64, 3-48.
廉民善 (2007) 「音楽 CD 購買履歴データを用いたアーティスト推薦モデル」『赤門マネジメント・
レビュー』6, 7-32.
Rossi, P. E. & Allenby, G. M. (2003). ”Bayesian Statistics and Marketing”, Marketing Science, 22,
304-328.
Rossi, P. E., Allenby, G. M. & McCulloch, R. (2005). Bayesian Statistics and Marketing, Wiley.
Rossi, P. E., McCulloch R. E. & Allenby, G. M. (1996). ”The Value of Purchase History Data in
Taeget Marketing”, Marketing Science, 15, 321-340.
Rowe D. B. (2002). Multivariate Bayesian Statistics, Chapman & Hall.
Sato, T., Higuchi, T. & Kitagawa, G. (2004). ”Statistical Inference using Stochastic Switching
Models for the Discrimination of Unobserved Display Promotion from POS Data”, Marketing
Letters, 15,37-60.
和合肇(編著) (2005) 『ベイズ計量経済分析』東洋経済新報社.
15