自動車保守点検データに基づくディーラー販売戦略の特徴抽出

自動車保守点検データに基づくディーラー販売戦略の特徴抽出
○田中雅樹 倉橋節也 (筑波大学)
Sales Strategy Extraction of Car Dealerships
from Automobile Maintenance Records
∗M. Tanaka and S. Kurahashi (University of Tsukuba)
Abstract– In this paper, we propose a framework for time series data mining focused on the time order
of the purchase history. We aim to acquire the primary reason of the long-term relationship between the
automobile store and the customer with the analyses of the relationship with the automobile maintenance
record and the customer retention rate. We clarify the characteristics of the high retention customers and
to improve the accuracy of the customer retention predictions as a result of the clustered customer obtained
by the machine learning. This research is able to show the usefulness of the service science through the
application of the engineering methods in the service industry.
Key Words: clustering, decision tree learning, gaussian mixture model
1
はじめに
国内の自動車市場において,新車購入後のアフター
サービス(車検・点検・修理など)を新車購入店で実施
する顧客の割合は約 5 割,他店利用顧客に比べ,
“ 価格
の安さ ”ではなく,正規ディーラー及び店舗スタッフ
への安心感・信頼感で入庫先を選定している 1) .顧客
はアフターサービスを受けるにあたり,Fig. 1 の様に
営業,サービスフロントのスタッフ,整備士によるコ
ンサルティングによって,購入するサービスや商品の
意思決定を行っている.
セールス
スタッフ
入庫勧誘
アフターフォロー
顧客
車の乗り方
予算の提示
整備結果の説明
追加整備の提案
整備・商品の提案
フロント
スタッフ
作業指示
整備員
Fig. 1: ディーラー・サービス部門の役割
乗用車はおよそ 6ヶ月毎に法律で定められた点検が必
要である.ユーザーは,ディーラー,カー用品店,ガソ
リンスタンドなどで点検・整備を受けることができる.
近年,価格競争が激しくなっており,選択肢は流動的
である.全国各地に存在するメーカー系ディーラーの
経営は独立しており,それぞれ独自の戦略,サービス
を展開し,競争力にも差がある.安定的な収益を得る
ためには適切なアイテム及びサービスのリコメンデー
ションと,顧客の定着率向上が不可欠である.
従来,顧客の定着率については,新車購入 3 年後,5
年後といった,ある時点における定着率しか把握され
ておらず,点検間隔が空くことで,定着率がどれだけ
低下するか,明らかになっていなかった.また,アイ
テムやサービスのリコメンデーションに対して,顧客
がどのような購買行動を取り,定着率にどのような影
響を及ぼしているのか定量的に捉えられていなかった.
情報推薦の一つである,協調フィルタリングを用い
た従来手法のリコメンデーションは,継続的に顧客と
の接点を必要とする耐久消費財やサービスを対象とし
ておらず,定着率向上及びある顧客から生涯に渡って
得られる利得の最大化を主な目的としていなかった.
本研究では,アイテムの購買履歴,デモグラフィック
データから,機械学習の手法を用いて,顧客及び販売
会社のクラスタリングを行い,各社の戦略の違いや地
域による特徴を明らかにした.
2
関連研究
2.1 情報推薦の手法
情報推薦の方式には,一般的にコンテンツに基づく
フィルタリング (content-based filtering) と協調フィル
タリング (collaborative filtering,CF) の大きく二つに
分類される.コンテンツに基づくフィルタリングは推
薦する情報の内容に基づき,アイテムの性質と利用者
の嗜好パターンを比較して,利用者が好むと判断した
物を推薦する方法である.一方,CF の大きな特徴はド
メイン知識と呼ばれるアイテムの特徴,性質を考慮し
ないことである.多くの利用者の様々なアイテムについ
て何を好むか,嫌うかのデータベースを作成し,嗜好の
パターンが類似する標本となる利用者を見つけ,その
標本となる利用者が好むものを推薦する仕組みである
2)
.ドメイン知識 (アイテムの特徴)を必要としない優
位性から,協調フィルタリング (collaborative filtering,
CF) について関連研究の調査を行った.CF では嗜好が
類似したユーザをみつけ,それらのユーザの履歴を用
いて推薦アイテムを決定するが,代表的な類似度の尺
度である cosine distance, correlation3) , mean-squared
difference4) などを用いた単純な方法では時間の変化を
考慮した推薦を行うことができない. 時系列を考慮し
た次の情報推薦の方式が提案されている.
Pavlov5) はユーザーの時間推移をモデル化し,嗜好
の類似性に加えて,アイテムの購入順序を反映した推
薦を行っている.例えばドラマの DVD など,1 話,2
話と続くような購買順序を考慮し,過去の履歴に基づ
いて,次のユーザが購入するアイテムの条件付き確率
が最大になるアイテムを推薦するモデルである.多数
派の行動や,嗜好が類似したユーザーと同じような行
動を推薦することは可能であるが,購買順序が無関係
なアイテム,繰り返し同じアイテムを購買するような
ケースには適していないと考えられる.
音楽配信など契約すると解約するまでの期間,任意
の曲を任意の回数試聴できるような定額制のサービス
においては,個々の購買行動の満足ではなく,サービス
全体の顧客満足を向上させて解約を防ぐのが目標であ
る.岩田 6) は,長期間契約しているユーザーの購買行
動の特徴を抽出し契約年数,購買行動の履歴から,ユー
ザーがあるアイテムを選択したときの解約しない確率
を導く関数を置き,それを最大化するようなアイテム
を推薦するモデルを提唱している.この提案手法にお
けるサービスでは,アイテムの購入が多いことでユー
ザーの満足度を向上させ,その結果,契約期間が延び
るという前提を置くことができるが,本研究の対象と
する市場においては,購買アイテム数または購入総額
が多いということが必ずしも顧客満足度の高さ,即ち
顧客の定着にはつながらない可能性がある.
3
自動車のアフターサービスにおける顧客
定着率の分析
アイテムのリコメンデーションにより,利得の最大
化,及び,顧客の定着率向上を目的とした従来の研究
手法では,長期間,顧客との関係維持が必要である耐
久消費財や関連するサービス,ユーザーの利用年数 (利
用ステージ) を考慮しておらず,サービス全体を見た顧
客生涯価値を考慮し,顧客定着率の向上を目的として
いなかった.
大量に蓄積される,購買データ,顧客データから,機
械学習の手法を用いて,これらの課題を解決する新た
な分析手法を提案する.本研究で取り扱う内容である,
法令で定められた乗用車の車検・点検制度の概要と,利
用ステージの定義,分析で取り扱う各種データ (購買
データ,顧客データ,販売会社データ) の詳細について
本章で述べる.
3.1
顧客データ (Tab. 2) は,市区町村単位までの住所,
性別,年齢,月間の平均走行距離,車種,購入した販売
会社名,車両の購入年月,クレジットカード会員の有無
が記されている.車種は,セダン,軽自動車,SUV 車,
高級車など,多岐にわたりそれぞれユーザーの特性が
大きく異なる可能性がある.本研究においては,地域,
販売会社,購入アイテムの差を中心に分析を行うこと
を目的としているため,販売台数が比較的多く,長期
間に渡り販売された車種 C に限定して分析を行った.
同一車種に複数のグレードが存在しているが,本研究
では区別していない.販売会社データは,販売会社名,
平均来店頻度,点検の平均単価が記されている.販売
会社は全都道府県別に存在しており,各県に複数社ず
つ存在している.各社の店舗数は,数店舗から 100 店
舗を超える会社まで規模は様々である.都道府県をま
たぐ形では出店していない.平均来店頻度は,自社で
過去に取引のある顧客数から年間の来店数を割ったも
のであり,平均的な来店回数を表している.点検の平
均単価は,車検・点検の 1 回当たりの整備工賃と交換
部品の総額を,台数で割ったものである.
Table 1: アイテムの分類
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
車検・法定点検の制度概要
自家用自動車については道路運送車両法で定められ
た自動車検査登録制度,いわゆる車検制度があり,初
回は新車購入から 3 年後,以降は 2 年ごとに国土交通
省による検査を受け合格しなければならない.それ以
外にも「6ヶ月点検」
・
「法定 12ヶ月点検」と呼ばれる,
安全の確保・公害防止のため法令で定められた定期点
検整備が行われ,同時に消耗品の交換や快適性を保つ
ためのアイテムやサービスが消費される.
本研究では,国内メーカー A 社系列の自動車販売会
社における,車検・点検入庫の履歴,入庫時の購入ア
イテム,顧客情報の履歴情報を用いて分析を行った.
3.2
Table 2: 顧客データ
分析データの概要
本研究では,購買データ,顧客データ,販売会社デー
タの 3 種類のデータを使用して分析する.購買データ
は,顧客 ID 付きのデータであり,点検の実施日,来店
の目的 (車検・6ヶ月点検・12ヶ月点検・修理など),そ
のときに交換した部品の部品番号が記されている.な
お,購入アイテムの部品番号は数万種類に及び,そのま
までは非常に疎なデータとなり,分析に適さないため,
あらかじめ定義されたデータベースより品種単位にク
ラスタリングして,Tab. 1 に示す 25 分類とした.来店
の目的は,点検・修理の内容に応じて区分があらかじ
め定められており,受付時に店舗で記録される.デー
タの期間は 2011 年 5 月から 2012 年 9 月までの 16ヶ月
間,データ数はおよそ 11 万レコードである.
品種
エアフィルター
エアコンクリーニング
バッテリー
ベルト
エアコンフィルタ (上級)
エアコンフィルタ (ノーマル)
ブレーキパッド
エンジン洗浄剤
エンジンオイル添加剤 1
エンジンオイル添加剤 2
発煙筒 (上級)
発煙筒 (ノーマル)
一般部品
オイル
オイルフィルター
音響機器
エンジンオイル添加剤 3
点火プラグ
タイヤ A
タイヤ B
エアコン洗浄剤
ガラス撥水加工
ワイパーゴム (上級)
ワイパーゴム (ノーマル)
その他
No
1
2
3
4
5
6
7
8
9
項目
顧客 ID
住所 (市区町村)
性別
年齢
月間走行距離
車種
購入販売会社名
車両購入年
カード会員有無
変数の数
2
1
100 以上
2
データのタイプ
名義
名義
名義
順序
順序
名義
名義
順序
順序
仮説および検証結果
販売会社のクラスタリング
1
2
検証方法
Kyusyu
Chugoku_Shikoku
Kinki
Tokai
Tokyo_Kanagawa
Chiba_Saitama
Hokuriku
検証結果
混合正規分布によるクラスタリングの結果 (Fig. 2)
は,横軸に来店頻度,縦軸に平均単価を表している.高
頻度低単価,低頻度高単価,その中間の 3 つのクラス
に分類されることがわかった.
さらに,平均単価を縦軸,地域を横軸にとったグラ
フに表現すると,Fig. 3 より,高頻度・低単価の傾向
がある販売会社は東北地方に集中し,低頻度・高単価
の傾向がある販売会社は,東京・神奈川と埼玉の一部
に集中していることが明らかになった.
3
高単価低頻度
中位
高頻度低単価
Fig. 3: 来店頻度,点検単価による販売会社のクラスタ
リング結果 (エリア別)
イテムやサービスを販売しているのか,顧客にどのよ
うな特徴があるのか検証した.
4.2.2
2
検証方法
点検当たりの部品交換点数が多い,1 回目車検時の
購買データ及び顧客データ (サンプル数 n = 5, 643) を
用いて,低頻度高単価とそれ以外の販売戦略を判別す
る分類器を決定木学習アルゴリズムを用いて構築した.
決定木学習アルゴリズムは C4.57) を拡張した J48 を使
用した.なお,モデルの過学習を避けるため交差検証
法 (n = 10) を採用した.
4.2.3
検証結果
0
1
決定木学習アルゴリズムによる判別の結果は Tab. 3,
Tab. 4 より,正しく判別された割合は 82 %であった.
低頻度高単価&中位,高頻度低単価を分類する決定木
(Fig. 4) から,交換部品の有無,年齢,性別,月間走行
距離などの特徴を抽出することができた.
Table 3: 決定木による判別結果
-1
Sales per customer
Kanto
Hokkaido
-2
全国 121 社の会社別平均来店頻度,平均点検単価を
用いて会社のクラスタリングを行った.平均来店頻度
は,年間の入庫台数を過去に取引のあった顧客数で割っ
た値,平均単価は,点検の売上げ総額から点検台数を
割った値である.平均来店頻度,平均点検単価を正規
化し,混合正規分布によってクラスタリングを行った.
4.1.3
高単価低頻度
中位
高頻度低単価
Tohoku
4.1.2
3
検証内容
車の利用方法は様々であり,通勤での利用,主にレ
ジャーなどの週末での利用など,地域によって違いが
あり,それによって各販売会社の戦略も異なっていると
考えられる.基本的な特徴のひとつである,平均単価,
平均来店頻度から販売会社をクラスタリングし,有意
な特徴を持ったクラスタリング結果が得られるか検証
した.
0
4.1.1
-1
4.1
Sales per customer
4
-2
実際のクラス
-2
-1
0
1
2
3
Table 4: 決定木による判別結果
台数
割合
正しく分類 4,600 82 %
誤って分類 1,043 18 %
Frequency of visit
Fig. 2: 来店頻度,点検単価による販売会社のクラスタ
リング結果
4.2
4.2.1
低単価高頻度&中位
高単価低頻度
予想されたクラス
低単価高頻度&中位
高単価低頻度
4,259
85 %
315
48 %
728
15 %
341
52 %
販売戦略の特徴抽出
検証内容
販売会社のクラスタリングによって,各社の販売戦
略の特徴が確認できた.次に,具体的にどのようなア
5
5.1
考察
販売会社のクラスタリング結果とその特徴
来店頻度,平均単価データを用いて,販売会社のク
ラスタリングを行った結果,高単価低頻度型,高頻度
違いがあるという結果だけで,どのようなバランスを
保てば,顧客も満足し,競争力の高い販売会社になり
得るのかという結論は得られていない.その地域で生
き残るための戦略はなにかを明らかにしていく必要が
ある.
適用の可能性について,本研究においては,長期間
メンテナンスが必要な耐久消費財である乗用車を対象
としたが,関連研究にも示した,定額料金制のサービ
スや利用するにあたって一定期間の契約を要する会員
制のサービスなどへ幅広く応用が可能であると考える.
6.3 今後の課題
どのような属性の顧客に対して,具体的にどのよう
なアイテムやサービスをリコメンデーションすればよ
いのか,現時点では実用的なレベルには至っていない.
精度の向上と,得られたルールの解釈のしやすさにつ
いて課題がある.また,理論だけではなく,実際の販
売現場における活用に耐えうるルールが得られている
のか,今後フィールド調査を行っていきたい.
参考文献
Fig. 4: 販売戦略を分類する決定木 (一部)
低単価型の特徴を持った会社に分類できることが明ら
かになった.地域によって特徴が類似しており,高頻
度低単価の販売会社が東北地方に,高単価低頻度の販
売会社が東京・神奈川エリアに集中していることが明
らかになった.
また,購買データと顧客データから,来店頻度と単
価の特徴を判別する分類器を生成し,正しく分類でき
た台数の割合は 82 %と比較的高い精度が得られること
が確認できた.販売戦略の特徴を表す,サービスやア
イテムの具体的なルールが決定木から抽出可能である
ことが分かった.
6
結論
6.1 研究の成果
自動車のアフターセールス市場における購買データ,
顧客データから,販売会社のクラスタリングを行い,各
社の戦略の違いや地域による特徴を明らかにした.本
研究によって,サービス分野における工学的手法の適用
を通して,サービス科学の有用性を示すことができた.
実際の販売の現場においては,どのようなアイテム
やサービスを提供するか,現場に任せになるケースが
あり,場当たり的な方策が多い傾向にある.このよう
な手法を用いることで,販売会社や地域の特徴,顧客
の特徴を捉え,現場の営業活動の効率を上げ,利得を
最大化することができると考えられる.
6.2 本研究の限界と適用可能性
本研究では,購買アイテムと顧客属性によって,分
類器を作成して分析を行ったが,日々の営業スタッフ
とのやりとりや,店舗における接客内容,ダイレクト
メールなどのイベントなど,顧客の意思決定に影響を
与えていると考えられる要素は様々である.取得でき
るデータの限界もあるが,今回取り扱わなかった要素
の影響度合いについても分析が必要である.
販売会社のクラスタリングの結果,高単価低頻度,高
頻度低単価に分かれる傾向が見られたが,現時点では
1) J.D. パワーアジア・パシフィック. 日本自動車サービス満
足度(CSI)調査. 2010.
2) 神嶌敏弘. 推薦システムのアルゴリズム (1). 人工知能学
会誌, Vol. 22, No. 6, pp. 826–837, nov 2007.
3) Paul Resnick, Neophytos Iacovou, Mitesh Suchak, Peter Bergstrom, and John Riedl. Grouplens: An open
architecture for collaborative filtering of netnews. In
Proceedings of the 1994 ACM Conference on Computer
Supported Cooperative Work, CSCW ’94, pp. 175–186,
1994.
4) Dwi H. Widyantoro, Thomas R. Ioerger, and John
Ye. Learning user interest dynamics with a threedescriptor representation. Journal of the American Society for Information Science and Technology, Vol. 52,
No. 3, pp. 212–225, 2001.
5) D. Y. Pavlov and D. M. Pennock. A maximum entropy
approach to collaborative filtering in dynamic. Sparse,
High-Dimensional Domains, Advances in Neural Information Processing Systems, Vol. 15, pp. 1465–1472,
2003.
6) 岩田具治, 斉藤和巳, 山田武士. 契約期間を延ばすための
レコメンド法. 情報処理学会論文誌. 数理モデル化と応用,
Vol. 48, No. 6, pp. 65–74, mar 2007.
7) J. Ross Quinlan. C4.5: programs for machine learning.
Morgan Kaufmann Publishers Inc., San Francisco, CA,
USA, 1993.