検索ボリュームのデータを用いた 市場予測手法の妥当性の

検索ボリュームのデータを用いた
市場予測手法の妥当性の検証
指導教員:石井健一
筑波大学理工学群社会工学類
社会経済システム主専攻
200811405
山下 哲平
目次
第1章
序論
1.1
1.2
……………………………………………
背景と目的
仮説の設定
2
第2章
研究方法
……………………………………………
2.1 消費データについて
2.2 検索ボリュームのデータについて
4
第3章
結果と考察 ……………………………………………
3.1 仮説1の検証
3.2 仮説2の検証
3.3 仮説3の検証
3.4 仮説4の検証
8
第4章
結論
4.1
4.2
…………………………………………… 19
まとめ
問題点・今後の課題
参考文献・資料
謝辞
1
第1章
序論
1.1
背景と目的
インターネット社会の発展により、私たちは日常的に様々な情報を得られるようになっ
た。そしてある財・サービスを消費する際に、事前にインターネットで対象となるキーワ
ードを検索し、十分な情報を得てから意思決定を下すことが増えてきている。例えば曲を
HP 上で視聴した上で CD を購入したり、映画のレビューや飲食店の口コミを見て、見る映
画・訪れる店を決めたり、販売店に行く前に車の情報をネットで徹底的に調べ上げたり等、
挙げ出したらきりがない。
このような消費者の情報収集において、主に用いられる検索エンジンの代表格といえる
「Google」は、2008 年 8 月から「Google Insights for Search」というサービスを提供して
いる。ここで少しこの「Google Insights for Search」について説明する。まずこのサービ
スを簡単に表現すると、あるキーワードが Google 上でどれだけ検索されているか、その人
気度を検索ボリュームのデータで示すものである。(データの意味などについては第 2 章に
おいて後述する。)
このサービスは「期間」「地域」「カテゴリ」の3つのフィルタリング
機能を持つ。
「期間」は過去 7 日間や 30 日間等の直近の何日間かを指定したり、2006 年 4
月~2011 年 7 月等、過去にさかのぼって好きな期間を月単位で指定したりすることができ
る。
「地域」は 100 を超える国と地域を指定でき、例えば日本であれば都道府県レベルまで
指定できる。
「カテゴリ」指定については、異義語を区別するのに用いることができる。例
えば「apple」であれば、カテゴリを「コンピュータ、電子機器」にするのか「食品と飲料」
にするのかで得られるデータは大きく異なる。キーワードを入力し、これらのフィルタを
駆使することで、そのキーワードの検索ボリュームの推移データや地域別データを抽出し、
人々の詳細な検索行動を調査することができる、というものである。
そして最近、このサービスを利用して得られるデータを市場調査の代用とする試みが考
えられている。例えば「ノンアルコールビール」と「発泡酒」と入力し、シェアや人々の
嗜好を見極めたりする等の利用方法が挙げられる。しかし、このような検索ボリュームの
データの妥当性を検証した研究はあまりみられない。そこで本研究では、検索ボリューム
と実際の売上や入客数等の消費データの間の相関性を分析することで、そのような検索ボ
リュームデータをマーケティング情報として用いる手法の妥当性について検証していく。
また、もし本研究でデータの妥当性が認められれば、このサービスをオンラインだけで
なくオフラインの販売戦略等にも役立てることができる。先ほどの例でいえば、ノンアル
コールビールの検索ボリュームが大きければ、需要も大きいと判断して店頭でプッシュし
たり在庫調整の参考にしたりするといった販売戦略をとれる。そういった意味でこの研究
は社会的意義を持つ研究であるといえる。
2
1. 2
仮説の設定
本研究では、検索エンジンから得られる検索ボリュームデータと実際の消費データの関
係を明らかにするために、以下の4つの仮説を検証していく。
仮説1
それぞれの財において、検索ボリュームと消費データとの間には相関がある。
この仮説が棄却されればその後の仮説も意味をなさないという意味で本研究の根幹とな
る仮説である。背景でも述べたとおり、消費の意思決定を行うための情報収集に検索エン
ジンが用いられることが増えてきた。そこで検索ボリュームと消費データに相関がみられ
るのではないかと考えこの仮説を設定した。
仮説2
極めて高価な財は、検索ボリュームデータの影響が消費データに現れるまでに時
間がかかる。
私は昨年車を購入したのだが、その際、高い買い物であるので数週間に渡って WEB や販
売店から情報収集を行った。このように高価な財においては、購入頻度が少ないので「少
しでも納得するものを購入したい」という心理が働き、長期にわたった情報収集を行うの
ではないかと予想しこの仮説を設定した。
仮説3
高価な財の方がより相関性が高い。
これは仮説2同様、高価なものについてはしっかりと情報収集を行うのではないか。ま
た、安価なものに関しては、特に自分で情報を集める努力をしないまま購入することが多
いのではないかという予想のもと、このような仮説を設定した。
仮説4
ある程度の期間所有する財は、そうでないものより、実際の消費データと少し後
の検索ボリュームデータとの間の正の相関が強い。
これは、購入後所有するものに関しては、購入後も関心をもつことがあると考えられる
ので、消費データとその後の検索ボリュームデータに相関があるのではないかと予想し、
この仮説を設定した。
3
第2章 研究方法
2.1
消費データについて
まず実際の売上や入場者数等の消費データについて説明する。今回の研究では、
① ゲームハード
② 自動車
③ 観光スポット
④ 観光地域
の 4 種類の財について分析する。なぜこの 4 種なのかについてだが、あまり高価でないも
のとしてゲームハードを、購入頻度が非常に低く高価なものとして自動車を選んだ。また、
今挙げた2つが購入後所有するものであるのに対して、そうではないものとして動物園・
水族館・城や、少し範囲を広げた観光地域、というものを選んだ。第 1 章で例に挙げたビ
ール等の日常消費財も対象に入れたかったが、分析に必要な月別や週別の売上データが得
られなかったので今回は断念した。
次にそれぞれのデータの説明に入る。
① ゲームハードについて
PS3(2006 年 11 月 2 週目~2011 年 9 月 4 週)、Nintendo DS(2004 年 12 月 1 週~2011 年 9
月 4 週)、X box(2005 年 12 月 2 週~2011 年 9 月 4 週)、PSP(2004 年 12 月 2 週~2011 年 9
月 4 週)、Wii(2006 年 12 月 1 週~2011 年 9 月 4 週)の計5機の週間販売台数データ「週刊
ファミ通」(エンターブレイン発行)が毎週発表している販売台数をまとめたサイト
「ゲームデータ博物館」(http://gamedatamuseum.web.fc2.com/index.htm)よりデータを収
集した。
② 自動車について
プリウス・ヴィッツ・フィット・ワゴン R・エルグランド・レガシィ・ラパン・パッソ。オ
デッセイ・プレマシー・ポルテ・アクセラ・アルファード・ティーダ・ノート・マーチ・
ノア・ラフェスタ(2006 年 1 月~2011 年 4 月)、アテンザ(2008 年 1 月~2011 年 4 月)の計
19 車種の月別新車販売台数データ。日本自動車販売協会連合会が毎月発表する新車販売台
数をまとめたサイト(http://kuru-ma.com/nebiki46.html)よりデータを収集した。
③ 観光スポットについて
上野動物園・多摩動物園、葛西水族館、井の頭自然文化園、旭山動物園(2008 年 4 月~2011
年 8 月)、ズーラシア・金沢動物園(2006 年 4 月~2011 年 3 月)、東山動物園・名古屋城(2006
年 4 月~2011 年 7 月) 兼六園・ハウステンボス(2008 年 1 月~2010 年 12 月)、伊勢神宮・
ラグーナ蒲郡・シートレインランド(2006 年 4 月~2009 年 12 月)の計 14 施設の月別入場者
数データ。それぞれ
上野・多摩・葛西・井の頭
―
東京動物園協会 HP 内、
「業務に関する資料」
4
(http://www.tzps.or.jp/business/)の「施設別入園者数」より
旭山
―
旭山動物園公式HP内、
「旭山動物園の月別入園者数」
(http://www5.city.asahikawa.hokkaido.jp/asahiyamazoo/zoo/siryou/nyuen-tuki.html)
ズーラシア・金沢動物園
―
横浜市統計ポータルサイト
(http://www.city.yokohama.lg.jp/ex/stat/index2.html#29)内、分野別インデックスの「動物
園の入園者数」より
東山動物園・名古屋城
―
名古屋市 HP 各年統計なごや定期統計資料
(http://www.city.nagoya.jp/shisei/category/67-5-12-9-0-0-0-0-0-0.html)内、
「観光・文化施
設入場者数」より
(トップページ→市政情報→ 統計→統計なごや web 版→毎月の統計デ
ータ)
兼六園
―
金沢市観光協会公式サイト「交流都市の観光情報」
(http://www.kanazawa-kankoukyoukai.gr.jp/exchangecity.html)各年金沢市観光調査結果
報告書の観光施設別利用者数集計の兼六園のデータを使用。
ハウステンボス
―
長崎県観光連盟 HP 内、
「長崎県観光統計」
(http://www.nagasaki-tabinet.com/public/statistics/)の各年主要観光施設等の利用者数の
月別利用者数のデータを使用。
伊勢神宮
―
伊勢市 HP「伊勢市観光統計」
(http://www.city.ise.mie.jp/icity/browser?ActionCode=genlist&GenreID=1268956015895
)の各年伊勢市観光統計の月別参拝人員データを使用。(トップページ→くらしのガイド→産
業→観光→伊勢市観光統計)
ラグーナ蒲郡、シートレインランド
―
愛知県観光コンベンション課 HP「各年観光レク
リエーション利用者統計」(http://www.pref.aichi.jp/kanko/menu/kankou/toukei.html)参考
資料の観光レクリエーション利用者統計地域別・市町村別集計明細表の各データを使用。
④ 観光地域
別府・奈良(2006 年 1 月~2009 年 12 月)、京都(2008 年 1 月~2010 年 12 月)、広島(2007
年 1 月~2009 年 12 月)、登別(2007 年 4 月~2011 年 3 月)、沖縄・北海道・草津(2006 年 4
月~2011 年 3 月)、箱根・湯布院(2006 年 4 月~2010 年 12 月)、神戸(2006 年 4 月~2010
年 3 月)、伊勢志摩・日光・能登・宮島(2007 年 1 月~2010 年 12 月)の計 15 地域の月別観
光客数データ。それぞれ
別府市
―
別府市観光まちづくり情報サイト内、観光統計
(http://www.city.beppu.oita.jp/02kankou/toukei/index.html) のデータより
京都
―
京都府 HP 内、観光入込客数及び観光消費額
(http://www.pref.kyoto.jp/kanko/1282292270316.html)の月別観光入込数より
(京都府
HP→京都の魅力・観光情報→イチオシの京都観光情報!統計情報→観光入込客数及び観光
消費額)
5
広島
―
各年の広島県観光客数の動向(http://www.pref.hiroshima.lg.jp/life/18/34/150/)
内、
「月別総観光客数」より広島市の月別観光客数データを使用した。 (広島県 HP→分類
でさがす→県政情報・財政・統計→統計情報→広島県観光客数の動向)
登別
―
登別市観光経済部観光室観光振興グループ
HP(http://www.city.noboribetsu.lg.jp/spa/)内、
「観光客入込数」の道外+道内のデータを使
用
沖縄
沖縄県観光政策課 HP
―
(http://www3.pref.okinawa.jp/site/view/cateview.jsp?cateid=233)の統計情報「入域観光客
数」の各月データをまとめて使用。
北海道
―
北海道経済部観光局統計情報「北海道観光入込客数報告書」
(http://www.pref.hokkaido.lg.jp/kz/kkd/irikomi.htm)の各年データの「入込総数」のデータ
を使用。
草津
草津長町役場 HP「今月の入込」
―
(http://www.town.kusatsu.gunma.jp/www/contents/1226645828261/index.html)内の各年
度入込客数のより総入込客数データを使用。
箱根
箱根町 HP 内「観光客実態調査報告書」
―
(http://www.town.hakone.kanagawa.jp/hakone_j/gyosei/aramashi/toukei/zittaityousa.ht
ht)の各年度月別総観光客数のデータを使用。(ホーム→総合案内→町のデータ→観光客数
→観光客実態調査報告書)
湯布院
由布市観光情報 HP、「観光統計情報」
―
(http://www.city.yufu.oita.jp/kanko/kanko_toukei.htm)内の、各年度観光動態調査の総観光
客数(日帰り・宿泊合計)データを使用。
神戸
―
兵庫県 HP 内「観光客動態調査」
(http://web.pref.hyogo.jp/ie15/ie15_000000005.html)の各年度兵庫県観光動態調査報告書
内、神戸市月別入込客数のデータを使用。(ホーム→暮らし・環境→観光・レジャー→観光
→観光客動態調査)
伊勢志摩
―
三重県 HP「お知らせ情報」内、各年観光レクリエーション入込客数推計書
(http://www.pref.mie.lg.jp/TOPICS/2011050193.htm)の伊勢志摩地域月別観光入込客数デ
ータを使用。
日光
―
栃木県 HP「観光交流課お知らせ・行政情報」
(http://www.pref.tochigi.lg.jp/f05/system/honchou/honchou/1216861899504.html)の各年
観光入込客調査結果内、市町村別・月別観光客数の旧日光市のデータを使用。(ホーム→県
政情報→庁舎・組織の案内→産業労働観光部→観光交流課→観光交流課お知らせ・行政情
報)
奈良
―
奈良県 HP 内、各年奈良県観光客動態調査報告書
(http://www.pref.nara.jp/dd_aspx_itemid-15577.htm#itemid15577)の、奈良市月別観光客
6
数のデータを使用。(トップページ→県の組織→地域振興部観光局→ならの魅力創造課→な
らのにぎわいづくり課ホームページ→観光客動態調査報告書)
能登
―
いしかわ統計指標ランド内「観光統計」
(http://toukei.pref.ishikawa.jp/search/min.asp?sc_id=56)統計からみた石川県の観光の能
登地域月別観光客数データを使用。(トップ>観光・文化財>観光・文化財>観光統計>観光統
計)
宮島
―
広島県 HP 「各年の広島県観光客数の動向」
(http://www.pref.hiroshima.lg.jp/life/18/34/150/)内宮島の月別総観光客数のデータを使用。
(トップページ>分類でさがす>県政情報・財政・統計>統計情報>広島県観光客数の動向)
2.2
検索ボリュームのデータについて
第 1 章で述べたとおり、Google が提供する「Google insights for search」からデータを
得る。このサービスでは、キーワードを入力すればその検索ボリュームの推移が数値とし
て出力されるが、この数値の意味をここで確認する。
Google によるとこの数値は、「Google で検索された総検索ボリュームに対する、特定の
キーワードの検索ボリュームを相対的に表したもので、実際の検索数ではなく、データを
正規化して 0~100 のレベルで表したもの」である。つまり、あるキーワードの検索数が
総検索数に占める比率を出し、期間や地域の範囲のもとで最大の比率となるものを 100 と
し、他の値を相対的に表示するというものである。よってこの数値は人気度であり、実際
の検索数ではないので、グラフの下降線が必ずしも検索数の減少を表すものであるとはい
えない。また、人気度を言い換えると、あるキーワードの検索数が全体に占めるシェア、
またはそのキーワードが検索される確率、であるといえる。
次に、入力するキーワードの決定について説明する。人々が1つのものを検索する際に
使用するキーワードは1つではない。例えば車の「レガシィ」を検索する際には、「レガシ
ー」や「legacy」、「れがしー」等も候補として考えられる。
このような場合、指定の期間・地域のもとでの数値(つまり人気度)の平均値が最大とな
るキーワードを使用する。(伊勢志摩に関しては「伊勢+志摩」と入力し、伊勢か志摩どちら
かを検索したボリュームデータを使用した。)
次に、フィルタリングについて説明する。まず期間については実際の消費データに対応
する期間を指定する。地域については、本研究ではいずれも日本国内の消費データを扱う
ので「日本」を指定する。
カテゴリについては、自動車においては「自動車」を指定することで同音異義語を除
外し、観光地域においては「旅行」を指定することで観光と全く関係のない検索行動を除
外し、精度を高めた。(草津に関しては滋賀県の草津を除外するため、
「草津
温泉」と入力
した)。また、ゲームハードと動物園・水族館・城については同音異義語があまり見られな
7
かったためカテゴリ指定は行わなかった。
最後に、実際に出力される値は 1 週間単位の値であるので、月別データである自動車・
動物園等・観光地域との分析においては、次のように値を加工する。
① まず月を跨いでいない週(etc.2 月 3 日~2 月 9 日)の値を加算する。
② 月を跨いでいる週(etc.1 月 27 日~2 月 2 日)に関しては、各月に属する日数分の重みを
つけて値を割り、それぞれの値を各月に加算していく。
上記のようにして得たデータを用いて、主に 2 変量の相関分析を行う。
第 3 章 結果と考察
3.1
仮説1
仮説1の検証
それぞれの財において、検索ボリュームと消費データとの間には相関がある。
本研究の大前提であるこの仮説を検証するために、それぞれの財において実際の消費デ
ータと検索ボリュームの相関分析を行った。また、検索と実際のデータの時系列的関係を
計るために、ある時期の検索と同時期の消費データ、時期を 1 単位(財によっては 2 単位)
前後にずらした消費データの相関をそれぞれとり、相関係数を以下の表にまとめた。(後の
検証のため、ゲームハードの月別データも記載する。
また色付はその財における最大値)
表 1 ゲームハードの売上と検索ボリュームの相関係数
検索―
検索―1 週間後
検索―2 週間後の
検索―1 週間前の
検索―2 週
売上
の売上
売上
売上
間前の売上
ps3
0.462
0.462
0.355
0.415
0.334
ds
0.471
0.496
0.432
0.443
0.401
xbox
0.629
0.663
0.603
0.478
0.427
psp
0.442
0.471
0.375
0.371
0.306
wii
0.771
0.682
0.634
0.719
0.587
すべての値が 1% 水準で有意 (両側) 。
8
(表2~4において、*. 相関係数は 5% 水準で有意 (両側) 。
**. 相関係数は 1% 水準
で有意 (両側) 。)
表 2 ゲームハードの売上と検索ボリュームの相関係数
検索―売上
検索―1 ヶ月後の売上
検索―1 ヶ月前の売上
ps3
.601**
.472**
.287*
ds
.520**
.437**
.435**
xbox
.734**
.744**
.477**
psp
.484**
.331**
.346**
wii
.852**
.538**
.455**
表 3 自動車の売上と検索ボリュームの相関係数
検索―売上
検索―1 ヵ月後の売上
検索―2 ヵ月後の売上
検索―1 ヶ月前の売上
プリウス
0.44**
0.568**
0.659**
0.323**
ヴィッツ
-0.043
0.241
0.256*
-0.227
フィット
0.483**
0.588**
0.561**
0.398**
ワゴン R
0.072
0.081
0.006
-0.132
エルグランド
0.422**
0.748**
0.566**
0.340
レガシィ
0.227
0.375**
0.561**
0.209
ラパン
0.155
.308*
.366**
0.038
アテンザ
0.68**
0.897**
0.782**
0.461**
パッソ
.289*
.481**
.372**
-0.027
オデッセイ
.454**
.456**
.378**
.345**
プレマシー
.677**
.558**
.308*
0.134
ポルテ
.460**
.392**
.439**
0.175
アクセラ
.428**
.553**
.501**
-0.023
アルファード
0.091
0.193
0.177
-0.058
ティーダ
.516**
.526**
.422**
0.080
ノート
.326**
.376**
.275*
0.009
マーチ
.400**
.264*
.334**
0.070
ノア
0.185
.454**
.415**
-0.073
ラフェスタ
.596**
.607**
.500**
.346**
9
表 4 観光スポットの入園者数と検索ボリュームの相関係数
検索―入園者数
検索―1 ヵ月後の入園者数
検索―1 ヶ月前の入園者数
上野動物園
0.604**
0.598**
0.198
多摩動物園
0.655**
0.543**
-0.015
葛西水族館
0.854**
0.555**
0.271
井の頭自然文化園
0.529**
0.502**
-0.231
旭山動物園
0.537**
0.631**
0.208
ズーラシア
.785**
.359**
0.073
金沢動物園
.665**
0.199
0.100
東山動物園
.438**
.277*
0.118
名古屋城
.801**
.442**
0.090
兼六園
.788**
0.294
-0.227
ハウステンボス
.505**
.510**
-0.303
伊勢神宮
.803**
.347**
-0.059
ラグーナ蒲郡
.824**
.363*
-0.062
シートレインランド
.448**
0.222
.331*
表 5 観光客数と検索ボリュームの相関係数
検索―観光客数
検索―1 ヵ月後の観光客数
検索―1 ヶ月前の観光客数
別府
.441**
0.222
-0.124
京都
.724**
0.251
-0.017
広島
.540**
.633**
-0.202
登別
.706**
.658**
.320*
沖縄
.404**
.612**
-0.096
北海道
.330**
.434**
0.158
草津
.496**
.354**
0.208
箱根
.502**
0.215
-0.039
湯布院
.294*
.545**
-0.075
神戸
.534**
0.177
-0.177
伊勢志摩
.584**
0.136
-0.226
日光
.876**
.652**
.376**
奈良
.590**
.447**
-.329*
能登
0.229
0.218
-0.115
宮島
.710**
.302*
-0.283
10
分析の結果、検索ボリュームと同時期の消費データの相関において、有意な相関係数が占
める割合は、
ゲームハードにおいては、
(5/5)で 100%
自動車においては、
(13/19)で 68%
観光スポットにおいては、
(14/14)で 100%
観光地域においては、
(14/15)で 93%
全体でみると、
(46/53)で 87% となった。
次に、検索ボリュームと 1 ヶ月後の消費データとの相関において、有意な相関係数が占
める割合は、
ゲームハードにおいては、
(5/5)で 100%
自動車においては、
(16/19)で 84%
観光スポットにおいては、
(11/14)で 79%
観光地域においては、
(9/15) で 60%
全体で見ると、
(41/53)で 77% となった。
また、検索ボリュームと 1 ヶ月前の消費データとの相関において、有意な相関係数が占
める割合は、
ゲームハードにおいては、
(5/5)で 100%
自動車においては、
(5/19)で 26%
観光スポットにおいては、
(1/14)で 7%
観光地域においては、
(3/15)で 20%
全体でみると、
(14/53)で 26% となった。
検索ボリュームと同時期の消費データの相関係数は、全体で 9 割ほどの値が有意なもの
であり、検索ボリュームと 1 ヶ月後の消費データとの相関係数は、全体で 8 割ほどの値が
有意なものであった。これらの結果から総じていうと、検索と実際の消費データの間には
相関があるといえる。
(仮説1の成立) これにより、
「Google insights for search」等のサ
ービスから得られる検索ボリュームの推移データは、その時々や少し先の売上や入客数等
の実際の消費の推移を表すものとして、ある程度信頼できるものであることが分かった。
また、検索ボリュームと 1 ヶ月前の消費データとの相関係数で有意なものは、全体でみる
と 3 割弱しかなかった。このことから、基本的には「検索してから消費する」という検索
と消費の関係をあらためて確認することができる。
また、それぞれの財についてみてみると、まずゲームハードは検索と同時期の売上、時
間をずらした売上、すべてにおいて有意な数値が得られた。消費者はゲームハードを購入
する前後において、対象の商品について頻繁に検索し情報収集しているのではないかと考
えられる。
自動車においては、検索と同時期・1 ヵ月後・1 ヶ月前の売上の順に、68%・84%・26%
となった。また 2 ヵ月後の売上との相関も 17/19=89%であり、1 ヵ月後の売上との相関に
11
加えて、2 ヵ月後の売上との相関においても有意な割合が高いのは、値段が高くあまり買う
ものではないので、「少しでも納得のいくものを買いたい」という心理が働き、時間をかけ
て情報収集を行うからではないか。また、検索行動と購入の意思決定の間に、販売店に訪
れて自分の目で確かめたり試乗したりするステップが存在するので、WEB 検索での情報収
集の結果が販売台数に表れるのに時間がかかるからではないかと考えられる。
観光スポットにおいては、検索と同時期・1 ヵ月後・1 ヶ月前の売上の順に、100%・79%・
7%となった。同時期と 1 ヶ月後の入場者数との間は、ほとんど有意な値であるのに対し、
1 ヶ月前の入場者数との間には有意な値が全くといっていいほどみられない。これは、これ
らの場所に訪れる前は、そこがどんなところであるか、住所やアクセス方法等、調べる必
要があるものが多くあるのに対し、実際に訪れ自分の目で確かめた後なので、更なる情報
収集が必要ないからではないだろうか。
最後に観光地域をみてみると、検索と同時期・1 ヵ月後・1 ヶ月前の売上の順に、93%・
60%・20%となった。同時期の観光客数との相関はほとんどが有意な値であったが、1 ヶ月
前の観光客数との相関には有意な値があまり見られなかった。まず同時期との相関が大き
かったのは、検索している場所が主にその地域内だったことから、観光地域に入ってから
観光スポット・ホテル選びや移動の仕方等を調べるための検索が多かったのではないかと
考える。次に 1 ヶ月前との相関については、観光スポットについての部分でも触れたよう
に、旅行後は、更なる情報収集が必要ないからではないだろうか。
3.2
仮説2
仮説2の検証
極めて高価な財は、検索ボリュームデータの影響が消費データに現れるまでに時
間がかかる。
この仮説を検証するためにまず、それぞれの購入にかかる平均費用、観光行動にかかる
平均費用を調査した。まず自動車の新車平均価格はおよそ 200 万円前後。(ガリバー自動車
研究所、2007 年調査 http://www2.glv.co.jp/research/files/2007/01/2007_01.pdf より) 次
にゲームハード本体の平均価格はおよそ 1 万 5 千円から 3 万円である。(価格.com ゲーム
機価格 http://kakaku.com/game/game-console/より) また観光スポットの入場料について
は、多くの場所で個人の一般料金が 1000 円未満であり、ラグーナ蒲郡とシートレインラン
ドのテーマパークの入場料が平均費用を少し上げたが、全体で 1500 円未満であった。最後
に、観光地域について。これは各観光地域の最近の 1 人当りの観光消費額から平均値を計
算した。その結果、平均はおよそ 20000 円となった。
以上から、4 種の財の内、最も高価な自動車を対象の財として選択する。そして自動車と
他財において、1 ヶ月後の消費との相関が同時期のそれより大きくなる割合を比較し、有意
12
な差がみられるかどうか分析する。
まずはそれぞれの財において、1 ヶ月後の消費との相関が同時期のそれより大きくなる割
合、そうでない割合を以下の表にまとめた。
表 6 各財における検索ボリュームと同時期・1 ヵ月後の消費との相関係数の比較
1 ヵ月後の消費との相関の方が大
同時期の消費との相関の方が大
自動車
16(84%)
3(16%)
ゲームハード
1(20%)
4(80%)
観光スポット
2(14%)
12(86%)
観光地域
4(27%)
11(73%)
この結果の限りでは、自動車は他財よりも、「1 ヶ月後の消費データとの相関の方が大き
い割合」が高いようにみえる。これを二項分布に基づく検定を行うことで、自動車と各財
の割合の差が有意なものであるか確認する。
検定の結果、自動車とゲームハードの比較については、正確な有意確率値(両側)で p=0.014、
自動車と観光スポットの比較については、正確な有意確率値(両側)で p<0.001 となり、それ
ぞれ有意な差が認められた。更に自動車と観光地域の間においても、正確な有意確率値(両
側)で p=0.001 となり、有意な差が認められた。この結果から、高価である自動車の「同時
期より 1 ヵ月後の売上との相関が強い」割合が他の財より明らかに高いことが示された。
また、実際の消費データは、1ヶ月前・同時期・1ヵ月後の検索のどれから一番影響を
受けるかを分析するため、消費データ従属変数、1ヶ月前・同時期・1ヵ月後の検索の3
つの変数を独立変数として回帰分析を行った。以下は各財における回帰分析の結果として
標準化係数と決定係数をまとめたものである。
(*. 相関係数は 5% 水準で有意 (両側) 。
**. 相関係数は 1% 水準で有意 (両側) 。
(負の値で有意な係数を含めいくつかの値は、多重共線性の影響により信頼性の低い値と
なっている。
)
13
表 7 自動車における回帰分析の標準化係数と決定係数
1 ヶ月前の検索
同時期の検索
1 ヵ月後の検索
R2 値
プリウス
0.737**
-0.49
-0.153
0.366
ヴィッツ
0.421**
-0.083
-0.342
0.0196
フィット
0.595**
0.143
-0.088
0.415
ワゴン R
0.02
0.202
-0.259
0.047
エルグランド
0.785**
0.174
-0.363**
0.649
レガシィ
0.419*
-0.151
0.098
0.14
ラパン
0.328*
0.063
-0.93
0.117
アテンザ
1.102**
0.135
-0.382*
0.829
パッソ
0.432**
0.163
-0.188
0.256
オデッセイ
0.301*
0.225
0.153
0.288
プレマシー
0.313**
0.652**
-0.264**
0.577
ポルテ
0.221
0.396**
-0.098
0.244
アクセラ
0.435**
0.48**
-0.525**
0.449
アルファード
0.219
0.051
-0.157
0.055
ティーダ
0.319**
0.521**
-0.236*
0.436
ノート
0.264
0.273
-0.179
0.179
マーチ
0.164
0.378**
-0.036
0.195
ノア
0.478**
0.014
-0.188
0.228
ラフェスタ
0.343*
0.22
0.176
0.419
表8
ゲームハードにおける回帰分析の標準化係数と決定係数
1 ヶ月前の検索
同時期の検索
1 ヵ月後の検索
R2 値
ps3
0.009
0.857**
-0.361*
0.413
ds
-0.417
1.022**
-0.097
-0.344
xbox
0.223
0.867**
-0.316*
0.672
psp
-0.605**
1.485**
-0.494*
-0.34
wii
-0.09
1.047**
-0.296**
0.685
14
表 9 観光スポットにおける回帰分析の標準化係数と決定係数
1 ヶ月前の検索
同時期の検索
1 ヵ月後の検索
R2 値
上野動物園
0.156
1.203**
-0.912**
0.628
多摩動物園
0.045
0.898**
-0.473**
0.679
葛西水族館
-0.008
1.031**
-0.330**
0.766
井の頭自然文化園
0.185
0.617**
-0.430**
0.523
旭山動物園
-0.281
-0.734
-0.513
-0.445
ズーラシア
-0.041
0.942**
-0.317**
0.706
金沢動物園
-0.024
0.758**
-0.151
0.51
名古屋城
0.049
0.954**
-0.332**
0.778
東山動物園
0.009
0.559**
-0.193
0.239
兼六園
0.081
0.865**
-0.370**
0.814
ハウステンボス
0.299
0.484**
-0.342*
0.495
伊勢神宮
0.064
0.878**
-0.309**
0.749
ラグーナ蒲郡
.0001
0.955**
-0.367**
0.82
シートレインランド
-0.053
0.392*
0.163
0.224
表 10 観光地域における回帰分析の標準化係数と決定係数
1 ヶ月前の検索
同時期の検索
1 ヵ月後の検索
R2 値
別府
-0.05
0.604**
-0.350*
0.312
京都
-0.032
0.853**
-0.384**
0.633
広島
.0369**
0.553**
-0.468**
0.616
登別
0.273*
0.719**
-0.249
0.619
沖縄
0.346*
0.605**
-0.633**
0.512
北海道
-0.526
-0.161
-0.075
-0.186
草津
0.071
0.466*
-0.098
0.213
箱根
0.018
0.603**
-0.297*
0.311
湯布院
0.592**
0.173
-0.414**
0.393
神戸
-0.313**
1.103**
-0.702**
0.683
伊勢志摩
-0.224*
0.807**
-0.552**
0.578
日光
0.145
0.877**
-0.161
0.801
奈良
0.045
0.816**
-0.659**
0.732
能登
0.118
0.227
-0.195
0.09
宮島
-0.082
0.970**
-0.629**
0.855
15
自動車において、ワゴン R・アルファード・ノートの3車では有意な係数が得られなかっ
た。この3つを除外して考えると、16 車中 11 車で 1 ヶ月前の検索ボリュームが売上に最も
影響を与えるという結果が得られた。ゲームハード・観光スポット・観光地域では、その
ほとんどにおいて、「1 ヶ月前の検索」について有意な係数が得られず、消費データに最も
影響を与えているものは同時期の検索ボリュームデータである、という結果が得られた。
二項分布に基づく検定と回帰分析の結果から総じて、極めて高価である財においては、
そうでない財より、検索ボリュームの増減が消費データに現れるまでに長く時間がかかる
といえる。(仮説2の成立) 更にこの結果から、そのような財においては、検索エンジンか
ら得られる最近の検索ボリュームを、今の消費を読み取るものとしてではなく、少し先の
将来における消費の増減を予測できるものとして用いることができるといえる。
3.3
仮説3
仮説3の検証
高価な財の方がより相関性が高い。
まず、検索と消費との相関で有意なものの割合をみてみる。
仮説1で求めたように、検索ボリュームと同時期の消費データの相関において、有意な相
関係数が占める割合は、
ゲームハードにおいては、
(5/5)*100=
100%
自動車においては、
(13/19)*100≒
68%
観光スポットにおいては、
(14/14)*100=
100%
観光地域においては、
(14/15)*100=
93%
であった。自動車については 1 ヵ月後の消費データの方が検索ボリュームの影響を受けて
いると考えられるので、自動車においては(16/19)*100≒84%を対象として考えると、有
意なものの割合は以下のようになる。
表 11 有意な相関係数の割合
ゲームハード
100%
自動車
84%
観光スポット
100%
観光地域
93%
この時点で、最も高価な財である自動車の有意な相関係数の割合が一番低いことがわか
った。また、平均費用は観光スポットより高いはずの観光地域における有意な相関係数の
割合も、観光スポットのそれより低いという結果になっている。以上の結果から、仮説2
16
は棄却され、相関の強さに財の値段は関係ないということが示された。仮説構築時の「高
価な財ほど情報収集を熱心にするので、相関が高くなる」という予想は外れた。この原因
について考えてみる。自動車がゲームハードより割合が低いのは、ゲームハードのデータ
数が少ないというのもあるかもしれないが、1つの原因として購入者の年齢が関係してい
るかもしれない。 日本最大級の総合ゲーム情報サイトである「4Gamer.net」の調べ
(2012.1.16 http://www.4gamer.net/games/000/G000000/20120116002/)によると、2011 年
のゲーム購入者の平均年齢はおよそ 27 歳であった。これに対して、「Garbagenews.com」が
【内閣府・消費動向調査】の内容をグラフ化しまとめた記事(2009.12.15
http://www.garbagenews.net/archives/1170907.html)によると、若年層(29 歳以下)が所有
する車を新車として購入した割合は 29%で、これは 30~59 歳の 66%、60 歳以上の 52%を大
きく下回る。更に、若年層ほどインターネットを利用して情報収集を行う(博報堂DYメデ
ィアパートナーズの調査
http://www.media-kankyo.jp/upload/files/news_32/HDYnews110615.pdf より)ことを考え
ると、
① ゲームハードの主な購入者である若年層は、情報収集の際にインターネットを多く利用
するので、検索ボリュームとの相関が高くなった。
② 自動車を新車で買う割合の高い中堅・高齢層は、情報収集の際にインターネットではな
く、他の方法をとることが若年層より多いので、検索ボリュームとの相関が比較的低く
なった。
という2つのことがいえ、購入者の年齢が、相関の差に影響を与えた原因の1つとなって
いることが推測できる。
また、観光スポットと観光地域については、観光地域の割合も 93%であることを考えると、
観光地域の相関が低かったというよりは、観光スポットの相関が高かったと捉えるのが妥
当ではないかと考える。観光スポットの相関係数をみても 0.6 以上の値が 6 割以上あり、
なかなかの相関性がみられる。これは、観光スポットに訪れる直前の住所や駐車場、アク
セス方法等の確認という、消費の意思決定後の情報収集が、同時期の入場者数との相関に
影響しているのではないかと考えられる。
3.4
仮説4
仮説4の検証
ある程度の期間所有する財は、そうでないものより、実際の消費データと少し後
の検索ボリュームデータとの間の正の相関が強い。
まず、所有するものであるゲームハード・自動車の購入行動と、所有しない観光スポッ
ト・地域に訪れるという観光行動の2つに分類する。そしてそれぞれの「検索と 1 ヶ月前
17
の消費データの相関係数」が有意である割合を以下の表にまとめた。
表 12 検索ボリュームと1ヶ月前の消費データの相関係数における有意なものの割合
所有する
所有しない
有意であるもの
有意でないもの
ゲームハード
5(100%)
0(0%)
自動車
5(26%)
14(74%)
観光スポット
1(7%)
13(93%)
観光地域
2(13%)
13(87%)
この結果から、ゲームハードについては観光スポット・地域より有意な割合が明らかに
高いことが分かった。また、自動車における有意な割合も一見、観光スポット・地域のそ
れより大きいようにみえる。そこで、自動車の相関係数が有意である割合が残りの2財よ
りも高いかどうかを、二項分布に基づく検定を行うことによって確認する。
検定の結果、自動車と観光スポットの割合については正確な有意確率値(両側)で p=0.209、
自動車と観光地域の割合については正確な有意確率値(両側)で p=0.426 と、共に有意な差
は見られなかった。よって仮説4は棄却され、所有の有無と購入後の検索ボリュームには
関係がないということが示された。しかし、ゲームハードについては明らかな差がみられ
るので、所有の有無という条件が完全に無視されるのではなく、その上に更なる条件があ
るのではないかと考える。その条件の1つとして予想されるのは、購入後の財の変化の頻
度・大きさである。例えばゲームハードでは、購入後にゲームソフトも購入する必要があ
る。または既に持っているソフトに飽きたら次のソフトを探し、購入する。このソフトの
購入によって、はじめに購入したゲームハードがその所有者にもたらす「楽しみ」は変化
し、また、その所有者にとってのゲームハードの価値が変化するといえる。このように購
入後の変化があるものについては、購入後もその財やその周辺の情報を集めることが予想
されるので、消費とその後の検索ボリュームのデータに相関がみられるのではないかと考
えられる。自動車においても、購入後の改造等がもっと頻繁に行われるならば、もっと正
の相関が強くなるのではないだろうか。
18
第 4 章 結論
4.1
まとめ
これまで検索エンジンから得られる検索ボリュームと実際の消費データの関係について
述べてきた。以下では各仮説で判明したことから全体としての考察を行う。
まずは仮説1で分かったとおり、人々の検索行動と実際の消費データには相関がみられ、
本研究の最大の目的である、「Google insights for search」等の検索エンジンから得られる
検索ボリュームデータを用いて市場調査の代用とする手法の妥当性が支持されたといえる。
ただし注意すべき点がいくつかある。まず1つがインターネット利用者には偏りがある点
である。年齢別のデジタルデバイドが改善されつつあるとはいえ、高齢者のインターネッ
ト利用頻度は他の年代に比べて少ないので、高齢者向けの商品に関しては当てはまりが悪
い可能性がある。また最寄品のように消費の意思決定をする際に自発的に情報を集めよう
としないもの、選択の際にイメージが優先されるもの(「CM が好きだからこの洗剤にしよ
う。」等)については、TV やチラシ等のメディアが有効であるため、検索ボリュームデータ
の信頼性が低い点等、万能であるとはいえない。
また、仮説1において検索と消費に相関がみられたことから、人々の検索行動と消費行
動は密接なものであることが改めて示された。よって検索された際にいかに自分のページ
を上位に表示させるか、という検索エンジン最適化=SEO 対策等に企業が注力するのは合
理的な選択であるといえる。更に、オフラインでもある程度市場を表すものであるといえ
るので、検索ボリュームの動きを見て戦略や行動を決定することもある程度の合理性が認
められたといえるのではないか。
仮説2~4においては、財の種類から検索と消費の相関について詳しく調べた。仮設2
については仮説が支持され、極めて高価な財の検索ボリュームの影響が消費データに現れ
るまでに時間がかかるということが分かった。これは今回の自動車のみではなく、住宅市
場等の高価な財についてもいえることではないかと推測できる。仮説3・4においては、
仮説が棄却された。これは仮説の段階で、財を分類する条件の設定が甘かったことが原因
の1つと考えられる。また同時に、人々の検索行動に影響する財の要素は様々であり、よ
り詳細な予測に応用するには、その要素によって財の分類を明確にする必要があると感じ
た。
4.2
問題点・今後の課題
本研究の最大の問題点は、量・質ともに満足なデータが得られなかったことである。財
の分類を考えてからデータとるというよりは、データがあるものについて分析する形にな
19
ってしまったので、仮説の段階での財の分類があいまいなものになってしまった。他にも
月別データでなく週別のデータがあればもっと詳細な相関について分かったかもしれない。
例えば今回観光スポットにおいては同時期の入場者数との相関高くなったが、週単位で考
えると1つ(1 週間)後の入場者数の方が相関が強いかもしれない。
また「Google insights for search」は地域ごとの検索データも提供している。検索データ
はオフラインにおいてもある程度市場を表すことが分かったので、地域ごとの検索データ
から消費を予測して、広告を打って出たり参入したりという方法もある程度当てはまると
予想できる。その検索データに対応する詳しい消費データがあればその方法も実際に当て
はまるのかどうか証明できた。(例えば観光行動において、本当に那須には茨城より群馬か
らの方が入込が多いのか。等)この地域別の検索データ分析は今後の課題である。
参考文献・資料
・グーグルに訊く『Google Insights for Search』の使い方
(http://news.mynavi.jp/articles/2009/12/07/insights_lecture/index.html)
・「ゲームデータ博物館」(http://gamedatamuseum.web.fc2.com/index.htm)
・自販連発表の新車販売台数をまとめたサイト「車を買う!」
(http://kuru-ma.com/nebiki46.html)
・東京動物園協会 HP 内、「業務に関する資料」(http://www.tzps.or.jp/business/)
・旭山動物園公式 HP 内、「旭山動物園の月別入園者数」
(http://www5.city.asahikawa.hokkaido.jp/asahiyamazoo/zoo/siryou/nyuen-tuki.html)
・横浜市統計ポータルサイト(http://www.city.yokohama.lg.jp/ex/stat/index2.html#29)
・名古屋市 HP 各年統計なごや定期統計資料
(http://www.city.nagoya.jp/shisei/category/67-5-12-9-0-0-0-0-0-0.html)
・金沢市観光協会公式サイト「交流都市の観光情報」
(http://www.kanazawa-kankoukyoukai.gr.jp/exchangecity.html)
・長崎県観光連盟 HP 内、「長崎県観光統計」
(http://www.nagasaki-tabinet.com/public/statistics/)
・伊勢市 HP「伊勢市観光統計」
(http://www.city.ise.mie.jp/icity/browser?ActionCode=genlist&GenreID=1268956015895
)
・愛知県観光コンベンション課 HP「各年観光レクリエーション利用者統計」
(http://www.pref.aichi.jp/kanko/menu/kankou/toukei.html)
・別府市観光まちづくり情報サイト内、観光統計
(http://www.city.beppu.oita.jp/02kankou/toukei/index.html)
20
・京都観光 Navi 内、各年京都市観光調査年報
(http://raku.city.kyoto.jp/kanko_top/kanko_chosa.html)
・各年の広島県観光客数の動向(http://www.pref.hiroshima.lg.jp/life/18/34/150/)
・登別市観光経済部観光室観光振興グループ HP(http://www.city.noboribetsu.lg.jp/spa/)
・沖縄県観光政策課 HP (http://www3.pref.okinawa.jp/site/view/cateview.jsp?cateid=233)
・北海道経済部観光局統計情報「北海道観光入込客数報告書」
(http://www.pref.hokkaido.lg.jp/kz/kkd/irikomi.htm)
・草津長町役場 HP「今月の入込」
(http://www.town.kusatsu.gunma.jp/www/contents/1226645828261/index.html)
・箱根町 HP 内「観光客実態調査報告書」
(http://www.town.hakone.kanagawa.jp/hakone_j/gyosei/aramashi/toukei/zittaityousa.ht
ht)
・由布市観光情報 HP、「観光統計情報」
(http://www.city.yufu.oita.jp/kanko/kanko_toukei.htm)
・兵庫県 HP 内「観光客動態調査」(http://web.pref.hyogo.jp/ie15/ie15_000000005.html)
・三重県 HP 内、各年観光レクリエーション入込客数推計書
(http://www.pref.mie.lg.jp/TOPICS/2011050193.htm)
栃木県 HP「観光交流課お知らせ・行政情報」
(http://www.pref.tochigi.lg.jp/f05/system/honchou/honchou/1216861899504.html)
・奈良県 HP 内、各年奈良県観光客動態調査報告書
(http://www.pref.nara.jp/dd_aspx_itemid-15577.htm#itemid15577)
・いしかわ統計指標ランド内「観光統計」
(http://toukei.pref.ishikawa.jp/search/min.asp?sc_id=56)
・広島県 HP 「各年の広島県観光客数の動向」
(http://www.pref.hiroshima.lg.jp/life/18/34/150/)
謝辞
ご指導を引き受けてくださり、研究、論文作成、その他様々な面において、丁寧かつ有
益な助言をくださった社会工学類の石井健一先生に、心より感謝申し上げます。本当にあ
りがとうございました。
21