基 礎を鍛える 初 級 なるほど!納得 アナリティクス ポイントのポイント 対象 データ分析を必要とする業務部門 第3回 アナリティクスの3つの掟が 重要なワケ 藤沼 貴士 株式会社イグアス クラウド&ソリューション事業部 クラウド推進部 担当部長 ソリューション・エグゼクティブ この連載をきっかけに、セミナーでの講演 「CRISP-DM」 などに従えばよく、 極論す のお話をいただきました。私としては初めて れば手法はどれでもよいと言えるし、 逆に大 れるのだろう、という美しい誤解がある。 の経験で、 非常にうれしく思っています。セ 前提が整っていなければ、どのような優れた 確かに、 長年研究されてきたアルゴリズ ミナーでお客様の表情を感じながら、 Q&A 手法でもデータマイニングが成功することは ムは、スーパーマーケットの購買データを分 も含めて会話できるのは、 誌面でアナリティ ない、と言える。 そしてその要素は、 マイ 析した結果、 「ビールを買う人は、 同時に紙 クスの面白さをお伝えするのとは違った意義 ニングの中で逐次、 参照・利用されることに おむつを買う」 という、 従来、 人の感覚や があると感じています。 私の個人的趣味の なる。 勘では気づかなかった仮説を発見した。 今 世界でたとえるならば、 音楽の CD アルバム 大前提の要素は3つあり、ここでは 「3つ やマイニング界の都市伝説となっている話 とライブの関係に似ているなあ、と思いま の掟」 と称する。この掟を守ることにより、 だ。そして、 当のスーパーマーケットでは、 す。 初めてデータマイニングを遂行でき、その結 この結果を踏まえてビールの横に紙おむつを 果をビジネス・業務に展開して課題や目標を 陳列し、ビールと紙おむつの売上を伸ばすこ クリアできる。 とができたのかもしれない。 きわめて重要な データマイニングの大前提 前 回までは、 分 析 手 法 「CRISP-DM」 に従ってアナリティクスの内容を解説した。 108 しそうだが、ツールが自動で何かを教えてく しかし、そのスーパーマーケットでは、マー ケット全体の売上はもちろんのこと、 利益、 掟1 ビジネスの課題と目標 (カダイ) 顧客満足度、 顧客生涯価値などのビジネス および経営の課題や目標を達成できたのだ ろうか。経営が成功したと評価できる指標は こうした確立された手法があれば、 それに 第1回でも書いたが、アナリティクスの最 クリアできたのだろうか。この都市伝説は、 従うことでデータマイニングプロジェクトを遂 も重要な要素がこれである。 「当社には何年 そこまでは明らかにしていない。 行できる。しかし、 実はそれ以前に、 デー にもわたって蓄積してきたデータがある。そ つまり、 アナリティクスでは、 マイニング タマイニングの大前提としてきわめて重要な れをマイニングツールに読み込ませれば、今 の結果が課題の解決や目標の達成に有効で 要素がある。 今回はそれについて解説して まで気づかなかった“何か”をアウトプットし あったか否かの評価が重要で、 そのために みたい。 てくれるに違いない」といった期待の声をよ は解決すべき課題や達成すべき目標をあらか そ の 大 前 提 の 要 素 が あ れ ば、 あとは くお聞きする。マイニングというと何やら難 じめ設定しておく必要があるのだ。データマ 2015 No.8 108-110_15ISno8_kiso_analy_FIX.indd 108 2015/07/15 9:23 イニングは、マイニングを実施した時点で終 図表 1 データサイエンティストに必要なスキル わりではなく、むしろマイニングを行った後 が重要であることを忘れてはならない。すな わち、 データマイニングは 「魔法の箱」 で はない。 ビジネススキル 掟2 業務知識 コンサルティング 社内推進体制(ヒト) マイニングプロジェクトをより効果の高い ものにするために、 施策実行の担当者もし くはチームを設定することが重要である。市 場や商品の変化、課題や目標の変化に伴い、 マイニングも変化させなければならない。つ まり、 分析を繰り返し継続して実施すること が重要になる。 「終わりなき戦い」 のための 分析スキル データマイニング 統計学 アルゴリズム 社内体制が不可欠なのだ。 3年ほど前に米経営誌『ハーバード・ビジ IT スキル アナリティクスツール データウェアハウス SQL ネス・レビュー』 (2012 年 10月号)は、デー タサイエンティストは「今世紀で最もセクシー な職業」と書いた。アナリティクスを活用す る企業が成功を収めているという事例を踏ま えて、 データサイエンティストの仕事の“セ クシーさ”をクローズアップしたものだ。 ところがその 2 年後(2014 年)、 「デー タサイエンティストは消滅する」という見方 なり使い勝手のよいユーザーインターフェー もできないだろう。 が流布し始めた。 つまり、アナリティクスは スになっている。だからといって、ツールを その一方で、分析や IT のスキルは、外部 一般のビジネスマンが行うものとなり、デー 操作できさえすれば、 課題や目標をクリアす のコンサルティングサービスの利用や、 トレー タサイエンティストは不要になる、というの るためのマイニングが実施できるのか、とい ニングサービスを受講しスキルを身につける だ。 うと、 そうではないだろう。やはり、しかる 方法もある。スキルを身につける第一歩とし データサイエンティストに必要なスキル べき担当者やチームが必要であり、 それら ては、 以下のようなトレーニングの受講が有 効だ。 は、 図表 1 の要素と言われる。 もちろん、 がマイニングプロジェクトの根幹をマネージ これらを1 人の担当者がもつことはまずあり するべきである。 えないだろう。 従って、 データサイエンティ 次に、こうしたスキルを社内だけでまかな データサイエンティスト入門(アイ・ラーニング) http://bit.ly/IS_ana03 ストチームとして、これらのスキルを保有す えるのか、という懸念もある。しかし少なく ることが現実的と言える。 とも、ビジネススキルや業務知識、 課題・ では、このようなスキルを一般のビジネス 目標の設定、 評価は、 それらの経験や知 ただし、 分析のアルゴリズムの詳細まで マンがもち、 分析を実施し、 業務に展開で 見をもつ社内の人材が必須であると考える。 探究・習得する必要はなく、この部分はマ きるだろうか。 「CRISP-DM」を実行できる なぜなら、データマイニングの結果をビジネ イニングツールの機能に任せておけばよいと のだろうか。 スや業務に展開し評価できなければデータマ 思う。そして、 いつまでも外部任せにせず、 確かに現在は、 Excelもかなりの分析機 イニングプロジェクトは成功とは言えないか 社内の人材がスキルを身につけ、 社内のメ 能を備えている。IBM SPSS Modelerもか らである。 業務知識がなければ展開も評価 ンバーのみによるマイニングプロジェクトを http://www.ismagazine.jp/ 109 108-110_15ISno8_kiso_analy_FIX.indd 109 2015/07/15 9:23 基 礎を鍛える 初 級 遂行していくことが理想だ。 「データサイエ データの所在が明らかでないと、データの欠 プデートされていない古いものであったり、 ンティスト」という名称に固執する必要はな 損値の処理や加工などのクレンジングや統合 一部が欠落していたり、さらには IT 担当者 い。こういったスキルをもつチーム・体制が を進めることができない。 の記憶頼りだったりするケースが多々ある。 社内にあるということがポイントだ。 対象 データ分析を必要とする業務部門 掟3 データの所在(モノ) データは、1つのサーバーに保存されて マイニング作業に入る前に、 データの所 いる場合もあるかもしれないが、 大半は複 在について整理し、 不足部分はドキュメント 数のサーバーに分散しているだろう。また、 化しておく必要がある。少なくとも、 担当者 マイニングを進めていくに従い、 対象データ 個人に依存する管理はぜひとも避けたい。 の種類が増えていく場合もある。これは特に こうした準備を行っておきさえすれば、 作業 「フェーズ2. データの理解」 の作業で必要 からの手戻りや、さまざまな輻輳と混乱を防 連載1回目の解説において、 CRISP-DM になるが、どのようなデータかを理解するに ぐことができるのだ。 の「フェーズ2.データの理解」と「フェーズ3. あたり、まずは 「どこに、 何が」 存在して データマイニングの3つの掟を、 図表2に データの準備」 でデータマイニング工数の いるかがわかる情報が必要になる。あたりま 表した。 語呂よく、 「ヒト・モノ・カダイ」 と 70〜80%が費やされると書いた。 それは えだと思われるかもしれないが、 実際にお客 覚えていただければと思う。 そのとおりだが、これに先立ち、対象となる 様の状況を調べると、テーブル関連図がアッ 図表 2 アナリティクスの3つの掟 カダイ 課題・目標 ヒト モノ 体制・メンバー スキル データ マイニング h t t p : / / w w w. i m a g a z i n e . c o . j p / 110 2015 No.8 108-110_15ISno8_kiso_analy_FIX.indd 110 2015/07/15 9:23
© Copyright 2026 Paperzz