HP Verticaビッグデータソリューションに大きな価値を見出す

ケーススタディ
HP Vertica ビッグデータ
ソリューションに大きな価値を見出す
クリックストリームデータの分析時間を
数日から数分にまで短縮
業界
テクノロジー
目標
HP の Web サイト (hp.com) におけるクリックス
トリームデータの処理の効率化
アプローチ
ビッグデータ分析 / ストレージソリューション
の実装
IT 面の課題
• hp.com へのアクセスで生 成される数十億列
のデータを容易に収容できるソリューション
が必要であった
• ユーザーがより複雑で繰り返しの多いデータ
を分析できるよう、数日ではなく数分でクエ
リを返す必要があった
• 業界標準の SQL により、ユーザーに親しみや
すい環境を構築し、利用率と ROI を最大化す
る必要があった
ビジネス面の課題
• Web サイトのハードウェアまたはソフトウェア
の問題を特定、修正する機能を強化し、カス
タマーエクスペリエンスの低下や売上の損失
につながるリスクを減らす必要があった
「HP Vertica と Apache Hadoop のクリックストリーム
分析は、これらのテクノロジーがもたらす計り知れない
• 対話型のパーソナライズされた Web サイトエ
クスペリエンスを実現する機能を強化して購 価値を実証しています。HP では、今後さらに多くのお
買率を改善し、売上と利益を向上させる必要 客様が後に続き、ビッグデータ分析において同じアプ
があった
ローチを採用することを期待しています」
̶ HP.com Technology ディレクター、John Lormand
ビッグデータには大きな価値があります。しかし、その
価値を実現するには、多くの企業において、従来のバッ
チ処理テクノロジーをリアルタイムの対話型分析に対応
したソリューションへと進化させる必要があります。HP
Vertica Analytics とオープンソースの Apache Hadoop ソ
フトウェアは、クリックストリーム分析機能の強化を目
的に HP が社内で活用したビッグデータソリューションを
提供します。
ケーススタディ | HP Vertica ビッグデータソリューション
「時は金なり」というのは事実です。
しかし、データも同様に重要です。
さらに広い意味では、クリックストリー
ムデータの分析は、購買行動をはじめと
するお 客 様 の 行 動 の 把 握にも 役 立ちま
す。これにより、HP では販売 / マーケティ
ングキャンペーン、さらには 製 品や サー
ビスまでも改善できるようになりました。
HP.com Technology の ディレクターで あ
る John Lormand は次のように述べてい
ます。
「クリックストリームデータを最も
多く活用しているのは市場アナリストで
す。ユーザーとのコミュニケーションやソ
リューションの市場展開の方法に大きな
変化をもたらすビッグデータの価値は広く
認められています」。
今日の企業は、収集するデータが多いほ
ど、その価値が高まることを認識し始め
ています。
「ビッグデータ」は、企業が非
常にきめ細かいデジタル情報を取得した
ときに生み出される膨大なデータセット
で、イノベーションの推進と生産性の向上
に大きく貢献します。また、ビッグデータ
を活用すれば、新たな機会や市場を見極
め、お客 様のニーズと行動をより深く理
解できるため、多くの企業は競争力を高
めるとともに、リスクを的確に把握するこ
とが可能になります。
以前 HP では、従来型の Oracle データベー
スにクリックストリームデータを格納し、
しかし、ビッグデータの価値を引き出す SAS Analytics ソフトウェアを使 用してモ
には、最 先 端 の テクノロジーが 必 要 で、 デル化と分析を実行していました。
従 来のデータベースのサイズを縮小した
データセットを分析できなければならな しかし、現在では、多くの要因により、デー
いうえ、迅速な分析とタイムリーかつ的確 タセットは膨大なものとなっています。
なデータ処理が求められます。
その要因の 1 つが、hp.com のトラフィッ
そこで HP は、独自のテクノロジーである ク の 量 と、 各 訪 問 者 の 1 回 のアク セ ス
HP Vertica Analytics Platform とオープン あたりのクリック数 です。これについて
ソースの Apache Hadoop ソフトウェアを Lormand は、
「毎月のクリック数は 110 ∼
統合し、堅牢かつ包括的なビッグデータ 120 億回に達する」と述べています。HP
分析ソリューションを作成しました。
において動向分析と比較分析を完全にサ
ポートするには、約 5 年分に相当するク
リックストリームデータを保存しておく必
数十億のアクセス
要があります。アナリストは通常、前年比
今日の多くの企業と同様、HP においても の動向分析を実行する際に、約 15 ヶ月分
自社の Web サイトである hp.com が企業 に相当するデータを必要としますが、こ
の顔となっています。毎月のアクセス数が のデータにより、季 節性を考慮した、前
数十億に達するこのサイトは、HP におい 年のトラフィックとの相関関係を示すこと
て最も重要なマーケティングコミュニケー ができます。
ションツールの 1 つと位置付けられてお
り、HP はこのサイトを通じて、自社の製
品やサービスに関する数千ページもの検
索可能な情報を直接一般に公開していま
す。また、このサイトは仮想店舗としての
役割も担っており、HP はサイト内でお客
様と取引することも可能です。
Web サイト自体も極めて複雑で、単一の
アプリケーションと比べてサービスのコレ
クションが多く、静的な 環境ではありま
せん。多くのページは、訪問者または訪
問者の行動によってもたらされる情報に
基づいて動的に生成されており、
「HP.com
は、HP が生成する要素と、サービスプロ
hp.com では、数百万件にも及ぶサイト訪 バイダーによって提供される要素から成る
問者とのやり取りの中で、訪問者がロー 統合環境である」と Lormand は説明して
ドしたページ、各ページで費やした時間、 います。
クリックしたリンク、およびサイトを終了
実際、HP のクリックストリームデータベー
した方法に関する情報をはじめとする「ク
スは、HP 内で 最 大の Oracle インスタン
リックストリーム」データが生成されます。
HP は、このクリックストリームデータを スでした。
分析することで、Web サイトの訪問者に
しかし、収集された膨大な量のデータが
ついて、さらには、サイトにおける訪問者
多くの問題をもたらしました。データベー
の行動をより的確に把握できます。これ
スのパフォーマンスは遅く、クエリの処理
により、HP ではデータを活用してサイト
に数日かかることもありました。これにつ
自体を改善し、たとえば、訪問者が必要
いて Lormand は、
「クエリ結 果を得 るま
な情報を容易に検索できるようにするな
でに、その日のトランザクションが完了し
ど、ユーザビリティを向上させることが可
てから 48 時間以上かかっていました。ま
能になりました。
た、より複雑な分析は、実際のところ時
間がかかり過ぎて実行不可能だったため、
クリックストリームの分析機能を改善する
必要があることはわかっていました」と述
べています。
2
ケーススタディ | HP Vertica ビッグデータソリューション
HP ビッグデータソリューション
Infrastructure Management
Intelligent data centers of
the future
Intelligent, workload
optimized solutions
Insight
Intelligent Business
Decisions, Faster
ユーザーフレンドリな
ビッグデータ分析モデル
高速かつ柔軟な
分析がビッグデータ
の価値を引き出す
にデータを処理できるようになりました。
Lormand は次のように述べています。
「HP
Vertica ソリューションにより、クリックス
トリームデータベースのより回帰的かつ反
そこで HP は、自社が保有する HP ソフト 復的な分析が可能になりました。今では、
ウェアのポートフォリオに目を向け、リア アナリストは着目すべき対象に気付いた時
ルタイムのクエリとロード、高度なデータ 点で、簡単にクエリを繰り返し実行し、次
ベース内分析、および従 来のデータベー のクエリが実行できるようになるまで何日
スの 50 ∼ 1,000 倍 の 速 度 でクエリを 処 も待つことなく、一連の見解をまとめるこ
理 で きる 高 度 な ストレ ージと 実 行 機 能 とができます。つまり、膨大なクリックス
に対応した、業 界屈指のビッグデータソ トリームデータの中に隠れた重要な情報
リューションである HP Vertica Analytics を明らかにする「データとの対話」が行え
Platform を活用し、分散ファイルシステム るのです」。
として、Vertica ソリューションと Apache
Hadoop を 統 合しました。Lormand は 次 分析の時間が短縮され、柔軟性が高まっ
のように述べています。
「これらのアプリ たことで、HP はクリックストリームデータ
ケーションは、いずれも低コストでビッグ から、より高度かつ詳細な情報を得るこ
データ処理が行える設計の大規模並列処 とができるようになりました。これについ
理システムで、機能面では高度に補完的 て Lormand は、
「当社の分析では、以前
な関係にあります。Hadoop により、構造 は単に Oracle ソリューションで要求を処
化データと非構造化データのロードが効 理できないために実現不可能だった方法
率化され、Vertica が効率的かつ徹底的な で、データポイントを相関させることがで
分析を可能にするのです」。
きます」と説明しています。
その結果、アナリストは、hp.com のクリッ
クストリームデータベースに格納された膨
大なデータセットで作業した場合でも、何
日も待たされることなく数時間または数
分でクエリの実行結果を得ることができ
るようになりました。
Vertica の もう 1 つ の 大 きな メリットは、
HP のアナリストが使い慣れた構造である
ANSI SQL をベースとしている点にありま
す。Lormand は次のように述べています。
「Vertica は、ユーザーフレンドリなエンゲー
これらの高度な分析機能は、ビジネスに
多大なメリットをもたらします。Web サイ
トの機能とアーキテクチャーを強化でき
る体制を整 えつつある HP では、たとえ
ば、異常を 特 定して分 離し、Web サイト
の機能がユーザーのやり取りにどのように
影響しているのかを分析するなど、サー
バーファーム全体で、これまでより簡単に
イベントを相関させることが 可能になり
ました。これについて Lormand は、
「HP
Vertica ソリューションにより、本当の意
味で環境をエンドツーエンドに把握するこ
とが可能です。また、短時間で結果が得
られるため、すばやく問題に対応できま
す」と述べています。
ジメントモデルでビッグデータ分析機能を
提供します。これが、ユーザーによるテク
ノロジーの利用を促 進するうえで大いに
役立ち、ソリューションは展開後すぐに、
当社のアナリストに受け入れられました」。 HP は、自社 の Web サイトにお いて、各
訪問者のニーズに応じた双方向性を実現
することで、より的確かつきめの細かい
より高速かつ柔軟な分析
ショッピングエクスペリエンスを提供でき
現在では、hp.com へのアクセスで生成さ ます。しかし以前は、幅広い分 類に基づ
れる数十億列のクリックストリームデータ いて訪問者に情報が提供されるようにサ
を容易に収容可能な HP のビッグデータソ イトが構成されており、たとえば、一 般
リューションにより、HP のビジネスユー の小売顧客に該当すると思われる訪問者
には、あるソリューションセットの情報が、
ザーは高度な分析機能を利用できます。
ホームオフィスユーザーに該当すると思わ
HP Vertica と Hadoop の統合ソリューショ れる訪問者には、別の製品に関する情報
ンを活用すれば、分析の時間が大幅に短 が示されていました。
縮されるため、HP はより柔軟かつ流動的
3
ケーススタディ | HP Vertica ビッグデータソリューション
お客様の概要
アプリケーション
ビッグデータ分析
ソフトウェア
HP IT Performance Suite - 情報管理
• HP Vertica Analytics Platform
• Apache Hadoop
このような場合、訪問者によってはこれら HP の収益とブランドにおける hp.com の
の分類に当てはまらないこともあります。 重 要性を考慮すると、クリックストリー
しかし今では、HP Vertica ソリューション ムデータの管理は、今後も HP Vertica ソ
で得られる詳細な情報に基づき、HP では、 リューションの重要な用途の 1 つである
あらゆるタイプの訪問者にサイトを的確に と 考 え ら れ ま す。HP Vertica に つ い て、
対応させることが可能な Web サイト機能 Lormand は次のように結論付けています。
を構築できます。さらにこれにより、訪問 「私たちは自社の Web サイトで、対話型の
者の満足度が向上し、購買率が改善され パーソナライズされたエクスペリエンスを
るという効果も期待できます。
訪問者に提供する必要があると理解して
います。それは重要な戦略的目標であり、
また HP では、HP Vertica を使用して、リ HP Vertica は、その実現に不可欠な機能
ベート請 求のシリアル 番 号と 1 億 3,500 を提供してくれます」。
万列の出荷データを照合する必要がある、
チャネルリベートデータの分析を行ってお
り、その結果として、リベートの予測と四
半期末の財務調整がより的確に行えるよ
うになりました。
メールニュース配信登録
http://hp.com/go/getconnectedjp
© Copyright 2013 Hewlett-Packard Development Company, L.P. 本書の内容は、将来予告なく変更されることがあります。HP 製品およ
びサービスに対する保証については、当該製品およびサービスの保証規定書に記載されています。本書のいかなる内容も、新たな保証を
追加するものではありません。本書の内容につきましては万全を期しておりますが、本書中の技術的あるいは校正上の誤り、省略に対し
ては責任を負いかねますのでご了承ください。
4AA4-5388JPN、2013 年 2 月