過去と現在を分析して 未来を予測 - Hewlett Packard Enterprise

テクニカルホワイトペーパー
過去と現在を分析して
未来を予測
HPE Vertica Analytics Platformの
コア/ 拡張分析機能を活用して分析主導型の企業を構築
目次
エグゼクティブサマリー......................................................................................................................................2
データを活用した競争力の強化 ..................................................................................................................2
HPE Vertica Analytics Platformの分析機能................................................................................3
HPE Vertica SQL:SQL-99準拠の標準SQL ............................................................................3
HPE Vertica拡張SQL:Vertica独自の分析用SQL ................................................................5
HPE Verticaユーザー定義拡張機能 ..................................................................................................6
HPE Vertica Analytics Platformの高度なビッグデータ分析......................................7
データ収集 ...................................................................................................................................................................8
メリットの活用:ケーススタディ ...................................................................................................................9
顧客分析 ...................................................................................................................................................................9
運用分析 ...................................................................................................................................................................9
患者分析 ...................................................................................................................................................................10
センサーデータ分析.........................................................................................................................................10
HPEの専門知識とサポートであらゆる要素を統合 .......................................................................11
まとめ ...............................................................................................................................................................................12
詳細情報 ........................................................................................................................................................................12
エグゼクティブサマリー
HPE Vertica Analytics Platformはインデー
タベース分析機能に最適な環境を提供すると同
時に、R などの高度な分析ライブラリとの緊密
な統合も実現します。このホワイトペーパーで
は、プラットフォームが備えている広範な分析
機能 (SQL-99 準拠の標準 SQL、Vertica 独自
の分析用 SQL、カスタムロジックを使用した高
度な分析機能、ユーザー定義拡張機能など)に
ついて説明します。
本書には、HPE Vertica Analytics Platformの
実際の利用例を紹介する短いケーススタディが
掲載されています。また、HPE Vertica Analytics
Platformの組み込み機能の実装方法や、プラット
フォームのC++、Java、Rのソフトウェア開発キット
(SDK)を使用して次世代の分析機能を独自に開
発する方法についても説明します。
データを活用した
競争力の強化
今日のビジネス環境において組織の競争力を
強化する上では、大量のデータを有益なインサ
イトに変換し、顧客行動、市場機会、ビジネスト
レンド、製品品質、セキュリティ脅威などを把握
できるかどうかが重要になっています。このよう
にデータの重要性が高まるとともに、多くの組
織がビッグデータ分析プラットフォームを導入し、
データから実用的なインサイトを獲得しようと
取り組んでいます。
多くの場合、分析プログラムの作成や拡張の契
機となるのは、新規プロジェクト発足時や、既
存プロジェクトで、組織に必要な情報を得られ
ていない場合です。先見の明のある組織の多く
は、適切な情報を適時に組織で活用する方法と
して、このタイミングでビッグデータ分析に注目
しています。
組織でプロジェクト用の分析プラットフォーム
を検討する場合は、幅広い点に注意することが
重要です。特に、全体的な戦略を策定する際に
考慮すべき機能としては、ビッグデータの収集、
将来のデータ量に対応できる分析クエリの実行
と拡張、エンドユーザーによる分析の使用拡大
への準備、さらには将来使用される高度な分析
への準備が挙げられます。
最終的には、分析の力によってデータの民主化
が可能になり、組織での情報に基づく的確な意
思決定、競争力の向上、真の情報収益率の実現
につながります。これらは、分析主導型の企業
の核心となる概念です。
2
分析の深さのバリエーション
留意すべきもう1つの点は、分析プラットフォー
ムが提供する分析の深さには大きな差があるこ
とです。たとえば、NoSQLデータベースは多く
の場合、Hadoop上でSQLの基本的な実装のみ
を提供します。また、クラウドベースのソリュー
ションによっては、お客様のビジネスを完全に
理解するために必要となる分析の一部しか提供
されていません。
そのような限 定的なビジネス分析では、情 報
の消費 者に分析を提 供するスピードとアジリ
ティに影 響が及びます。分析エンジンが 基 本
的な SQLしか受け付けなければ、ビジネス目
標を達 成するためにはカスタムコードが必要
になる場合が一般的です。基本的な SQL-onHadoop エンジンでは、一部の分析にETLプ
ロセスやデータの移動が必要になり、インプ
レース分析はできない可能性があります。この
ような 場合、クエリの 開発とデータの移動に
よって、高度な分析に過剰な手間がかかるよう
になります。面倒なコーディングやデータ変換
が原因となり、ビジネスや分析の変革に悪影響
が及びます。
分析主導型の企業の構築
分析主導型の企業においては、ビッグデータを
活用することで、意思決定者が過去(何が起き
たか、なぜ起きたか)を理解し、未来に対する
予測や決定の改善に必要なインサイトや展望を
獲得しています(図1)。
分析主導型の企業を構築するために、多くの組
織はHPE Vertica Analytics Platformのコア
機能から利用を始めています。これらの機能に
ついて以下で説明します。
図1. 過去と現在を分析して未来を予測
この一連の図は、分析主導型の企業がビッグデータを使用して顧客定着率を高める方法を示しています。
把握
何が起きたか?
過去6か月間の減少率は
どの程度か?
どのような顧客を
失ったか?
情報
診断
予測
なぜ起きたか?
対処
予防
どう対処すべきか?
追加の対応は可能か?
どのような顧客の維持を
目指すか?
顧客が必要性に気付く前に
何を提供できるか?
どのような対応が
できるか?
付加価値を提供できるか?
意思決定
対応
今後何が起きるか?
なぜ減少率が
上昇したのか?
連絡しなければ
離れていく可能性が
最も高いのは
どのような顧客か?
連絡すると
離れるのはどの顧客か?
インサイト
HPE Vertica Analytics
Platformの分析機能
HPE Verticaの分析機能には、SQL-99準拠の
標準SQLから、Vertica独自の分析用SQL、カス
タムロジックを使用した高度な分析機能までが
揃っています。これらの機能は、HPE Vertica
プラットフォームのコア機能(カラムストレー
ジ、高度な圧縮、超並列処理(MPP)アーキテク
チャー)を活用することで、ビッグデータのニー
ズに対する高いパフォーマンスと拡張性を実現
しています。
また、HPE Vertica Analytics Platformは拡
張可能な設計です。Vertica MPP アーキテク
チャーやデータローカリティ計算を活用できる
カスタムSQL分析機能の開発が可能です。HPE
Vertica Analytics Platformは一般的な言語
(C++、Java、R)をサポートしており、ユーザー
定義拡張機能(UDx)を迅速に開発できます。
HPE Vertica SQL:
SQL-99準拠の標準SQL
HPE Vertica Analytics Platformには、ANSI
99 標準に基づいた幅広いSQL関数が組み込ま
れています。
集約関数
集 約 関 数 は 、クエリ結 果 セット の 複 数 の 行
グル ープにわたるデータを要約します。HPE
Vertica Analytics Platformは、次のような幅
広い集約関数をサポートしています。
•Sum、Min、Max、Count、Avgなどのシンプル
な関数
•分散、共分散、標準偏差、相関を計算する統計
関数
•正規表現、高速に実行される近似関数(ユー
ザー指定のエラートレランスあり)
HPE Vertica のコア機能を使用するこれらの
集約関数の拡張性とパフォーマンスは、従来の
データベースより何倍も優れています。
分析関数
HPE Verticaの使いやすいSQL関数により、複
雑なクエリを大幅に簡単に書けるようになりま
す。これらの関数では、標準的な SQLコードを
数行使用するだけで複雑な分析要件やレポー
トタスクに対応でき、NoSQLフレームワークの
コードを何千行も書く必要はありません。
たとえば、単一の SQL 分析関数を使 用して、
HPE Vertica Analytics Platformで以下のよ
うな複雑な分析要件に対応できます。
• 特 定の 州で 最も長 期にわたる顧客をランク
付け
•指定した期間の小売量の移動平均を計算
•同学年のすべての生徒の中で最高点を発見
• 各販売員が受け取った最新の販売ボーナスを
前回のボーナスと比較
3
分析 関 数の用 途 は 、グラフ分析、トライアン
グルカウンティング、モンテカル ロ 法 な ど で
す。これらの分析操作は、従来のデータベース
ではパフォーマンスが低いため、実現できませ
ん。列形式の MPP データベースを備えた HPE
Ver tica は、こうした複 雑 な 操 作に対 するパ
フォーマンスや拡張性が優れています。
HPE Vertica Analytics Platformには、地理空
間分析向けの関数が組み込まれています。HPE
Vertica Analytics Platformに自動でインス
トールされる数学関数により、一般的な地理空
間操作を実行できます。
グラフ分析
また、HPE Vertica Place はさらに多くの地
理空間 SQL 関数を HPE Vertica Analytics
Platformに提供します。
グラフ分析は関係の理 解に役 立ちます(ソー
シャルネットワーク上の関係など)。また、ネッ
トワーク上の不正行為やスパマーの検出にも使
用できます。
グラフ分析は以前から、リレーショナルデータ
ベースのショーストッパーでした。グラフを表
現および分析するためのテーブル構造はシンプ
ル(通常は数個の列のみ)ですが、グラフ内の
接続を表現するには自己結合が必要となるた
め、組み合わせにより結果セットの行数が爆発
的に増加します。行指向のデータベースプラット
フォームでは、グラフクエリの実行中に作成さ
れる大量のデータにまったく対処できません。
一方、HPE Verticaはこの作業に適切に対応で
きます。列指向のデータベースプラットフォーム
のためグラフデータに対するパフォーマンスが
非常に高く、MPPアーキテクチャーにより必要
に応じたシステムの拡張も容易です。
トライアングルカウンティング
トライアングルカウンティングは、HPE Vertica
の分析関数によってグラフ分析の従来の課題を
解決する方法の例です。友人関係を例にして説
明すると、自分の友人 2 人が互いに友人であっ
た場合、この3人は友人関係のトライアングルを
形成しています。HPE Verticaにより、シンプル
な SQL関数を使用してトライアングルをカウン
トし、高いパフォーマンスでグラフ分析を実施
できます。
モンテカルロ法
モンテカルロ法の主な仕組みは、その名が示す
ように、カジノに行って何度もサイコロを振り、
自分が勝つ可能性が高いか、カジノ側が勝つ可
能性が高いかを判断するようなものです。この
説明は単純ですが、本当の魅力は総当たり方式
の適用にあります。つまり、ゲームのルールや物
理学に複雑な分析を適用する代わりに、何度も
実際にプレイして結果を確認します。
HPE Vertica Analytics Platformはモンテカ
ルロ法の実装に適したプラットフォームです。ま
た逆に、モンテカルロ法はデータ分析に対する
優れたツールです。特に、長時間検討を続ける
よりも総当たり方式の方が有効と考えられる状
況では優れています。
4
地理空間
パッケージインストールにより、地 理 的 位 置
データのレポートや分析が可能になります。地
理空間情報の収集と分析をサポートする地理
空間機能が提供され、
「場所」に関するより多
様な分析が可能となります。お客様の組織は、
ビッグデータと位置データを組み合わせること
で、正確な位置に基づくターゲット広告を使用
したパーソナライズされたマーケティングを実
現できます。位置をブランドアフィニティ、消費
者が興味を持っているポイント、動的なモバイ
ル行動と結び付ければ、最も重要な顧客に狙い
を絞れます。
HPE Ver tic a Place は 、基 盤となる HPE
Vertica Analytics Platform のパフォーマン
スと拡張 性を活用しています。ESRI シェープ
ファイルのデータローダー、Open Geospatial
Consortium(OGC)の Well-Known Text
(WKT)および Well-Known Binary(WKB)
形式でのデータ表現、2 次元の平面データを計
算する多数のOGCベースSQL関数をサポートし
ており、球関数も限定的にサポートしています。
H P E Ve r t i c a P l a c e は H P E Ve r t i c a
Marketplace からダウンロードできるほか、
Dragline(version7.1.1)リリースにも主要な機
能強化として含まれています。
HPE Vertica拡張SQL:
Vertica独自の分析用SQL
HPE Verticaは幅広い拡張分析機能を提供し
ます。これらには、セッション化、時系列分析、イ
ベントベースのウィンドウ、イベント系列結合、
ソーシャルメディア、パターンマッチング向けの
機能が含まれています。
セッション化
セッション化(特別なイベントベースのウィン
ドウ)は、クリックストリームの分析で多く使用
される機能です(特定の期間内に記録された
WebクリックからWeb閲覧セッションを特定す
るなど)。このような用途には総当たり方式の
手続き型手法も使用できますが、HPE Vertica
Analytics Platformのアプローチはシンプル、
効率的、超並列であるため、Webセッション化
をアドホックに実行でき、さまざまなウィンドウ
パラメーターをオンザフライで決定できます。
た と え ば 、3 0 秒 は 平 均 的 な We b 訪 問 セッ
ションではないと仮 定します。HPE Vertica
Analytics Platformは同等の IPアドレスから
のセッションの間隔を自動的に分析し、実際の
平均セッション時間を決定して、そのパラメー
ターに基づいて自動的にデータをトークン化 /
セッション化できます。
時系列
時系列分析は、任意の変数セットの値を長 期
間にわたり評価して、それらの値を分析および
集約用のウィンドウにグループ化します。HPE
Vertica Analytics Platformは時系列分析に
適したデータ構造を持つことが可能なプラット
フォームです。列指向のため、時系列データを
ソート、圧縮、分割でき、最適なパフォーマンス
を実現できます。
HPE Vertica Analytics Platformは、補間ス
キームとしてギャップフィリング機能を提供して
います。この機能により、欠けているデータポ
イントを埋められます。既定の時系列データ間
隔の範囲内で、新しいデータポイントを作成す
る方法です。プラットフォームはデータ内の時系
列以外の列(タイムスライスにわたり計算され
た分析関数の結果など)を補間し、欠けている
データポイントを出力に追加します。
イベントベースのウィンドウ
イベ ント ベースのウィンドウ関 数 は 、標 準 的
な SQL分析に対するHPE Vertica Analytics
Platform の拡張機能です。これらの関数を使
用すると、時系列データ内のイベントの検出が
容易になります。イベントベースのウィンドウに
より、時系列データをウィンドウに分割し、デー
タ内の重要なイベントにフラグを立てられま
す。これが 特に有意義なのは財務データです
(他のアクティビティのトリガーとして特定の
イベントに注目して分析する場合が多いため)。
HPE Vertica Analytics Platformのイベント
ベースのウィンドウ関数は、イベントIDを表す整
数値 (0から開始)を各入力行に割り当てます。
イベントID は、時系列データ内でユーザー指定
イベントが発生するたびに増加します。
たとえば、株価の入力ストリームを例にすると、
株式アナリストはスプレッド(売り呼び値と買
い呼び値の差)が 0.05ドルを超えるたびに、入
力された株価を新しいグループに入れたいと
考える可能性があります。各グループをイベン
トのウィンドウとして見れば、ウィンドウの終
点は特定のイベントタイプの発生によって定義
されます。
HPE Vertica のイベントベースのウィンドウ
関 数には、Conditional Change Eventと
Conditional True Event の 2 種類がありま
す。これらの関数は HPE Vertica Analytics
Platformの拡張機能です。
イベント系列結合
HPE Verticaは一般的なデータウェアハウスの
クエリ結合をサポートしています。また、特別な
タイプの結合を可能にするINTERPOLATE 述
語も提供しています。イベント系列結合はHPE
Vertica SQLの拡張機能であり、測定間隔が正
確に揃っていない場合(タイムスタンプが一致
しない場合など)に、2つのイベント系列の分析
を可能にします。これらの結合により、揃ってい
ないイベントデータを直接クエリするための自
然で効率的な方法を実現でき、系列を同じ測定
間隔に正規化する必要がなくなります。
5
ソーシャルメディア
HPE Vertica Analytics Platformの分析機能
を使 用すると、ソーシャルメディアのコンバー
ジョン、参照、ランディングページ、データソース
の測定が可能になります。プラットフォームの
基盤となる最適化されたストレージ構造および
ソーティングによって大量のデータを結合でき
るため、ソーシャルセンチメントや消費者の購
買パターンを基にした効率的なコンバージョン
率分析を実現できます。
HPE Vertica Analytics Platform の時系列
分析、セッション化、イベント系列パターンマッ
チング拡張機能を使用すると、参照ソーシャル
サイトに関するページビュー、継続時間、訪問、
ランディングページのヒューリスティックスや長
期間にわたるソーシャルセンチメントを測定で
きるようになります。
HPE Vertica Pulseはエンティティ抽出 /セン
チメント分析エンジンです。短いテキストを自
動的に分析することで、コミュニティでの話題
や、それらの話題に対する感 情の把握を支援
します。HPE Vertica Pulse はHPE Vertica
Marketplaceから入手できるほか、Dragline
(version7.1.1)リリースにも主要な機能強化と
して含まれており、1行のSQLで実行できます。
ユーザーや顧客が話題にしているブランド、製
品、サービス、イベントのアスペクト(属性)を
抽出可能です。また、これらの属性ごとにセン
チメントスコアを割り当てられるため、コミュニ
ティが関心を持っているお客様のビジネスのア
スペクトに対するコミュニティの認識を追跡で
きるようになります。
パターンマッチング
HPE Vertica Analytics Platformはイベント系
列パターンマッチング拡張機能を通じて、パスお
よびパターン分析をネイティブでサポートしてい
ます。SQL MATCH拡張機能により、大量の履
歴データを選別し、イベントのパターンを探せる
ようになります。パターンを正規表現として指定
してから、一連の入力イベント内でパターンを検
索できます。MATCHは分析データの分割および
順序付け用の従属節を提供し、パターンマッチン
グは連続した行セットで実行されます。
パターンマッチングが特に有用なのは、Web 閲
覧行動(ページクリック)に基づいてユーザーの
アクションを特定するクリックストリーム分析
です。
HPE Vertica Analytics Platformは、ファネル
分析もネイティブでサポートしています。これ
には、標準的な SQL分析およびファネル分析向
けに設計された分析拡張機能を使用します。プ
ラットフォームのイベント系列パターンマッチン
グ拡張機能は、標準的なコンバージョン率、離
脱 / 直帰率、コンバージョンパスの計算に使用で
きます。標準的な SQL分析(LAGおよび正規表
現分析など)を組み合わせることで、コンバー
ジョンパスを分析できます。
6
HPE Verticaユーザー定義
拡張機能
HPE Vertica Analytics Platformのユーザー
定義拡張機能(UDx)を使用すると、標準的な
SQLでは実行が困難な場合が多い分析操作に
対して、最適なビジネスロジックを実行できる
ようになります。
HPE Verticaの広範なユーザー定義機能(関数、
変換、集約、分析、ローディング)により、手続
き型コードのパワーと柔軟性をデータ(構造化
/半構造化 / 非構造化)に対して利用できるよう
になります。その際は、HPE Vertica Analytics
Platformの並列コンピューティング環境を最大
限に活用します。ユーザー定義拡張機能は、効
率の最大化のためにインプロセスで実行するか、
制御を強化するために専用プロセスで実行しま
す。どちらのモードでも、HPE Vertica のユー
ザーインターフェイスによって手続き型拡張機
能の配備と使用が容易になり、維持可能な運用
プラクティスやコードの再利用を促進できます。
手続き型と宣言型
タスクを一連のアクションに分割するために必
要な手順を考慮すれば、多くの人にとっては、手
続き的に問題解決にアプローチする方が簡単で
す。一方、SQLは宣言型言語です。オペレーター
が必要な出力を指定し、データベースは最適な
手続きを開発して効率的に答えを計算します。
HPE Vertica Optimizerも例外ではありません。
クラスターのデータがどのように分散している
かや、最もコスト効果の高い結合順序を理解し、
効率の良いクエリプラン(手続き内のステップ)
を生成します。しかし、SQLで表現するのが困
難または煩雑な操作も存在します(特に入力が
非構造化 /半構造化の場合)。手続き型言語の
方が自然な場合には、ユーザー定義拡張機能が
順当な選択です。
HPE Vertica Marketplace
HPE Vertica Marketplace はUDxの開発や
配 布 を支 援 する専用ウェブサイトで す。開 発
者、パートナー、お客様用のハブであり、HPE
Vertica Analytics Platformと統合して価値を
高める拡張機能、機能強化、ソリューションの
作成や共有に利用できます。
これらのアドオンやソリューションには、コネク
ターおよびサードパーティ拡張機能、ビジネス
インテリジェンスツール、Extract/Transform/
Load( ETL )およびデー タ変 換 製 品、HPE
Havenビッグデータ分析プラットフォーム用の
コネクターおよびツールが含まれます。また、
インダストリおよび他の OEMソリューションも
含まれます。
HPE Vertica Innovations
プログラム
HPE Vertica Marketplaceでは、最新のHPE
Vertica Innovationsが提供されています。これ
らは、最先端のビッグデータアプリケーション
の作成を支援するインキュベーションプログラ
ムの成果です。このような新しいテクノロジーや
ソリューションは開発者が使用でき、その評価や
フィードバックは将来の開発の指針となります。
HPE Vertica Innovationsには以下が含まれて
います。
•HPE Vertica Distributed R ̶ データサイ
エンティストが直面するRプログラミング言語
の拡張性やパフォーマンスの制約を克服でき
ます。複数のノード上でR 計算を実行して大規
模データセットの分析を加速することで、以前
は解決できなかった問題に対処できるように
なります。
•HPE Vertica Pulse ̶ 組織でインデータベース
のセンチメント分析ツールを使用できるように
なります。短いデータポスト(Twitterフィードや
製品レビューなどのソーシャルデータを含む)
にスコアを付けることで、最も関心を集めてい
る話題を判断し、時間の経過によるセンチメン
トの変化を分析し、支持者や中傷者を特定で
きます。
HPE Vertica Analytics Platform
の高度なビッグデータ分析
HPE Vertica Analytics PlatformへのRの統
合により、大規模データセットに対する高性能
な予測分析が可能になりました。HPE Vertica
Distributed Rは、R言語を拡張してRでの並列
プログラミングをサポートし、数テラバイトの
データに対して拡張および実行できるアルゴリ
ズムをデータサイエンティストが書けるように
しました。R 言語へのユーザー定義拡張機能に
より、データサイエンティストはデータベースに
Rプログラムを配備して、高いパフォーマンスと
拡張可能なインデータベーススコアリングを実
現できます。
予測分析
予測分析は、従来の記述的分析よりもプロアク
ティブで深い分析です。記述的分析はデータの
スライス & ダイスにより、何が起きたか、何が
起きているか、なぜ起きたかを把握する上で有
用です。一方、予測分析では、履歴データからパ
ターンを把握することで今後何が起きるかを予
測できます。
HPE Vertica Analytics Platformは統計計算
用にRをネイティブでサポートしています。モデ
リングや分類用のパブリックな Rライブラリや
関数が多数存在し、HPE Vertica Analytics
Platform に容易にインストールできます。プ
ラットフォームの R 実装はインデータベースで
実 行され、R 関 数を並列 化できるため、HPE
Vertica の基盤となるMPPプラットフォームを
活用できます。
HPE Vertica Analytics Platform の SDKに
より、R 関数の開発や、多数のパブリックな R
機能の統合が可能になります。データ表現に
関しては、多種多様な商用およびオープンソー
スの可視化ツールを HPE Vertica Analytics
Platformとともに使用できます。
̶ 地理空間データ(位
置、ネットワーク、地域など)をほぼリアルタイ
ムに保存および分析します。この分析パックは、
Open Geospatial Consortium(OGC)標準
ベースの機能を提供し、サードパーティアプリ
ケーションと統合できます。
•HPE Vertica Place
7
データ収集
•Apache Hadoop ̶ 業界標準ハードウェアの
クラスター上で大規模データセットを保存/処
HPE Vertica Analytics Platformは、サード
パーティおよびオープンソースのデータベース、
データ管理ツール、データ分析パッケージとの
統合を可能にします。好みや開発スキルに応じ、
HPE Vertica SDKを使用してカスタムのC++、
Java、Rコードを書くことができます。これらの
機能により、ビッグデータのニーズに合わせて
HPE Verticaを簡素化および拡張できます。
次のような接続オプションがあります。
•ODBC(Open Database Connectivity)
̶
データベース管理システムへのアクセス用の標
準的なAPI
理するオープンソースのソフトウェアフレーム
ワーク
̶ 分散ストレージ内の大規模
データセットに対するクエリと管理を可能にす
るデータウェアハウスパッケージ
•Apache Hive
•HPE Vertica Flex Zone ̶ 急増する半構造
化データ/ 構造化データのロード、探索、分析、
収益化を迅速かつ容易に実現できる製品
以下はHPE Vertica Analytics Platformのコ
ア機能とそれを実現するプラットフォーム機能
の概要です。
•JDBC(Java Database Connectivity) ̶
Javaプログラムとデータソース間の接続を提
供するコールレベルAPI
8
機能
プラットフォーム機能
センチメント分析
時系列分析、
セッション化、
イベント系列パターンマッチング拡張機能、
センチメント分析エンジン
(HPE Vertica Pulse)
ソーシャルメディア監視
イベント系列パターンマッチング、時系列分析、
最終反復ソーシャルコンバージョン、
セッション化
パターンおよびパス分析
パターン認識、予測モデリング
時系列分析
ギャップフィリングおよび補間
予測モデリングおよび統計分析
線形回帰、
ロジスティック回帰、Random
顧客セグメンテーション
K平均法
地理空間分析
地理空間SQL関数(HPE
Forest
Vertica Place)
メリットの活用:
ケーススタディ
顧客分析
さまざまなソーシャルメディアプラットフォー
ム上で 100 種類以 上のゲームを提 供している
オンラインゲーム企業が急成長を続け、同社の
分析プログラムでは成長への対応が困難になっ
ていました。同社はデータ主導型の組 織です
が、MySQLデータベースのパフォーマンスが原
因となり、A/Bテストの実行や数千万人のユー
ザーに関するレポートの取得が不可能になって
いました。
同社はHPE Vertica Analytics Platformを試
用してテストし、実運用環境に導入しました。テ
スト作業や分析作業をHPE Vertica Analytics
Platform に移 行することで、以前は 9 時間か
かっていた A/Bテスト結果クエリが 12 秒で戻る
ようになりました。同社では、1日あたり合計約8
億行のイベントデータが追加されています。最
大のテーブルは、1 兆 2,000 億行あるイベント
テーブルです。また、ユーザーのディメンション
テーブルは5,000万行で、それより小規模なテー
ブルも複数あります。
運用分析
ある大手通信会社は、HPE Vertica Analytics
Platformをネットワークパフォーマンスデータ
分析に使用することで、ネットワーク使用率を
詳細に把握できるようになり、機器購入のコス
トを数百万ドル削減できました。
同社ではHPE Vertica Analytics Platformの
クラスターを複数配備して、分析チームが使い
慣れたSQLコマンドで膨大なデータをクエリし、
わずかな時間で結果を取得できるようにしまし
た。また、データネットワークの使用状況デー
タを長期間にわたって保存および分析すること
で、動向の予測を容易にしました。
さらに、HPE Vertica Analytics Platformは同
社が使用している可視化ツールとシームレスに
接続できるため、同社は時刻、ピーク時間帯、設
定日数に応じてさまざまな指標のステータス
を表示するダッシュボードを作成しました。ま
た、HPE Vertica Analytics Platformを使用
して何十億もの記録に関する因果関係を分析し、
「What-If」シナリオを実行することで、同社は
データ分析が持つ新たな可能性に気付きました。
9
患者分析
センサーデータ分析
ある大手医 療ソリューション企 業は、医 療 機
関向けの電子医療記録を実現するアプリケー
ションプラットフォームを扱っています。また、
ケアの提供を迅速化し、無駄やミスを排除する
ための医療機関のプロセス最適化も支援して
います。
HPE ProLiant Gen8サーバーのリリースとと
もに、遠隔測定データをHPEに送信する「Call
Home」機能が導入されました。HPEは受信し
た遠隔測定ストリームをロードし、そのデータ
を分析して、問題(保証イベントなど)が発生
したハードウェアやソフトウェアの構成内にあ
る一定のパターンを探す取り組みを始めました。
保証イベントが発生すると、HPEにはサポートの
コストがかかり、お客様の満足度も低下します。
顧客が求める迅速なレスポンスと全体的なパ
フォーマンスをプラットフォームが提供できる
ように、同社は約 2,000 個のレスポンスタイ
マーをプラットフォームに組み込んでいます。こ
れらのタイマーは、特定のアプリケーション機能
(患者情報の追加 /アクセス、投薬指示 /処置の
入力など)に要した時間を検出します。データ
量が増加し続ける中で、既存のレガシーデータ
ウェアハウスは深刻なパフォーマンス問題に直
面し、同社は変化の必要性を認識しました。
同 社 は他 の 高 度 な分析プラットフォームも 5
個テストしましたが、最終的に HPE Vertica
Analytics Platformを選択し、同社が提供する
アプリケーションプラットフォームや別の医療
ソリューションの支援に活用しています。HPE
Vertica Analytics Platformによって、同社は
高度なパフォーマンス監視や医療データ分析を、
アプリケーションプラットフォームや独自の医
療情報レポートソリューションに統合しています。
このアプリケーションアーキテクチャーによ
り、臨床医が患者情報を最適なタイミングと場
所で入手できるようになります。また、適切な指
標やレポート機能も利用できます。同社はHPE
Vertica Analytics Platformが提供するパフォー
マンス情報を活用することで、パフォーマンス問
題への適切な対処を実現し、使用パターンを分
析して継続的な改善につなげています。
10
HPEは分析で発見した問題について、お客様に
プロアクティブに通知したいと考えていました。
たとえば、
「HPE ProLiant XYZにABZソフト
ウェアをインストールすると、X% の確率で障
害が発生します。次の方法で問題を解決できま
す」と通知するなどです。
遠隔測定のデータは、24 時間 365 日ストリー
ムされています。キーストロークや構成変更が
あるたびに、ログが HPEに送信されます。障害
のシナリオや修正方法はエンジニアが判断す
る必要がありますが、HPE Vertica Analytics
Platformを使用すれば、エンジニアは障害が発
生しているパターンを詳細に把握でき、障害の
影響が広範囲に及ぶ前に修正できるようになり
ます。
HPE Vertica Analytics Platformは、オンザフ
ライでの動的な予測の作成機能、スピードおよ
び圧縮、パターンの検出を支援するインデータ
ベースアルゴリズムのサポートにおいて付加価
値を提供します。
HPEの専門知識とサポートで
あらゆる要素を統合
HPEは分析主導型の組織への変革をサポートし
ます。HPE Vertica Analytics Platformの幅広
い機能や補完的なサードパーティソリューション
を最大限に活用できるよう、HPEは一連のプロ
フェッショナルサービスやデータサイエンティス
トの専門知識を提供しています。
発展を続けるエコシステム
HPEの専門知識に加えて、my.vertica.comを
通じてHPE Verticaユーザーコミュニティの知
識も活用できます。このポータルでは、ソフト
ウェアダウンロードやドキュメント、ディスカッ
ションフォーラムにアクセスできるため、社内
のチームが専門領域の知識を増やし、共有し、
発展させる上で役立ちます。
これらの分析エキスパートのサポートにより、
HPE Vertica Analytics Platformの機能の適切
な組み合わせを特定し、プラットフォームのC++、
Java、RのSDKを使用してサードパーティおよび
オープンソースのソリューションとお客様の分析
環境を統合できます。また、分析導入のベスト
プラクティスや、さまざまな組織でのアプローチ
について理解を深められるようサポートします。
11
まとめ
HPE Vertica Analytics Platformは新時代の
データ分析プラットフォームであり、ビッグデー
タを活用したビジネス分析向けに新規に設計さ
れています。このプラットフォームはインデータ
ベース分析機能に最適な環境を提供すると同時
に、R などの高度な分析ライブラリとの緊密な
統合も実現します。
詳しい情報
HPE Vertica Analytics Platformの
詳細情報 (ケーススタディ、ホワイト
ペーパーなど) についてはこちら
www.hp.com/jp/vertica_jp
HPE Verticaの広範な分析機能には、SQL-99
準拠の標準 SQL、Vertica 独自の分析用 SQL、
ユーザー定義拡張機能、カスタムロジックを使
用した高度なビッグデータ分析機能などが含ま
れます。プラットフォームの組み込み機能の活
用に加えて、プラットフォームの C++、Java 、R
の SDKを使用して次世代の分析機能を独自に
開発することもできます。
最終的には、HPE Vertica Analytics Platform
により、組織での情報に基づく的確な意思決定、
競争力の向上、真の情報収益率の実現が可能
になります。これらは、分析主導型の企業の核
心となる概念です。
記載されている会社名および商品名は、各社の商標または登録商標です。Javaは、Oracleおよびその関連会社の登録商標です。
記載事項は 2016 年 6月現在のものです。本カタログに記載されている情報は取材時におけるものであり、閲覧される時点で変更
されている可能性があります。予めご了承下さい。
© Copyright 2016 Hewlett Packard Enterprise Development LP 日本ヒューレット・パッカード株式会社
〒136-8711 東京都江東区大島2丁目2番 1号
4AA5-3088JPN 2016年6月