TERADATA APPLIANCE fOR HADOOP

Teradata Appliance
for Hadoop
DATA
PLATFORM
14.03
TDMK-2072
統合型、エンタープライズ用途の Hadoop
Apache™ Hadoop® は、データ・ステージング・エリアまたはエン
タープライズ・データ・レイク(あらゆるフォーマットまたはスキーマ
要件で構成される、非常に大量のデータをロード、蓄積、加工する
ための大規模スケーラブル環境)を展開するための主要ビッグデ
ータ・プラットフォームとして誕生しました。このプラットフォーム
は次世代データ・アーキテクチャを実現する重要なキーとなるプラ
ットフォームとして人気を得ましたが、企業は独特に設計された機
能の展開に苦戦しています。多くの Fortune 500企業は、Hadoop
の 利 点 を 競 争 上 の 優 位 性 として ま だ 活 用 で き て い ま せ
ん。Hadoop の専門家やデータ・サイエンティストを雇用する費用
が高額であること、テクノロジー統合の複雑さ、そしてデータの専
門家が新たな Hadoopプロジェクトやさまざまな意見、また混乱し
たメッセージに惑わされてしまうというといった課題があります。
企業はすべてのデータから価値を引き出すために最適な方法を探
し求め、Apache Hadoop を自社のデータ・アーキテクチャに適合
さ せる 方 法 を 試 して い ま す。ビッグ デ ー タ 分 析 に 関 して
は、Teradata のように信頼できるアドバイザーを検討することが
理にかなっています。Teradata は、統合データウェアハウジング、
ビッグデータ分析、ビジネス・アプリケーションに完全に特化した
世界最大の企業です。30年以上にわたり、Teradata はお客様が
分析を通じて競争上の優位性を実現できるようにすることに焦点
を絞ってきました。ワークロードに特化したプラットフォームを使
用した最善のアプローチを採用することにより、Teradata は今や
そのアプローチを Hadoop にまで広げています。
Teradata Appliance for Hadoop はすぐに利用できるパワフルなエ
ンタープライズ・プラットフォームで、ビッグデータの蓄積と加工のた
めに、特別に事前の構成および最適化を行っています。増大するデ
ータ向けの統合的なハードウェアおよびソフトウェア・ソリューショ
ンとして、信頼性があり、完全にサポートされている Teradataハード
ウェア・プラットフォーム上で Hortonworks Data Platform (HDP) と
ユニークな Teradataソフトウェア・テクノロジーを稼働させます。
このアプライアンスは、展開に必要な部品の数を最小限に抑える
ことにより、エンタープライズ用途のデータ・ステージングおよび
加工ソリューションの管理を統合して簡略化し、最適なパフォーマ
ンス、継続的な可用性、線形スケーラビリティといった利点をもた
らすことができます。その結果、Teradata Appliance for Hadoop
を既存インフラストラクチャに組み込むだけで、テクノロジーとリ
ソースへの現在の投資を活用でき、Hadoop をビジネスに取り込
むことができるのです。
スケーラブルで管理しやすく、すぐに使えるエンター
プライズHadoop
Teradata Appliance for Hadoop は、エンタープライズ用途のビッ
グデータの蓄積と管理に最適化された、密結合のハードウェアお
よびソフトウェア・スタックです。典型的な Do-It-Yourself 型の
Hadoopシステムに比べ、パフォーマンス、使いやすさ、管理しや
すさ、信頼性が大幅に向上しています。
パワフル、スケーラブル、立ち上げのしやすさ
組み込んですぐに使える完全統合型システムとして提供される
Teradata Appliance for Hadoop は、多構造データからなるビッ
グデータの蓄積に特化しています。キャビネットごとに最大152TB
の非圧縮データを蓄積し、システム全体では10PBまで拡張可能で
す。Teradata、Teradata Aster、およびHadoopシステム間の高速デ
ータ交換を実現するため、Teradata のファブリック・ベースド・コ
ンピューティング、すなわち40GB/秒の InfiniBand 相互接続上
1
DATA
PLATFORM
14.03
TDMK-2072
の高スループットBYNET™ V5によりリンクされます。デュアル6コ
スを使用して TeradataとHadoop間でデータを移動することがで
アおよび8コアの Intel® Sandy Bridgeプロセッサーとエンタープ
きます。Teradata DCH は、さまざまなタイプの Hadoopデータ・
ライズ・クラスの記憶域を搭載した、実績ある Teradataハードウ
オブジェクト (HDFSファイル、Hiveテーブル、HCatalog で登録さ
ェ ア・プ ラ ットフォ ーム 上 に 、1 0 0 % オ ープ ン・ソ ース の
れたHiveテーブルなど)を対象とするデータのロードおよびデータ
Apache Hadoop を基盤とした Teradata認定 Hortonworks Data
の抽出をサポートしています。
Platform (HDP)を採用しています。そのため、わずか数時間でシス
テムを立ち上げて稼働させ、短時間で価値を実現することができ
ます。
高可用性
NameNodeフェールオーバーは、すぐに使える重要な高可用性機
能で、復旧時間を短縮し、システム全体の信頼性を高めることが
できます。インテリジェントな起動/停止機能は、従来手動で実装
する必要があったすべての Hadoopサービスを自動起動するため
の、グラフィカルなアプローチです。クラスタに対する新規データ・
ノードの追加や、単一ドライブの置換など、一般的に面倒なハード
ウェアに関する手続きが簡略化されています。
Teradataプラットフォームと Hadoopデータ
の統合
Teradataには、Hadoop、Teradata、および Teradata Aster 間でデー
タを統合するための堅牢なソフトウェア・テクノロジーがあります。
完全かつ集中化された管理、サービス、サポート
より短い時間で Hadoopクラスタを管理できるよう、Hadoop に
対する特定のエンタープライズ機能強化が Teradata Appliance
for Hadoop に追加されました。
すべての Teradataプラットフォームと同様に、Teradata
Appli-
ance for Hadoop では単一のオペレーショナル・ビューを通じて
管 理、制御、監 視を簡単に行えるようにしています。すべての
Hadoopノードは単一の Teradata Viewpoint インターフェースで
集中監視されるため、システム管理者による管理が容易になる一
方で、スケーラビリティ、信頼性、管理しやすさが向上します。この
インターフェースは、システムを拡張した場合でも管理作業を最小
限に抑えるため、管理を容易にかつ自動的に行えるようにし、デー
タとアプリケーションを管理するパワフルな機能を用いて、集中
管理を行う直観的ツールを組み合わせたものです。
Integration with Teradata Server Management
Teradata および Teradata Asterデータベースへのエンタープラ
イズ・クラスの SQL統合
ディスクやノードの障害など、ハードウェアおよびソフトウェア・イ
アナリストの方は、Teradata SQL-H™および Teradata Aster
ance for Hadoop 上で使用可能な Teradata の予防検知サポー
ベントの予防検知的な監視を可能にします。各 Teradata Appli-
SQL-H™ により、Hadoopデータを使いやすくなりました。これら
ト・ソフトウェアによって収集されたサポート情報は、Teradataカ
のテクノロジーにより、Apache HCatalog を利用して、標準のSQL
スタマー・サービスのバックエンド・サポート・インフラストラクチ
ツール、ビジネス・インテリジェンス(BI)アプリケーション、および
ャに自動的にルーティングされるため、問題に迅速に対処し、シス
Hadoop に蓄積されているデータ間にシームレスな SQL-on-
テムのダウンタイムを最小化できます。
Hadoopインターフェースが提供されます。Teradata SQL-H™ と
Teradata Aster SQL-H™ では、Hadoop用のスマート・ローダーを
備えたTeradata Studio™ や双方向バルク・データ・コネクターを
Teradata Server Management は、ハードウェアおよびソフトウェ
ア例外(障害)、ハードウェアおよびソフトウェア資産データ、補助
介したリッチ・データ接続も可能です。
的 な 診 断 デ ー タを 検 出して 報 告 するコン ポ ーネ ント群 で
Teradata Connector for Hadoop
ment Server (VMS)ノードおよびサーバー上の仮想マシンで実行
Teradata Connector for Hadoop (DCH)は、Teradataシステムと
されます。VMS は、Teradataハードウェアと Apache Hadoopソフ
Hadoop製品エコシステム間の高パフォーマンスな並列双方向デ
す。Teradata Server Management は、一連の Virtual Manage-
トウェアをサポートしています。また、Hadoop 用の Teradata
ータ移動をサポートする、API およびツール群です。
Vital Infrastructure もサポートします。
Teradata DCH は、独自のコマンド・ライン・インターフェース(CLI)
Teradata Vital Infrastructure は、Server Management のデー
を備えたエンドユーザー・ツールとして使用できます。また、JAVA
API を通じて他のエンドユーザー・ツールとの統合を実現するため
の構成要素の役割も果たします。たとえば、Sqoop と統合する
と、Sqoopユーザーは Sqoop のコマンド・ライン・インターフェー
2
タを Teradataカスタマー・サービスのバックエンド・サポート・イ
ンフラストラクチャに配信するためのエンドツーエンド・ソリュー
ションです。Teradata Vital Infrastructure を有効にすると、正当
な理由があると認められれば、Teradata Vital Infrastructure が
DATA
PLATFORM
14.03
アラートや他のタイプのデータを Teradataカスタマー・サービス
のバックエンド・サポート・インフラストラクチャにエスカレート(
転送)します。アラートには以下のものがあります。
~~ホストがダウンしている
~~CPU 使用率がしきい値を超えた
~~CPU 使用率がしきい値を下回った
TDMK-2072
情報を表示します。
~~領域使用率 – ディスク領域使用率を監視および管理します。
~~測定基準分析 – 一定期間にわたるシステム測定基準を表示
し、トレンド分析を行います。
~~測定基準グラフ – システム測定基準をグラフ表示します。
~~容量ヒートマップ – ユーザーが定義した期間に基づいて各種シ
~~ファイル・システムが設定されているしきい値を超えた
ステム測定基準のホットスポットを分析するための対話型仮想
~~破損ブロックまたは損失ブロックの数が設定されているしきい
化ツールです。
値を超えた
~~NameNode が設定されている編集ログ・ディレクトリのいずれ
かに書き込めない
~~クラスタ内でダウンしている DataNode の数が設定されてい
るしきい値を超えた
~~JobTracker プロセスが稼働してネットワーク上でリッスンして
いるかどうか確認できない
~~Hiveメタストア・プロセスがダウンしている
~~Hadoopアプリケーション障害
~~Gangliaプロセスがダウンしている
~~HDFS の容量残パーセント
Teradata Vital Infrastructure が収集した診断情報は、サポート
担当者が問題を特定し、迅速に解決する上で役立ちます。逆に言
えば、この予防検知的なソフトウェアを除外すると、インシデント
の解決に要する時間が長引くおそれがあります。実際、Teradata
内部の調査によると、Teradata Vital Infrastructure はすべての
システム・インシデントの62~70パーセントを発見しています。
Teradata Viewpoint には、HDP、Teradata Aster Discovery
Platform、および Teradata の統合データウェアハウス用の共通
管理コンソールが統合されています。Teradata Viewpoint は、ブ
ラウザベースの Viewpoint Portlet を備えることにより、より簡単
かつ高速に、包括的なシステム管理および監視機能を実現しま
す。Viewpoint Portlet は管理および監視アプリケーション・スイ
ートで、非常に重要な以下の Hadoopシステム情報を提供します。
~~Hadoopサービス – すべての Hadoopサービスに関する要約
情報を表示します。
~~システム状態 – システム・パフォーマンスと Hadoopシステム
状態のKPI指標です。
~~アラート・ビューア – ログ記録されたTeradata Hadoopアラー
トを管理および監視します。
~~ノード・モニター – Hadoopシステム上のノードに関する要約
3
Hadoopソフトウェア監視は Teradata Viewpoint 14.10 で利用可
能です。
さらに、Teradata には、サポートに関して次のような強みがありま
す。
~~経験豊富なサービス担当者を 24x7 で利用できる、業界認
定を受けた地域およびグローバルなカスタマー・ケア・センタ
ー。
~~ハードウェアと OS から Hadoopソフトウェアまで、ソリューショ
ン全体に対するエンド・ツー・エンドのサポート。
~~ 問題をピンポイントで特定し、迅速に対応するための安全な
リモート接続オプション。
Teradata が選ばれる理由
Teradata は、統合データウェアハウジング、ビッグデータ分析、お
よびHadoop を通じて分析データ・ソリューションに焦点を絞って
いる世界最大の企業です。組織中のデータを実用的な洞察に変え
ることで、リーダーが大胆に考え、断固として行動して、最良の決
断を下せるようにするという強みを企業にもたらしているのは
Teradata だけです。
詳細情報
Teradata Appliance for Hadoop を利用して Hadoop で成功する
方法について、詳しくはテラデータの営業担当者にお問い合わせ
いただくか、Teradata .com/Hadoop にアクセスしてください。
DATA
PLATFORM
14.03
TDMK-2072
Teradata Appliance for Hadoop 概要
Teradata Appliance for Hadoopの特長:
• Teradata認定Hortonworks Data
Platform
• SUSE® Linux Enterprise Server (SLES)
11 64bitオペレーティング・システム
• 統合キャビネット
–– デュアルIntel 8コアXeon®プロセ
ッサー@2.6GHz/ノード(Hadoop
Master)
–– デュアルIntel 6コアXeon®プロセッ
サー@2.0GHz/ノード(Hadoop Data)
–– 40GB/秒のInfiniBand相互接続上に
高スループットBYNET™ V5
• ディスク容量 – 非圧縮時(標準では3
倍圧縮)
–– Hadoop用データ・ノード(3TBドライ
ブ): ユーザー領域9.5TB
–– Hadoopフル・キャビネット(2
Master/16 Data) : ユーザー領域
152TB
• 拡張キャビネットとさらに大型のネット
ワーク・スイッチの使用によりペタバイ
トまで拡張可能
• Hadoop用に開発/最適化された
Teradataソフトウェア –– Teradata Server Managementおよ
びTeradata Viewpointを含む、シス
テム管理インフラストラクチャ • サード・パーティ・ソフトウェア
–– Informatica PowerCenter Big Data
Editionは、データ統合をHadoop用
に最適化および加工します。
–– Protegrity Big Data Protectorは、
ファイルからアプリケーションまで
包括的なHadoopデータ保護を行い
ます。
–– Revelytix Loomは、Hadoop用の動
的データ・セット管理、メタデータ、
およびデータ系統を提供します。
–– Teradata SQL-H™、スマート・ローダ
ーを備えたTeradata Studio™、およ
びHadoopディストリビューション用
コネクターを含む、Teradataデータ
ウェアハウスへの高速データ・コネ
クター
仕様一覧
キャビネット仕様
• 高さ: 204.5 cm
• 幅: 61 cm
• 奥行き: 124.4 cm –– 119.4 cm (前面および背面のドア
を除く)
• 重量: 1,011 kg (最大構成時、輸送用
枠箱を含む)
• 電流:
–– 30A、3-p、4-wire、4-cord
• 柔軟な対応時間
–– 60A、3-p、4-wire、2-cord
• Teradata Vital Infrastructureの堅牢
な診断機能
国際電圧範囲: 220~240/381~415、3~
+N +PE (三相)
• 電流:
–– 32A/30A、3-p、5-wire、2-cord、全
地域(EU形式電源の北米を含む)
• 設置重量: 830 kg (最大構成時、枠箱
を除く)
• 周波数: 50Hz~60Hz
動作仕様
• デュアルAC: 標準
• 動作温度: 許容範囲: 15°C~32°C
–– 推奨: 18°C~27°C
• 相対湿度: 許容範囲: 20%~80% (結
露しないこと)、推奨: 最低湿度: 5.5C
DP (41.9F)、最高湿度: 60% RHかつ
15C DP
電気仕様
北米電圧範囲: 200~240V、3~+PE
• 迅速な応答時間
• 最大電力: 12.25kW
• 安全性と排出に関する米国および国
際規格に準拠
サポート・サービス
メンテナンスとサポート
• 統合的なハードウェアおよびソフトウ
ェアのメンテナンスとサポート
• 安全なリモート接続
〒107-0052 東京都港区赤坂2-23-1 アークヒルズ フロントタワー
• Unified Data Architecture、SQL-H、Teradata Studio、およびTeradataはTeradata Corporationの登録商標です。本文中の社名、製品名は各社
の商標または登録商標です。
• 本資料に掲載されている情報は予告なしに変更されることがあります。
• 本資料で記述した全ての機能、実行内容が全世界で販売されているとは限りません。最新情報についてはTeradata担当者にお尋ねください。
Copyright © 2014 by Teradata Corporation • Teradata @ Your Serviceを介してソ
フトウェア・アップデートへのアクセ
スが容易
• 予防検知的システム監視
• 実装サービス
• システム設置
• ソフトウェア実装