Teradata Appliance for Hadoop DATA PLATFORM 14.03 TDMK-2072 統合型、エンタープライズ用途の Hadoop Apache™ Hadoop® は、データ・ステージング・エリアまたはエン タープライズ・データ・レイク(あらゆるフォーマットまたはスキーマ 要件で構成される、非常に大量のデータをロード、蓄積、加工する ための大規模スケーラブル環境)を展開するための主要ビッグデ ータ・プラットフォームとして誕生しました。このプラットフォーム は次世代データ・アーキテクチャを実現する重要なキーとなるプラ ットフォームとして人気を得ましたが、企業は独特に設計された機 能の展開に苦戦しています。多くの Fortune 500企業は、Hadoop の 利 点 を 競 争 上 の 優 位 性 として ま だ 活 用 で き て い ま せ ん。Hadoop の専門家やデータ・サイエンティストを雇用する費用 が高額であること、テクノロジー統合の複雑さ、そしてデータの専 門家が新たな Hadoopプロジェクトやさまざまな意見、また混乱し たメッセージに惑わされてしまうというといった課題があります。 企業はすべてのデータから価値を引き出すために最適な方法を探 し求め、Apache Hadoop を自社のデータ・アーキテクチャに適合 さ せる 方 法 を 試 して い ま す。ビッグ デ ー タ 分 析 に 関 して は、Teradata のように信頼できるアドバイザーを検討することが 理にかなっています。Teradata は、統合データウェアハウジング、 ビッグデータ分析、ビジネス・アプリケーションに完全に特化した 世界最大の企業です。30年以上にわたり、Teradata はお客様が 分析を通じて競争上の優位性を実現できるようにすることに焦点 を絞ってきました。ワークロードに特化したプラットフォームを使 用した最善のアプローチを採用することにより、Teradata は今や そのアプローチを Hadoop にまで広げています。 Teradata Appliance for Hadoop はすぐに利用できるパワフルなエ ンタープライズ・プラットフォームで、ビッグデータの蓄積と加工のた めに、特別に事前の構成および最適化を行っています。増大するデ ータ向けの統合的なハードウェアおよびソフトウェア・ソリューショ ンとして、信頼性があり、完全にサポートされている Teradataハード ウェア・プラットフォーム上で Hortonworks Data Platform (HDP) と ユニークな Teradataソフトウェア・テクノロジーを稼働させます。 このアプライアンスは、展開に必要な部品の数を最小限に抑える ことにより、エンタープライズ用途のデータ・ステージングおよび 加工ソリューションの管理を統合して簡略化し、最適なパフォーマ ンス、継続的な可用性、線形スケーラビリティといった利点をもた らすことができます。その結果、Teradata Appliance for Hadoop を既存インフラストラクチャに組み込むだけで、テクノロジーとリ ソースへの現在の投資を活用でき、Hadoop をビジネスに取り込 むことができるのです。 スケーラブルで管理しやすく、すぐに使えるエンター プライズHadoop Teradata Appliance for Hadoop は、エンタープライズ用途のビッ グデータの蓄積と管理に最適化された、密結合のハードウェアお よびソフトウェア・スタックです。典型的な Do-It-Yourself 型の Hadoopシステムに比べ、パフォーマンス、使いやすさ、管理しや すさ、信頼性が大幅に向上しています。 パワフル、スケーラブル、立ち上げのしやすさ 組み込んですぐに使える完全統合型システムとして提供される Teradata Appliance for Hadoop は、多構造データからなるビッ グデータの蓄積に特化しています。キャビネットごとに最大152TB の非圧縮データを蓄積し、システム全体では10PBまで拡張可能で す。Teradata、Teradata Aster、およびHadoopシステム間の高速デ ータ交換を実現するため、Teradata のファブリック・ベースド・コ ンピューティング、すなわち40GB/秒の InfiniBand 相互接続上 1 DATA PLATFORM 14.03 TDMK-2072 の高スループットBYNET™ V5によりリンクされます。デュアル6コ スを使用して TeradataとHadoop間でデータを移動することがで アおよび8コアの Intel® Sandy Bridgeプロセッサーとエンタープ きます。Teradata DCH は、さまざまなタイプの Hadoopデータ・ ライズ・クラスの記憶域を搭載した、実績ある Teradataハードウ オブジェクト (HDFSファイル、Hiveテーブル、HCatalog で登録さ ェ ア・プ ラ ットフォ ーム 上 に 、1 0 0 % オ ープ ン・ソ ース の れたHiveテーブルなど)を対象とするデータのロードおよびデータ Apache Hadoop を基盤とした Teradata認定 Hortonworks Data の抽出をサポートしています。 Platform (HDP)を採用しています。そのため、わずか数時間でシス テムを立ち上げて稼働させ、短時間で価値を実現することができ ます。 高可用性 NameNodeフェールオーバーは、すぐに使える重要な高可用性機 能で、復旧時間を短縮し、システム全体の信頼性を高めることが できます。インテリジェントな起動/停止機能は、従来手動で実装 する必要があったすべての Hadoopサービスを自動起動するため の、グラフィカルなアプローチです。クラスタに対する新規データ・ ノードの追加や、単一ドライブの置換など、一般的に面倒なハード ウェアに関する手続きが簡略化されています。 Teradataプラットフォームと Hadoopデータ の統合 Teradataには、Hadoop、Teradata、および Teradata Aster 間でデー タを統合するための堅牢なソフトウェア・テクノロジーがあります。 完全かつ集中化された管理、サービス、サポート より短い時間で Hadoopクラスタを管理できるよう、Hadoop に 対する特定のエンタープライズ機能強化が Teradata Appliance for Hadoop に追加されました。 すべての Teradataプラットフォームと同様に、Teradata Appli- ance for Hadoop では単一のオペレーショナル・ビューを通じて 管 理、制御、監 視を簡単に行えるようにしています。すべての Hadoopノードは単一の Teradata Viewpoint インターフェースで 集中監視されるため、システム管理者による管理が容易になる一 方で、スケーラビリティ、信頼性、管理しやすさが向上します。この インターフェースは、システムを拡張した場合でも管理作業を最小 限に抑えるため、管理を容易にかつ自動的に行えるようにし、デー タとアプリケーションを管理するパワフルな機能を用いて、集中 管理を行う直観的ツールを組み合わせたものです。 Integration with Teradata Server Management Teradata および Teradata Asterデータベースへのエンタープラ イズ・クラスの SQL統合 ディスクやノードの障害など、ハードウェアおよびソフトウェア・イ アナリストの方は、Teradata SQL-H™および Teradata Aster ance for Hadoop 上で使用可能な Teradata の予防検知サポー ベントの予防検知的な監視を可能にします。各 Teradata Appli- SQL-H™ により、Hadoopデータを使いやすくなりました。これら ト・ソフトウェアによって収集されたサポート情報は、Teradataカ のテクノロジーにより、Apache HCatalog を利用して、標準のSQL スタマー・サービスのバックエンド・サポート・インフラストラクチ ツール、ビジネス・インテリジェンス(BI)アプリケーション、および ャに自動的にルーティングされるため、問題に迅速に対処し、シス Hadoop に蓄積されているデータ間にシームレスな SQL-on- テムのダウンタイムを最小化できます。 Hadoopインターフェースが提供されます。Teradata SQL-H™ と Teradata Aster SQL-H™ では、Hadoop用のスマート・ローダーを 備えたTeradata Studio™ や双方向バルク・データ・コネクターを Teradata Server Management は、ハードウェアおよびソフトウェ ア例外(障害)、ハードウェアおよびソフトウェア資産データ、補助 介したリッチ・データ接続も可能です。 的 な 診 断 デ ー タを 検 出して 報 告 するコン ポ ーネ ント群 で Teradata Connector for Hadoop ment Server (VMS)ノードおよびサーバー上の仮想マシンで実行 Teradata Connector for Hadoop (DCH)は、Teradataシステムと されます。VMS は、Teradataハードウェアと Apache Hadoopソフ Hadoop製品エコシステム間の高パフォーマンスな並列双方向デ す。Teradata Server Management は、一連の Virtual Manage- トウェアをサポートしています。また、Hadoop 用の Teradata ータ移動をサポートする、API およびツール群です。 Vital Infrastructure もサポートします。 Teradata DCH は、独自のコマンド・ライン・インターフェース(CLI) Teradata Vital Infrastructure は、Server Management のデー を備えたエンドユーザー・ツールとして使用できます。また、JAVA API を通じて他のエンドユーザー・ツールとの統合を実現するため の構成要素の役割も果たします。たとえば、Sqoop と統合する と、Sqoopユーザーは Sqoop のコマンド・ライン・インターフェー 2 タを Teradataカスタマー・サービスのバックエンド・サポート・イ ンフラストラクチャに配信するためのエンドツーエンド・ソリュー ションです。Teradata Vital Infrastructure を有効にすると、正当 な理由があると認められれば、Teradata Vital Infrastructure が DATA PLATFORM 14.03 アラートや他のタイプのデータを Teradataカスタマー・サービス のバックエンド・サポート・インフラストラクチャにエスカレート( 転送)します。アラートには以下のものがあります。 ~~ホストがダウンしている ~~CPU 使用率がしきい値を超えた ~~CPU 使用率がしきい値を下回った TDMK-2072 情報を表示します。 ~~領域使用率 – ディスク領域使用率を監視および管理します。 ~~測定基準分析 – 一定期間にわたるシステム測定基準を表示 し、トレンド分析を行います。 ~~測定基準グラフ – システム測定基準をグラフ表示します。 ~~容量ヒートマップ – ユーザーが定義した期間に基づいて各種シ ~~ファイル・システムが設定されているしきい値を超えた ステム測定基準のホットスポットを分析するための対話型仮想 ~~破損ブロックまたは損失ブロックの数が設定されているしきい 化ツールです。 値を超えた ~~NameNode が設定されている編集ログ・ディレクトリのいずれ かに書き込めない ~~クラスタ内でダウンしている DataNode の数が設定されてい るしきい値を超えた ~~JobTracker プロセスが稼働してネットワーク上でリッスンして いるかどうか確認できない ~~Hiveメタストア・プロセスがダウンしている ~~Hadoopアプリケーション障害 ~~Gangliaプロセスがダウンしている ~~HDFS の容量残パーセント Teradata Vital Infrastructure が収集した診断情報は、サポート 担当者が問題を特定し、迅速に解決する上で役立ちます。逆に言 えば、この予防検知的なソフトウェアを除外すると、インシデント の解決に要する時間が長引くおそれがあります。実際、Teradata 内部の調査によると、Teradata Vital Infrastructure はすべての システム・インシデントの62~70パーセントを発見しています。 Teradata Viewpoint には、HDP、Teradata Aster Discovery Platform、および Teradata の統合データウェアハウス用の共通 管理コンソールが統合されています。Teradata Viewpoint は、ブ ラウザベースの Viewpoint Portlet を備えることにより、より簡単 かつ高速に、包括的なシステム管理および監視機能を実現しま す。Viewpoint Portlet は管理および監視アプリケーション・スイ ートで、非常に重要な以下の Hadoopシステム情報を提供します。 ~~Hadoopサービス – すべての Hadoopサービスに関する要約 情報を表示します。 ~~システム状態 – システム・パフォーマンスと Hadoopシステム 状態のKPI指標です。 ~~アラート・ビューア – ログ記録されたTeradata Hadoopアラー トを管理および監視します。 ~~ノード・モニター – Hadoopシステム上のノードに関する要約 3 Hadoopソフトウェア監視は Teradata Viewpoint 14.10 で利用可 能です。 さらに、Teradata には、サポートに関して次のような強みがありま す。 ~~経験豊富なサービス担当者を 24x7 で利用できる、業界認 定を受けた地域およびグローバルなカスタマー・ケア・センタ ー。 ~~ハードウェアと OS から Hadoopソフトウェアまで、ソリューショ ン全体に対するエンド・ツー・エンドのサポート。 ~~ 問題をピンポイントで特定し、迅速に対応するための安全な リモート接続オプション。 Teradata が選ばれる理由 Teradata は、統合データウェアハウジング、ビッグデータ分析、お よびHadoop を通じて分析データ・ソリューションに焦点を絞って いる世界最大の企業です。組織中のデータを実用的な洞察に変え ることで、リーダーが大胆に考え、断固として行動して、最良の決 断を下せるようにするという強みを企業にもたらしているのは Teradata だけです。 詳細情報 Teradata Appliance for Hadoop を利用して Hadoop で成功する 方法について、詳しくはテラデータの営業担当者にお問い合わせ いただくか、Teradata .com/Hadoop にアクセスしてください。 DATA PLATFORM 14.03 TDMK-2072 Teradata Appliance for Hadoop 概要 Teradata Appliance for Hadoopの特長: • Teradata認定Hortonworks Data Platform • SUSE® Linux Enterprise Server (SLES) 11 64bitオペレーティング・システム • 統合キャビネット –– デュアルIntel 8コアXeon®プロセ ッサー@2.6GHz/ノード(Hadoop Master) –– デュアルIntel 6コアXeon®プロセッ サー@2.0GHz/ノード(Hadoop Data) –– 40GB/秒のInfiniBand相互接続上に 高スループットBYNET™ V5 • ディスク容量 – 非圧縮時(標準では3 倍圧縮) –– Hadoop用データ・ノード(3TBドライ ブ): ユーザー領域9.5TB –– Hadoopフル・キャビネット(2 Master/16 Data) : ユーザー領域 152TB • 拡張キャビネットとさらに大型のネット ワーク・スイッチの使用によりペタバイ トまで拡張可能 • Hadoop用に開発/最適化された Teradataソフトウェア –– Teradata Server Managementおよ びTeradata Viewpointを含む、シス テム管理インフラストラクチャ • サード・パーティ・ソフトウェア –– Informatica PowerCenter Big Data Editionは、データ統合をHadoop用 に最適化および加工します。 –– Protegrity Big Data Protectorは、 ファイルからアプリケーションまで 包括的なHadoopデータ保護を行い ます。 –– Revelytix Loomは、Hadoop用の動 的データ・セット管理、メタデータ、 およびデータ系統を提供します。 –– Teradata SQL-H™、スマート・ローダ ーを備えたTeradata Studio™、およ びHadoopディストリビューション用 コネクターを含む、Teradataデータ ウェアハウスへの高速データ・コネ クター 仕様一覧 キャビネット仕様 • 高さ: 204.5 cm • 幅: 61 cm • 奥行き: 124.4 cm –– 119.4 cm (前面および背面のドア を除く) • 重量: 1,011 kg (最大構成時、輸送用 枠箱を含む) • 電流: –– 30A、3-p、4-wire、4-cord • 柔軟な対応時間 –– 60A、3-p、4-wire、2-cord • Teradata Vital Infrastructureの堅牢 な診断機能 国際電圧範囲: 220~240/381~415、3~ +N +PE (三相) • 電流: –– 32A/30A、3-p、5-wire、2-cord、全 地域(EU形式電源の北米を含む) • 設置重量: 830 kg (最大構成時、枠箱 を除く) • 周波数: 50Hz~60Hz 動作仕様 • デュアルAC: 標準 • 動作温度: 許容範囲: 15°C~32°C –– 推奨: 18°C~27°C • 相対湿度: 許容範囲: 20%~80% (結 露しないこと)、推奨: 最低湿度: 5.5C DP (41.9F)、最高湿度: 60% RHかつ 15C DP 電気仕様 北米電圧範囲: 200~240V、3~+PE • 迅速な応答時間 • 最大電力: 12.25kW • 安全性と排出に関する米国および国 際規格に準拠 サポート・サービス メンテナンスとサポート • 統合的なハードウェアおよびソフトウ ェアのメンテナンスとサポート • 安全なリモート接続 〒107-0052 東京都港区赤坂2-23-1 アークヒルズ フロントタワー • Unified Data Architecture、SQL-H、Teradata Studio、およびTeradataはTeradata Corporationの登録商標です。本文中の社名、製品名は各社 の商標または登録商標です。 • 本資料に掲載されている情報は予告なしに変更されることがあります。 • 本資料で記述した全ての機能、実行内容が全世界で販売されているとは限りません。最新情報についてはTeradata担当者にお尋ねください。 Copyright © 2014 by Teradata Corporation • Teradata @ Your Serviceを介してソ フトウェア・アップデートへのアクセ スが容易 • 予防検知的システム監視 • 実装サービス • システム設置 • ソフトウェア実装
© Copyright 2024 Paperzz