CDH - Cloudera

DATASHEET
Cloudera’s Distribution
Including Apache Hadoop (CDH)
商用/非商用を問わず、
全 Hadoop ディストリビューションにおけるナンバーワン
Cloudera のウェブサイトからフリーダウンロードで入手できる CDH は、ビジネス課
題解決に Apache Hadoop を使いたい時の最短・最適な手段です。特定のベンダ技術
に依存せずに、安定した Hadoop ソリューションをテストしたい企業にとって、CDH
は理想的な選択肢といえます。また、Hadoop ユーザと、Apache のオープンソース
コミュニティで常に行われている最新技術とをつなぐ架け橋でもあります。
仕様書も完全ドキュメント化、すぐに利用可能:CDH は 100 %オープンソースの
Apache Hadoop と、Hadoop を使う際に必要となるオープンソースのソフトウェアコ
ンポーネントで構成されており、ニーズに応じて利用するコンポーネントを取捨選択で
きます。CDH は、OS、ハードウェア、RDBMS / DWH、そしてビジネスインテリジェ
ンスや ETL システムに至るまで幅広いレンジの環境における稼働について、徹底的に
検証されています。このため、ユーザはこれまで既存システムの投資を無駄にすること
なく、すでにあるツールやリソースを活用して、Hadoop のメリットを最大化できます。
容易さ、そして確実さ
大量かつ複雑なデータの爆発的な成長により、あらゆる企業が、ビッグデータの格納・
処理・分析のために、Apache Hadoop プラットフォームを導入しています。Hadoop
にはたくさんのメリットがありますが、特にその柔軟性と経済的な効果が、大きく評価
されています。しかし Hadoop も、ほかのオープンソーステクノロジーのように、実
稼働環境に実装することが大きな挑戦であり、次のような疑問があるでしょう。「シス
テムの安定性をどう保証するのか?」「オープンソースプラットフォームの中で必要な
コンポーネントをきちんと選べるのか、またそのコンポーネントを正しく統合できるか
どうか、確信はあったのか?」「その技術についてのドキュメントはどれくらい優れて
いるのか?」「サポートはどうするのか?」こうした質問によってもたらされる不確実
性を知ると、中にはプロプライエタリな特定ベンダのソリューションに投資する企業も
出てくるかもしれません。しかし、特定ベンダに依存した技術・製品は非常に高額であ
り、リスクもあります。
Cloudera は、CDH を次の目的に向けて開発しました。――「Hadoop 導入を取りや
めた企業が抱いている、オープンソースに対する不審、不確実性や障壁を取り除くた
め」に。
CDH は Apache Hadoop のエンター
プライズ向けディストリビューション
Hadoop を成功に導くストリームライン
• 実環境内の利用に必要なすべてのコンポーネン
トを内包
• 動作検証およびドキュメント化済み
• ほかのシステムとのインテグレーション検証済み
―― OS、ハードウェア、データ分析ツールなど、
幅広い分野でインテグレーションを検証
特定ベンダに依存しない安定性、
信頼性の高い Hadoop
• 企業のシステム環境向けに堅牢化した 100 %
Pure Apache Hadoop
• Cloudera の専門エンジニアによる徹底的な動
作検証
• 企業における何十何千ノードのにおける稼働実証
コミュニティ主導
• オープンソースコンポーネントのみを統合――
プロプライエタリなコードや技術は不使用
• コミュニティ発の先進技術との密接な連携
• 完全なフリーオープンソース
“ Cloudera
のディストリビューションと
サポートは、「テクノロジーリーダー
になる」というGrouponのゴール達成
に導いてくれる手段である
”
DATASHEET
CDH がもたらすもの
Apache Hadoop を実稼働環境で利用する
際に必要な全コンポーネントから成る
フルパッケージ
企業内での実環境向けに堅牢化した
100% Pure Apache Hadoop
Cloudera の動作保証プログラム
CDH および Coudera は、オープンソース
ツールなど幅広いレンジの製品群の中で動
作検証されています。これにより、リスク
を低減し、導入を容易にするほか、既存の
データ分析システムや BI ソリューションへ
の投資を無駄にならないというメリットが
あります。
に対し積極的にコミットメントし続けてい
ます。CDH は、中核となるファイルシス
テムから UI フレームワークに至るまで、プ
ロプライエタリな技術やコードは一切含ま
ない、フリーダウンロードのディストリ
ビューションです。このディストリビュー
ションは、Cloudera により、企業のシス
テム環境において何十何百ものノードをま
たいで負荷を変えながら QA テストを繰り
返し、動作を保証しています。CDH は強
固で信頼性の高いApache Hadoopであり、
特定のベンダに依存していない、商用・非
商用の Hadoop ディストリビューションの
中でナンバーワンのパッケージです。
CDH は、Hadoop 導入を成功に導くため
に必要なものすべてが含まれており、必要
に応じてコンポーネントを展開できます。
統合した際の動作確認は済んでおり、ソ
リューションは完全ドキュメント化されて
います。Hadoop のデプロイメントにおけ
る行き当たりばったりのやり方から抜け出
し、Hadoop でビジネス課題を解決する道
筋を指南します。
CDH は、ハードウェア、OS、データ分析
CDH コンポーネント
UI Framework
SDK
HUE
Apache Hadoop - 信頼性が高く、スケーラブルなストレージコンピュー
ティングのディストリビューション
HUE SDK
Apache Hive - SQLライクな言語、メタリポジトリ
Workflow
OOZIE
Scheduling
Metadata
OOZIE
HIVE
Apache HBase - ランダムかつリアルタイムなデータ書き込み/読み取り
が可能なHadoopデータベース
Languages / Compilers
PIG, HIVE
Data
Integration
Fast
Read/Write
Access
FLUME, SQOOP
HBASE
Coordination
Apache Pig - データ分析プログラムを記述するためのハイレベルな言語
Apache Zookeeper - 非常に信頼性が高いディストリビュートサービス群
Apache Whirr - クラウド環境でHadoopを動かすためのライブラリ
Apache Flume - ログ/イベントデータを収集するディストリビュートサ
ービス
Apache Sqoop - HadoopとRDBMSを統合するサービス
ZOOKEEPER
Hue - ブラウザベースのHadoop用デスクトップインターフェイス
Oozie - サーバベースのHadoopアクティビティ用ワークフローエンジン
CDHv3Distribution 詳細
コンポーネントのバージョン
サポートするOS
Apache Hadoop
v0.20.2 + 923
Red Hat
RHEL 5, RHEL 6
Apache Hive
v0.7.0 +27
CentOS
CentOS 5
Apache Pig
v0.8.0 +20
Ubuntu
Lucid, Maverick
Apache HBase
v0.90.1 +15
SUSE
SUSE 11
Apache Zookeeper
v3.3.2 +12
サポートするビルドインフラおよびクラウドプラットフォーム
Apache Whirr
v0.3.0 +5
Build Infrastructure
Apache Maven
Apache Flume
v0.9.3 +15
Cloud Platforms
Rackspace, Amazon EC2, Softlayer
Apache Sqoop
v1.2 + 24
Hue
v1.2.0 +54
Oozie
v2.3.0 +31
Cloudera, Inc. 210 Portage Avenue, Palo Alto, CA 94306 USA | 1-888-789-1488 or 1-650-362-0488 | cloudera.com
©2011 Cloudera, Inc. All rights reserved. Cloudera and the Cloudera logo are trademarks or registered trademarks of Cloudera Inc. in the USA and other countries. All other trademarks are the property of
their respective companies. Information is subject to change without notice.