原稿 0.5MB

連載
働くUNIX
4
竹内 渉
新計算機環境のセットアップ
はじめに
したものです。
新たな物品の購入
前回は、現在構築中の衛星データ処理のための新たな計
算機環境について、導入のきっかけから始動に至るまでの
前号で書いたように、NFS 経由で RAID を接続して
経緯を説明しました。本誌の発行部数がどのくらいかは分
も速度に限界があるため、新たに FC (Fibre Channel)
かりませんが、すくなくとも私の周辺にはかなりの読者が
スイッチを購入することにしました。購入時の条件として
いるようです。2005 年 10 月号に 1 回目の記事が掲載さ
は、次のようなものがあります。
れてからたった 1 カ月のあいだに、5 人の方から「原稿を
読んだよ」という連絡をもらいました。計算機の世界に対
する浅学さを露呈しているような文章でしたが、それなり
に楽しめたという意見もいただき、ちょっとほっとしてい
ます。
その 10 月号の原稿を書いている 8 月初めには、米国の
ボルダーに出張していました。2 回目の原稿を書いている
9 月初めには、農業工学関連の学会に参加するために金沢
にいました。そして、前回(3 回目)の原稿を書いている
10 月初めには、NASA の地球観測計画 (EOS) のデータ
受信局会議に出席するため、イタリアにいました。まとま
• Xserve G5 および Xserve RAID への対応が確認され
ている。
• 2006 年度に Xserve RAID をもう 1 台、追加導入する
予定があるため、そのぶんのポートも含めて最低 16 ポ
ートまで拡張できる。
• システム全体の再設計、セットアップ、保守をおこない、
動作の確認まで責任をもっておこなうベンダーから購入
する。
• Mac OS X を 10.4 にアップグレードし、Xsan を新た
に導入する。
った時間がなかなかとれないため、出張先のホテルや飛行
スイッチにかぎったことではありませんが、こちらとし
機での移動中、あるいは電車の乗換え時間を使ってなんと
ては、費用対効果がもっとも高いベンダーに納入してほし
か書き上げたというのが実情です。
いと考えています。今回も、最初にマシンを購入したとき
この原稿を書いているのは 11 月初めですが、これまで
と同じく競争入札が必要だったため、複数のベンダーに見
と同様、ACRS2005(Asian Conference on Remote
積りをお願いしました。上記の条件のうち、最後の項目に
Sensing:アジア・リモートセンシング会議)という学会
挙げたソフトウェアについては、ハードウェアと ``抱合せ´´
に出席するためにベトナムのハノイに来ています。この会
でしか販売しないというベンダーもありました。
議では、森林火災が起こっている状況を衛星データを用い
納入品目は ``FC スイッチ一式´´となっているので、書類
て宇宙から準実時間で情報発信するという内容の発表をお
上はソフトウェアも同じ経費の枠内で購入しなくてはなり
こないます。今回お話しする Xserve グリッド計算機シス
ません。しかし、私たちの研究所は大学に所属する研究機
テムは、まさにこのプロジェクトでの利用を主たる目的と
関なので、ソフトウェアは別途アカデミック版を購入した
106
!
#
責了 [rsense0601.ps]
"
$
UNIX MAGAZINE 2006.1
連載/働くUNIX
ほうが安価になります。このあたりは、事務局と折衝する
ことになりました。さらに、セットアップにかかる費用は、
4
直接の原因は 2 つあり、両方とも浸水を惹き起こしてい
ました。
物品購入費である備品費とは別予算の用務費として計上し
1 つ目は、直径 3m 弱のパラボラアンテナの中心部に備
なくてはなりません。これには、備品費の総額の 3 割を超
え付けられているデータの受信部 (LNA) が破損していた
えてはいけないという制約があります。ベンダー側からみ
ことです。犯人はカラスらしく、LNA が備え付けられてい
れば、ひどく納入しづらい条件だったと思います。
る筒の先端を覆う厚さ 5mm 程度のプラスチック板をつつ
紆余曲折はあったものの、アーチシステムズ1 にお願いす
いて破ったため、そこから浸水したようでした。バンコク
ることに決定しました。最終的な金額はお教えできません
のアジア工科大学院 (AIT) で運用中のまったく同じシス
が、他社の見積りは落札価格の 1.2∼1.5 倍でしたから、相
テムでも、違う種類の鳥の被害に遭ったという話を担当者
当に勉強してもらったことになるでしょう。
から聞いていましたが、こうなると笑うに笑えません。駒
場リサーチ・キャンパスの近くにある駒場公園をねぐらに
セットアップまでの幸運な出来事
しているカラスがたくさん飛来することは知っていました
が、まさかアンテナにまでいたずらするとは思いもよりま
ベンダーが決定したのは 9 月末ですが、FC スイッチの
せんでした(Dundee 大学の研究者たちも、これにはびっ
納入には約 3 週間かかるということでした。そこで、セッ
くりしていました)
。けっきょく、LNA は Dundee 大学
トアップ作業は、納入直後の 10 月末から 11 月初めにかけ
に送り、先方で製造元の米国のメーカーから部品を調達し
ておこなってもらうことにしました。その時期、私自身は
たうえで組み立てなおし、日本に送り返してもらいました。
あちこちに出張していたため、10 月中は合計 3 週間ほど不
わざわざこんなことをしたのは、次のような事情があっ
在でした。それがかえってさいわいしたのか、双方にとっ
たからです。LNA は特殊な部品なので、当初予定してい
てストレスなく時間を過ごせたように思います。
た国内での調達は代理店経由でおこなう必要がありました。
今回の新しいシステムを構築するまでのあいだに、衛星
「部
国内に 1 社しかない代理店に修理を依頼したところ、
データ処理関連のシステムについて、2 つの大きな進展が
品自体の修理は可能だが、アンテナ全般についての動作確
ありました。
認は保証できない」とか、
「修理できるかどうかを判断する
アンテナの修理
ために出張の必要があり、それだけで 1 回 10 万円かかる」
といった回答で、お話になりません。代理店の商社に技術
1 つは、2004 年 10 月以来、1 年近くも不調だった衛星デ
ータ受信アンテナの修理のメドがついたことです。どこか
の会社が納入したものなら修理を依頼することもできます
が、このアンテナの場合は経緯が少々複雑でした。アンテ
ナ全般の設計をおこなったのはスコットランドの Dundee
大学の研究者たちであり、距離的な問題もあって日本に頻
繁に来ることはできません。そこでまず、破損の状況をこ
ちらで調べなければなりませんでした。なんといっても私
のバックグラウンドは社会基盤工学ですから、電源系統の
回路やアンテナを制御するモーターなど、ハードウェアに
関する知識は皆無といってよく、これは大仕事でした。そ
れでも、Dundee 大学の研究者たちの知人であるマレーシ
アから来た技術者や、インド人の研究員と一緒に悪戦苦闘
しつつもなんとか原因を突き止めました。
1 http://www.archsystem.com/
UNIX MAGAZINE 2006.1
!
#
責了 [rsense0601.ps]
"
$
者がいるわけではないので、部品の販売はできても、アン
テナ全般に関する問題解決型の提案は出てこないというこ
となのでしょう。これでは、私たちの要求を満たすことは
できません。結果として、その代理店の見積り価格の約半
分の値段で完全に解決しました。このような問題の場合は
``解決した´´という点が重要で、 ``やってみましたが直りま
せんでした´´では、会計上、事務局にも話がとおりません。
もう 1 つは、アンテナを制御するワイーヤードのコント
ローラとアンテナとの接続部が水に浸かっていたことです。
通常、アンテナの制御は UNIX マシンからリモートでおこ
ないますが、保守用のコントローラがアンテナに直結され
ています。これが格納されている箱の内部に水が入り、シ
ョートしてしまったようです。
マレーシアから来てくれた技術者はたいへん優秀で、わ
ずか 5 日の滞在期間中に上記の 2 つの問題を完全に解決
107
表 1 新たに購入した物品の一覧
写真 1 新計算機システム
Q-Logic SANbox 5200(16 ポート、型番:SB5200-16A)
Q-Logic SANBox 5200 保守アップググレード(3 年間センドバック保守)
SFP (Q-Logic SFP2-SW-03)
OpenDirectory セットアップ
FC スイッチ設定作業
Macintosh サーバーサポート年間基本料金
Xsan 設定
Apple Fibre Channel PCI-X カード
Gigabit Ethernet スイッチ(電源内蔵型、GS2108 (NETGEAR))
Gigabit Ethernet ケーブル
Mac OS X Server 10.4
Xsan 1.2
し、しかも浸水に対する改善も提案してくれました。
1台
1件
8 個セット
1式
1件
1年
6件
4枚
1台
6本
5本
6本
図 1 新計算機システムのイメージ
ソフトウェアのアップデート
Xserve-RAID1
もう 1 つの進展は、データ処理ソフトウェアを大幅にア
ップデートし、データの品質が大きく改善されたことです。
Xserve-RAID2
ユーザー
Fibre
Channel
コマンド
Fibre
Channel
アンテナで受信した生データは、アナログの信号をデジ
タルに変換して 1 次処理をおこなって画像化します。生デ
Xserve-node1
Xserve-Head
Xserve-node5
Xserve-node2
Xserve-node3
Xserve-node4
ータの画像化までの段階では、NASA が提供するソフトウ
ェアが世界的にひろく使われており、地上受信局をもつ機
関はこれに大きく頼っています。もともと、このソフトウ
ェアには、品質は相対的に低いが処理時間やインストール
の手間がかからないものと、品質は相対的に高いが処理時
間やインストールの手間がかかるものの 2 種類がありまし
たが、相互の長所を補い合うかたちで開発が一元化されま
した。しかも、従来の Solaris、HP-UX、IRIX、Linux
に加えて Mac OS X での動作も保証されています。基本
部分は C と Fortran で書かれており、C シェルで複数の
モジュールをつなぐ設計になっています。おかげで、これ
までに蓄積してきたソフトウェア資源をそのまま活かすこ
とができ、移行もたいへんスムースにおこなえました。
セットアップ
出張から戻った 10 月終りに、発注していた物品が納入
されました。最終的に納入されたものを表 1 に示します。
この表からも分かるように、セットアップ作業はすべて
ベンダーにおこなってもらうことにしました。こちらの要
求を満たすシステムの再構築案が提案され、さらに、動作
の確認まで責任をもつという確約がとれたからです。
今回、構築した計算機システム(写真 1 )は図 1 に示した
108
!
#
責了 [rsense0601.ps]
"
$
ような構成になっています。従来のシステムとの違いは、
次のような点です。
• Mac OS X Server を 10.3 から 10.4 にバージョンア
ップした。
• すべてのマシンを Gigabit Ethernet で接続したため、
通信が格段に高速になった。
• Xsan を用いて、すべてのマシンから Xserve RAID へ
のアクセスが可能になった。
• Head(ヘッドノード)と node1 を Xsan の管理用マシ
ンとしたため、計算用マシンは実質的に node2∼node5
の 4 台となった。
• シングル・サインオンを導入した(ユーザーは、Head に
ログインすれば、ほかのノードにパスワード認証なしで
アクセスできる)
。
物品納入の 1 週間後の 11 月初旬に、アーチシステムズ
の技術者に出向いてもらい、セットアップをおこなっても
らいました。折悪しく、その前の週に衛星データを処理し
UNIX MAGAZINE 2006.1
連載/働くUNIX
4
ているほかのマシンが外部から不正侵入され、システムを
始しました。ユーザーのホーム・ディレクトリは、すべて 1
破壊されるという悲惨な状況にありました。私は、そのマ
つのパーティションの下に保存されるようにしたので、全
シンの復旧に忙殺されていたこともあり、あまり手伝えな
体の容量に注意するだけでよく、管理作業はたいへん楽に
かったのですが、2 日間ですべての設定が完了しました。
なりました。
その際、問題になったことが 2 つありました。
1 つは RAID のフォーマットです。システムを全面的
これまで、Linux マシンでおこなっていたサービスのう
ち、新システムに移行したものをいくつか紹介します。
に組みなおすため、今後の運用の安定性確保という観点か
主としておこなっているのは、森林火災の情報を提供す
らもフォーマットは欠かせません。当然ですが、その場合
るサービスです。アジア地域において多発している森林火
には保存されているデータをいったん退避させる必要があ
災は、植生の回復過程における土壌栄養の補給源として機
ります。これにすこし手こずってしまいました。
能するなど、生態系のなかでは基本的かつ自然な外乱要因
従来のシステムでも計算をおこなっていたので、約 8TB
の 1 つです。同時に、人間の活動によって起こる火災も急
のディスク容量の 90%以上が占有されていました。テー
増しており、自然火災をしのぐ勢いだと報告されています。
プアーカイバに格納されている衛星データについては、ダ
森林の状態や動態の把握は、地球の炭素循環や気候システ
ウンロードするだけなのでとくに難しい点はありません。
ムへの知見を深めるうえでもきわめて重要です。アジア地
計算中に生じる中間データがディスクの 50%程度を占有
域の森林の面積は広大なので、効率性、安全性、即時性の観
していましたが、ほかのマシンで使用している RAID に
点から衛星リモート・センシングを用いた監視が有効です。
も保存する領域がなく、涙をのんで削除しました。再計算
新システムでは、Aqua/Terra に載っているセンサー
すれば取り戻せますし、新計算機システムなら計算に要す
MODIS のデータを用いて森林火災を検知し、アジア全域
る時間も短縮されます。もっとも重要なのはソースコード
における火災情報を準実時間でネットワークを介して提供
です。万一、これがなくなると、それまでの努力も水の泡
します。
なので、細心の注意を払って作業をおこないました。さい
衛星から火災を検知する場合、基本的には地表面の温度
わい、ほとんどすべてのソフトウェアはパッケージ化して
が周囲よりも高くなっているところをみつけます。メタデ
あったため、tar でまとめたうえで、RAID システムやふ
ータの例として、2005 年 9 月 5 日の検知結果を表 2 に示し
だん使っている PowerBook、外部ディスクなどに分散し
ます。それぞれ、火災が起こっている 1km 四方のある地
て保存しました。
点の情報を表しており、LAT が緯度、LON が経度、R2 が
もう 1 つの問題は電源容量です。計算機を置いた部屋
近赤外域の反射率、T22 が中間赤外域の温度、T31 が熱赤
は大容量の電源供給が可能なように設計されていましたが、
外域の温度、CONF が ``確からしさ´´を表しています。火
床下に備え付けてある元電源の配置を考慮せずに計算機を
災検知に用いているアルゴリズムの説明は省略しますが2 、
設置してしまったのです。その結果、電源プラグの数が足
その性能は、火災規模、火災温度、衛星観測角、生態系の
りず、UPS も不足する事態に陥りました。この問題につい
種類、観測日時、火災煙の種類などに大きく左右されるた
ても、アーチシステムズの技術者の方に解決案を出しても
め、完全とはいいきれません。
らい、床下の電源配置を勘案して配線をやりなおし、UPS
とはいえ、 ``この位置でこういった種類の火災が起きて
も 3,000W のものを 3 台用意して接続しました。ある程
いる´´という情報を提供すれば、数時間から数日レベルで
度以上のシステムを作る場合、電源の確保はきわめて基本
の火災の延焼状況を予測したり、あるいは数カ月から数年
的かつ重要なことですが、これまで PC 感覚で計算機を利
レベルでの火災が起こった森林の回復度合いを調べたりと
用してきた私にとっては ``灯台下暗し´´という感じでした。
いった研究に役立てることができます。これらの研究は、
新システムでの仕事
2 興味のある方は、「Aqua/Terra MODIS データを利用したアジア森林
火災の準実時間観測」(http://yasulab.iis.u-tokyo.ac.jp/˜wataru
/publication/pdf/rssj2005 autumn paper.pdf) などをご覧
セットアップの終了後、ただちに新システムの使用を開
UNIX MAGAZINE 2006.1
!
#
責了 [rsense0601.ps]
"
$
ください。
109
表 2 メタデータの例(2005 年 9 月 5 日の検知結果)
LAT (deg.)
31.979397
31.939053
31.936943
31.835857
31.476776
29.819904
......
LON (deg.)
117.255943
117.259239
117.271469
117.318924
118.412544
112.897804
R2 (%)
0.265969
0.270117
0.271943
0.251624
0.270130
0.246956
T22 (K)
320.278168
322.583588
328.083862
321.923523
313.733917
315.107361
T31(K)
295.943878
293.936523
296.270966
294.569916
294.438507
293.052795
CONF (%)
57
73
90
27
55
26
図 2 火災データ配布の Web ページ
図 3 2005 年 9 月 1 日∼10 日に発生した火災の分布
UNIX を中心として構築されてきたデータ観測網を基盤と
し、それにいわば ``火災を検知するモジュール´´のようなも
場でどういうふうに UNIX を活用しているかを紹介して
のを加えることで実現されています。
分野の紹介から始め、大学の研究機関における研究室レベ
衛星リモート・センシングを用いて検知されたアジアに
きました。衛星リモート・センシングという聞き慣れない
ルの予算で計算機を購入するまでの経緯、計算機を購入し
おける森林火災の情報は、すべて Web ページおよび FTP
てから運用開始までの出来事、運用に際しての問題点など、
サーバーを通じて無償で公開されています。図 2 は火災デ
具体例を交えてお伝えしました。これらが、すこしでも皆
3
ータ配布の Web ページ で、クイックルックと火災の分布
さんのお役に立てばさいわいです。
図が 1 日単位で表示されています。図 3 は、このページか
最後になりましたが、ここまでお読みいただいた読者の
ら取得したデータをまとめ、2005 年 9 月 1 日∼10 日に
方々、本誌に原稿を書く機会を与えてくださった東京大学
発生した火災を分布図にしたものです。図の右上部の中国
情報基盤センターの安東孝二氏に感謝いたします。ありが
東北部から極東ロシア、下部のカリマンタン島などで大規
とうございました。皆さん、いつの日かまた会うときまで、
模な火災が発生している様子が分かります。
輝きを失わずにがんばりましょう。
(たけうち・わたる 東京大学生産技術研究所)
おわりに
4 回にわたり、計算機の専門家ではない私が学術研究の
3 http://webmodis.iis.u-tokyo.ac.jp/FIRE/
110
!
#
責了 [rsense0601.ps]
"
$
UNIX MAGAZINE 2006.1
されてしまう。もう 1 つは、制限をなくすと、サーバーに
負荷がかかりすぎるからだ。
1 番目の理由は営利企業に特有のことであり、Wikipedia のように、非営利団体によって運営されていて、かつ
ライセンス上、データの複製が許諾されているサービスに
はあてはまらない。2 番目の技術的な理由については、既
存の技術を組み合わせれば比較的簡単に解決できる。たと
えば、Wikipedia のデータを P2P 的な方法でミラーリン
グしておき、頻繁にデータを呼び出す場合にはミラーをア
クセスするようにすればよい。検索エンジン・アグリゲー
Webサービスの利用制限
本誌の読者なら、仕事で開発中のアプリケーションや研
タ Answers.com5 の例でいえば、Wikipedia のデータを
ミラーし(P2P は用いていない)
、自社サービスからはそ
れを利用しているので、Wikipedia 本体には負荷をかけな
究、あるいは週末ハックのために、Google API や Ama-
い仕組みになっている。つまり、1 番目の問題と根っこは
zon Web Services API、Technorati API、Yahoo!
同じで、けっきょくは ``データのオープン性´´が重要という
Webservice API など、いろいろな会社が提供している
ことになる。Wikipedia ではデータを複製してもかまわ
Web サービスを利用することも多いのではないだろうか。
ないので、データをミラーして負荷を下げる方法で技術的
最近、私が買った本のなかでは Software Design 編集部
な制限が取り払えるのである。
のもの1 がよくまとまっていたが、このほかにも Web サー
ビスに関する解説書がたくさん出版されている。
企業が提供するこれらの Web サービスに共通している
オープンデータ運動
膨大なデータを保有する営利企業が、データを囲い込ん
のは、API の利用回数(頻度)に制限があるということだ。
で小出しにすればするほど、本来は可能なはずの革新的な
たとえば、Google API は 1 日に 1,000 回という制限2 が
サービスの登場が遅れてしまう。データをオープンにしな
ある。実際に試した人によると、1 日に数十万回アクセスし
いために競争が阻害され、革新が遅れる。この考え方は、ど
たら ``403 Forbidden´´となって、Google にアクセスでき
こかで見聞きしたことがあるはずだ。そう、オープンソー
なくなるそうだ。Amazon Web Services では、ある回
ス運動である。
数以上アクセスしたときは従量制の料金もしくは月額の固
現在、 ``ソース´´を ``データ´´に置き換えた ``オープンデ
定料金を払うことになっている(FAQ3 によれば、1 クエ
ータ´´という運動が起こりつつある。Six Apart の共同創
リーあたり 0.1 セントとなっている)
。Yahoo! でも、API
立者である Ben Trott 氏は、自身の Blog ページ6 でオー
4
の利用規約の第 11 条 に、利用回数や利用形態に任意の制
プンソースよりもオープンデータのほうが重要だと述べて
限をかけると明記されている。
いる。次のように、彼の主張は分かりやすい。
このような制限を設ける理由は、大きく分けて 2 つある。
1 つは、それが収益源になるからである。回数制限がな
いと、すべてのデータが取り出されてビジネスにただ乗り
「大事なデータをエクスポートできないソフトウェアは、信
頼して使えない」
これは、まさに Google や Amazon のことではないだ
1 Software Design 編集部『最新 Web サービス API エクスプローラ』
、
技術評論社、2005 年
2 http://www.google.com/apis/
3 http://www.amazon.com/gp/browse.html/ref=sc fe l 1
3435361/002-8263882-5520801?%5Fencoding=UTF8&no
de=3434651&no=3435361&me=A36L942TSJ2AJA
4 http://docs.yahoo.com/info/terms/
UNIX MAGAZINE 2006.1
!
#
責了 [smooth0601.ps]
"
$
ろうか。
Dave Winer 氏は、データのオープン性について、た
5 http://www.answers.com/
6 http://btrott.typepad.com/typepad/2005/08/open data
.html
111