コンピュータアーキテクチャ・コンパイラ・システムソフトウェア作業部会

コンピュータアーキテクチャ・
コンピ
タア キテクチャ コ
ンパイラ・システムソフトウェア
イラ シ テ ソ ウ ア
作業部会
主催: 文部科学省
2011/07/26
アジェンダ
• 文科省ご挨拶
• 戦略的高性能計算システム開発(SDHPC)に関するワー
クショップと作業部会の関係
• アプリ側に対するシステムイメージの提示項目
• 今後のスケジュール
• スパコン運用に資した従来研究開発体制紹介(パネル
討論形式)
– 全てを紹介できるわけではないが、まずは幾つかを紹介し、今
後の体制案作りの参考にする
2011/07/26
15
SDHPCと作業部会の関係
• 企業からのコミットメントはどの程度ありうるのか?
• 戦略的高性能計算システム開発に関するワークショップ
– 若手中心によるロードマップ作成
– 参加&議論はオープン
参加&議論はオ プン
• 作業部会
– ワークショップで取りまとめた内容に対する助言を通して
ワークショップで取りまとめた内容に対する助言を通して、HPCI計画推進委
HPCI計画推進委
員会報告資料を取りまとめる
– 開発体制は作業部会が作成し、SDHPCでも議論
– 参加&議論はオープン
• 報告書は状況によっては、ワークショップ報告書、作業部会報告
書と2本建 になるか
書と2本建てになるか?
2011/07/26
16
コメントのまとめ
• ワークショップと作業部会の関係
– ワークショップは、若手研究者主導のFeasibility Study、ロード
マップ、開発戦略策定
– 作業部会は、ワークショップから出てくるロードマップ&開発戦
略をもとに、大所高所から助言し、プロジェクトとしてまとめる
– 体制案作成はアプリケーション作業部会とも連携し、別途議論
体制案作成
プ
作業部会とも連携
途議論
していくべき
• サイ
サイエンスドリブンで進める体制を敷くべき
ンスドリブンで進める体制を敷くべき
• エクサに向けたハードウェア開発において2014~15年
頃のプロトタイプマシン開発があるのでは
– 2014~15年
• エクサという名前に捕らわれる必要性があるのか
2011/07/26
17
今後のスケジュール
• 8月26日(金) 午後@東大
– 取りまとめ役と調整議論
• 9月29日(木)
月
( ) 午後@東大
後 東
– 取りまとめ役と調整議論
• 10月15日(土)@秋葉原
– 研究課題&ロードマップ案議論
• 12月8日(木)@秋葉原
– 意見交換@PCクラスタシンポジウム
• 12月末
– White Paper発刊
2011/07/26
18
スパコン運用に資した従来研究開発体制紹介
• 筑波大におけるPACS-CS体制
– 朴泰祐
泰祐
• 東工大におけるTSUBAME
– 松岡聡
• T2K体制
– 石川裕
• RWCPにおけるSCore開発体制
– 石川裕
• 米国での公募&開発体制
– 佐藤三久
佐藤 久
• ヨーロッパでの公募&開発体制
– 松岡聡
2011/07/26
19
T2Kオープンスパコン体制
経緯
–
–
–
–
–
–
–
–
‘06/05:
‘06/09:
‘06/10:
‘07/03:
‘07/10:
‘07/11:
07/11:
‘07/12:
‘08/06:
T2K 最初の打合せ
記者会見&公開シンポジウム
資料招請&調達手続開
仕様書案公表
最終仕様書&入札手続開始
応札締切
開札
納入&運用開始
3つのオ プン性に基づく基本仕様策定
3つのオープン性に基づく基本仕様策定
アーキテクチャ
– コモディティ部品ベース
• 技術市場から入手可能な最先端・高性能デ
技術
能な
端 高性能デ
バイスによる構成 e.g. x86, IB/Myri-10G
• ソフトウェア
– オープンソースの標準OS/ミドルウェア
オ プンソ スの標準OS/ミドルウ ア
• e.g. Linux, MPI, Globus
• ユーザ
– 計算科学分野の伝統的な数値計算 ユーザだ
ザだ
けでなく.PC クラスタを使っている非数値計算
ユーザも考慮
•
2011/07/26
総理論演算性能
(TFlops)
ノード数
ノ
ド数
総主記憶容量(GByte)
単体理論演算性能
(GFlops)
主記憶容量 (GByte)
ファイルシステム
(TByte)
東京大学
140.1344
筑波大学 京都大学
95.3856 61.2352
952
32000
147.2
648
20736
147.2
416
13312
147.2
32
1500
32
960
32
883
‘08/06
08/06 31st TOP500
16位 東大(国内1位)
20位 筑波大
24位 東工大
34位
位 京大
‡ 何をしたか?
•
マルチコア&MPI通信機能の
Feasibility Studyに基づく仕様策定
‡ 何をしなかったか?
•
•
開発そのもの
企業との共同研究
20
RWCP (新情報処理開発機構)
•
•
1992年~2001年に行なわれた通産省
(現経産省)プロジェクト
– 実世界の情報を処理する革新的な情
報処理技術体系の開発
企業が出資して技術研究組合を組織し
企業が出資して技術研究組合を組織し、
集中研(つくば)と分散研(企業に設置)で
研究開発
– 柔らかな情報処理
• 理論・新機能、超並列システム、光シ
ステム、基礎研究
– 次世代情報処理基盤技術
• 実世界知能技術、並列分散技術、光
技術
•
2011/07/26
•
•
何をしたか?
– 発足時企業からは若手(30歳前半)が
集まり、アクティブな研究ができた
– 研究者が開発したシステムソフトウェ
アは使えるソフトウェアとして普及
• 通信ライブラリ、グローバルスケ
ジューラ(MPC++MTTLで記述)、
チ ックポイント リスタ ト
チェックポイント・リスタート
• OpenMPコンパイラ
何が出来なかったか?
– 開発に関して企業の協力得られず
集中研で開発したSCore (エスコア)&
Omni OpenMPは、プロジェクト終了後も
残る。理研情報基盤センターや筑波大計
算科学センタ の大規模クラスタで使わ
算科学センターの大規模クラスタで使わ
れる。現在、三菱プレシジョンの手術シ
ミュレータ製品で使われている
21