Xeon Phi
Xeon Phi
Xeon Phi
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
多 様 化 するHPCプラットフォームの<br />
選 択 ガイドライン<br />
2013 年 7 月 30 日<br />
富 士 通 株 式 会 社<br />
次 世 代 テクニカルコンピューティング 開 発 本 部<br />
第 二 システム 開 発 統 括 部 第 一 開 発 部<br />
マネージャー 長 塚 雅 明<br />
Copyright 2013 FUJITSU LIMITED
話 の 流 れ<br />
• 多 様 化 するHPCプラットフォーム<br />
• 専 用 スパコン<br />
• PCクラスタ<br />
• コプロセッサの 活 用 例 と 比 較<br />
•GROMACS<br />
•Himeno<br />
• コプロセッサ 活 用 のポイント<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 1<br />
Copyright 2013 FUJITSU LIMITED
多 様 化 するHPCプラットフォーム<br />
PCクラスタに 加 え、GPGPU, <strong>Xeon</strong> <strong>Phi</strong>の 登 場 ・<br />
台 頭 により、 裾 野 がさらに 拡 大<br />
先 端 研 究 機 関<br />
スーパーコンピュータ<br />
( 専 用 スパコン)<br />
民 間 企 業<br />
GPGPU<br />
PCクラスタ<br />
(PCサーバ)<br />
<strong>Xeon</strong> <strong>Phi</strong><br />
無 断 での 引 用 、 転 載 を 禁 じます。 2<br />
Copyright 2013 FUJITSU LIMITED
専 用 スパコンの 特 長<br />
( 例 :スーパーコンピュータ「 京 」)<br />
• 10.51 Peta FLOPS • ノードMTBF 290 年 以 上 !!<br />
•88,128ノード<br />
•Linpack 29 時 間 連 続 稼 働<br />
•CPU: SPARC64 VIIIfx<br />
•ネットワーク: ICC (Tofu)<br />
高 性 能 & 高 信 頼<br />
無 断 での 引 用 、 転 載 を 禁 じます。<br />
3<br />
Copyright 2013 FUJITSU LIMITED
専 用 スパコンの 性 能 例<br />
Sustained Performance (TF) <br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
K-asis<br />
K-tune<br />
BX900-asis<br />
Helios-asis<br />
Helios-tune<br />
プラズマ 乱 流 シミュレーション<br />
0 5000 10000 15000 20000 25000 30000 35000<br />
cores <br />
[Y.Idomura et al., Int. J. HPC Appl. in press]<br />
日 本 原 子 力 研 究 開 発 機 構 井 戸 村 泰 宏 様 ご 提 供<br />
京<br />
PCクラスタ<br />
万 を 超 える<br />
並 列 計 算 で<br />
スケール<br />
無 断 での 引 用 、 転 載 を 禁 じます。 4<br />
Copyright 2013 FUJITSU LIMITED
PCクラスタ(PCサーバ)の 特 長<br />
★ 多 数 のPCサーバを 束 ねて、「スパコン」に 匹 敵<br />
する 性 能 を 確 保<br />
• PCクラスタの 特 長<br />
PCクラスタ<br />
1コストパフォーマンスに 優 れたCPU・ネットワーク<br />
CPU: Intel <strong>Xeon</strong>、ネットワーク: InfiniBand<br />
2オープン 性 が 高 く、ISVソフト・OSSが 豊 富<br />
→ 様 々な 広 い 分 野 で 活 用 しやすい<br />
→ 利 用 方 法 などのノウハウ・ 知 見 が 豊 富<br />
分 散 並 列 処 理<br />
高 速 ネットワーク<br />
無 断 での 引 用 、 転 載 を 禁 じます。 5<br />
Copyright 2013 FUJITSU LIMITED
Portfolio value ($m)<br />
様 々な 分 野 で 使 われるPCクラスタ<br />
CAE (Computer Aided Engineering)<br />
衝 突 解 析 流 体 解 析 構 造 解 析<br />
金 融 サービス<br />
金 融 工 学<br />
車 の 衝 突 解 析 、<br />
携 帯 電 話 の 落 下 解 析<br />
….<br />
ボディー 空 気 抵 抗 解 析 、<br />
部 品 の 冷 却 解 析<br />
….<br />
材 料 ・ 部 品 の 応 力 解 析<br />
高 層 建 築 の 地 震 応 答 解 析<br />
….<br />
オプションプライシング<br />
リスク 分 析<br />
….<br />
44<br />
42<br />
40<br />
38<br />
36<br />
34<br />
32<br />
30<br />
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20<br />
Trading day<br />
創 薬 開 発<br />
材 料 開 発<br />
コンピュータグラフィックス<br />
バイオインフォマティックス<br />
創 薬 開 発 の 解 析<br />
材 料 の 解 析<br />
レンダリング<br />
バイオインフォマティックス<br />
薬 剤 候 補 スクリーニング<br />
薬 剤 候 補 化 合 物 の 物 性 計 算<br />
….<br />
半 導 体 や 金 属 等 の 電 機<br />
特 性 解 析 。<br />
光 デバイスの 特 性 解 析<br />
….<br />
アニメーション<br />
ゲームコンテンツ 作 成<br />
….<br />
遺 伝 子 解 析<br />
タンパク 質 構 造 解 析<br />
….<br />
無 断 での 引 用 、 転 載 を 禁 じます。<br />
6<br />
6<br />
Copyright 2013 FUJITSU LIMITED<br />
2010 FUJITSU LIMITED
PCクラスタの 性 能 例<br />
• 衝 突 解 析 ソフト LS-DYNAのスケーラビリティ 性 能<br />
• 16 並 列 128 並 列 で、5.84 倍 の 性 能 向 上<br />
スピードアップ<br />
9<br />
8<br />
7<br />
6<br />
128 並 列<br />
5<br />
4<br />
スケーラビリティ<br />
3<br />
2<br />
16 並 列<br />
1<br />
0<br />
0 20 40 60 80 100 120 140<br />
並 列 数<br />
※ 試 験 データ : car2car<br />
• 複 数 のPCサーバで 一 つの 計 算 処 理 を 行 うことにより、<br />
処 理 時 間 の 大 幅 な 短 縮 が 可 能<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 7<br />
Copyright 2013 FUJITSU LIMITED
話 の 流 れ<br />
• 多 様 化 するHPCプラットフォーム<br />
• 専 用 スパコン<br />
• PCクラスタ<br />
• コプロセッサの 活 用 例 と 比 較<br />
•GROMACS<br />
•Himeno<br />
• コプロセッサ 活 用 のポイント<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 8<br />
Copyright 2013 FUJITSU LIMITED
絶 対 性 能 ・ 電 力 あたり 性 能<br />
コプロセッサの 特 長<br />
• 高 性 能<br />
• 高 コストパフォーマンス<br />
• 導 入 の 容 易 性<br />
• 移 植 ・チューニングが 必 要<br />
<strong>Xeon</strong><br />
(E5-2690)<br />
GPU<br />
<strong>Xeon</strong> <strong>Phi</strong><br />
(5110P)<br />
<strong>Xeon</strong> <strong>Phi</strong><br />
GPU<br />
(K20X)<br />
コア 数 (スレッド 数 ) 8 (16) 60 (240) 14 (2688)<br />
倍 精 度 演 算 性 能 [GFlops] 186 1,011 1,312<br />
ピークメモリバンド 幅 [GB/s] 51 320 208<br />
電 力 (TDP) [W] 135 225 235<br />
メモリ 容 量 [GB] ~ 数 百 8 6<br />
キャッシュ 容 量 (last level) [MB] 20 30 1.54<br />
Future<br />
<strong>Xeon</strong><br />
使 い 易 さ<br />
プログラム 記 述 いろいろ Native / Offload CUDA/OpenACC<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 9<br />
Copyright 2013 FUJITSU LIMITED
コプロセッサ 活 用 例 : GROMACS<br />
• 分 子 動 力 学 シミュレーションを 行 うフリーソフト 「GROMACS」<br />
たんぱく 質 の 分 子 構 造 をシミュレーションし、 性 質 を 探 る<br />
⇒GROMACSのコミュニティーは、ソースコードの 性 能 チューニングが 非 常 に 活 発<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 10<br />
Copyright 2013 FUJITSU LIMITED
GPGPU 性 能 例 : GROMACS<br />
• GPGPUをアクセラレータとして 使 用 し、ホストと 協 調 計 算 をする<br />
対 応 が 済 み。 公 開 サイトからダウンロード 可 能<br />
• GPGPUを 搭 載 するに 従 って、 性 能 が 向 上 する。<br />
GPGPU 1 枚 当 たりの 性 能 向 上 は、2 枚 の 時 がベスト<br />
(dhfr-solv-RF-1nm.bench 問 題 の 場 合 )<br />
180<br />
160<br />
140<br />
CPUのみ K20X x 1 K20X x 2 K20X x 4<br />
91.076 101.146 144.156 168.79<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
CPU<br />
K20X x 1<br />
K20X x 2<br />
K20X x 4<br />
0<br />
CPU K20X x 1 K20X x 2 K20X x 4<br />
• 自 らソースをGPGPU 向 けに 修 正 するのは 大 変 。<br />
既 にGPGPU 化 されたOSSやISVは 活 用 に 値 する。<br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 11<br />
Copyright 2013 FUJITSU LIMITED
<strong>Xeon</strong> <strong>Phi</strong> 性 能 例 : GROMACS<br />
• <strong>Xeon</strong>(E5シリーズ)に 対 して、AVX 命 令 を 直 接 アセンブラコーディングする<br />
チューニングにより、8.6 倍 の 性 能 向 上 が 実 現 されている<br />
• <strong>Xeon</strong> <strong>Phi</strong> 向 けのチューニングもコミュニティで 進 行 中 。SIMD 化 等 の<br />
チューニングにより、16 倍 程 度 の 性 能 向 上 を 期 待 。そのあかつきには、<br />
<strong>Xeon</strong>の2.7 倍 の 性 能 。<br />
⇒ ただし、 現 時 点 では<strong>Xeon</strong>(+GPGPU)が 得 策 。<br />
160<br />
140<br />
120<br />
SIMD 化 とアセンブラ 化 で<br />
<strong>Xeon</strong> <strong>Phi</strong> 対 応 されると、<br />
<strong>Xeon</strong>の2.7 倍 ()の 性 能<br />
100<br />
80<br />
60<br />
コンパイラ<br />
SIMD<br />
40<br />
20<br />
0<br />
<strong>Xeon</strong><br />
<strong>Xeon</strong><strong>Phi</strong><br />
無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />
、 転 載 を 禁 じます。 12<br />
Copyright 2013 FUJITSU LIMITED
4<br />
Himeno BMT 測 定 結 果<br />
• 問 題 サイズ : M<br />
• プログラム 記 述 (チューニング 済 みソース)<br />
• <strong>Xeon</strong>(E5-2690)、<strong>Xeon</strong> <strong>Phi</strong>(5110p) native : C(OpenMP)<br />
• <strong>Xeon</strong> <strong>Phi</strong>(5110p) explicit offload : C(OpenMP + Offload)<br />
• GPGPU(K20)、GPGPU(C2075) : C+CUDA<br />
<strong>Xeon</strong>を1としたときの 相 対 値<br />
4<br />
3<br />
2<br />
3<br />
2<br />
プログラム 行 数<br />
性 能<br />
1<br />
0<br />
1<br />
0<br />
プログラム 行 数 性 能 (GFlops)<br />
<strong>Xeon</strong> 447 21.2<br />
<strong>Xeon</strong> <strong>Phi</strong> native 447 46.7<br />
<strong>Xeon</strong> <strong>Phi</strong> explicit offload 507 43.2<br />
GPGPU(K20) 944 71.6<br />
GPGPU(C2075) 944 46.6<br />
無 断 での INTERNAL 引 用 、 転 USE 載 を ONLY 禁 じます。 13<br />
Copyright 2013 FUJITSU LIMITED
コプロセッサ 活 用 のまとめ<br />
自 作 コードの 場 合<br />
使 いやすさ<br />
性 能<br />
<strong>Xeon</strong> ◎ ×<br />
<strong>Xeon</strong> <strong>Phi</strong><br />
○(チューニングしない)<br />
△(チューニングする)<br />
GPGPU ×<br />
(CUDA 化 はたいへん)<br />
△(チューニングしない)<br />
○(チューニングする)<br />
◎<br />
コプロセッサ 対 応 済 みISV/OSSの 場 合<br />
使 いやすさ<br />
性 能<br />
<strong>Xeon</strong> ◎ ×<br />
<strong>Xeon</strong> <strong>Phi</strong> ◎ ○<br />
GPGPU ◎ ◎<br />
無 断 での INTERNAL 引 用 、 転 USE 載 を ONLY 禁 じます。<br />
14<br />
Copyright 2013 FUJITSU LIMITED
富 士 通 ブースご 紹 介<br />
富 士 通 ブースでは 講 演 でご 紹 介 した、 各 種 最 新 プラットフォームに 関 するパンフレットと、<br />
最 新 サーバの 実 機 展 示 をご 用 意 してお 待 ちいたしております。<br />
[パンフレット/ 検 証 レポート]<br />
Hall B No.16<br />
弊 社 ブース<br />
本 セミナー 会 場<br />
[ 最 新 サーバ 実 機 展 示 ]<br />
4GPU 搭 載 可 能<br />
FUJITSU HX2560 M1<br />
※ 2Uサイズに4GPU(K20/K20X) 搭 載 可 能 です。<br />
是 非 Hall B No.16 富 士 通 ブースまで、お 越 しください。<br />
アンケートご 回 答 者 に、エコグッズ( 針 なしホチキス) 差 し 上 げます!<br />
無 断 での 引 用 、 転 載 を 禁 じます。<br />
15<br />
Copyright 2013 FUJITSU LIMITED