14.01.2015 Views

Xeon Phi

Xeon Phi

Xeon Phi

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

多 様 化 するHPCプラットフォームの<br />

選 択 ガイドライン<br />

2013 年 7 月 30 日<br />

富 士 通 株 式 会 社<br />

次 世 代 テクニカルコンピューティング 開 発 本 部<br />

第 二 システム 開 発 統 括 部 第 一 開 発 部<br />

マネージャー 長 塚 雅 明<br />

Copyright 2013 FUJITSU LIMITED


話 の 流 れ<br />

• 多 様 化 するHPCプラットフォーム<br />

• 専 用 スパコン<br />

• PCクラスタ<br />

• コプロセッサの 活 用 例 と 比 較<br />

•GROMACS<br />

•Himeno<br />

• コプロセッサ 活 用 のポイント<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 1<br />

Copyright 2013 FUJITSU LIMITED


多 様 化 するHPCプラットフォーム<br />

PCクラスタに 加 え、GPGPU, <strong>Xeon</strong> <strong>Phi</strong>の 登 場 ・<br />

台 頭 により、 裾 野 がさらに 拡 大<br />

先 端 研 究 機 関<br />

スーパーコンピュータ<br />

( 専 用 スパコン)<br />

民 間 企 業<br />

GPGPU<br />

PCクラスタ<br />

(PCサーバ)<br />

<strong>Xeon</strong> <strong>Phi</strong><br />

無 断 での 引 用 、 転 載 を 禁 じます。 2<br />

Copyright 2013 FUJITSU LIMITED


専 用 スパコンの 特 長<br />

( 例 :スーパーコンピュータ「 京 」)<br />

• 10.51 Peta FLOPS • ノードMTBF 290 年 以 上 !!<br />

•88,128ノード<br />

•Linpack 29 時 間 連 続 稼 働<br />

•CPU: SPARC64 VIIIfx<br />

•ネットワーク: ICC (Tofu)<br />

高 性 能 & 高 信 頼<br />

無 断 での 引 用 、 転 載 を 禁 じます。<br />

3<br />

Copyright 2013 FUJITSU LIMITED


専 用 スパコンの 性 能 例<br />

Sustained Performance (TF) <br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

K-asis<br />

K-tune<br />

BX900-asis<br />

Helios-asis<br />

Helios-tune<br />

プラズマ 乱 流 シミュレーション<br />

0 5000 10000 15000 20000 25000 30000 35000<br />

cores <br />

[Y.Idomura et al., Int. J. HPC Appl. in press]<br />

日 本 原 子 力 研 究 開 発 機 構 井 戸 村 泰 宏 様 ご 提 供<br />

京<br />

PCクラスタ<br />

万 を 超 える<br />

並 列 計 算 で<br />

スケール<br />

無 断 での 引 用 、 転 載 を 禁 じます。 4<br />

Copyright 2013 FUJITSU LIMITED


PCクラスタ(PCサーバ)の 特 長<br />

★ 多 数 のPCサーバを 束 ねて、「スパコン」に 匹 敵<br />

する 性 能 を 確 保<br />

• PCクラスタの 特 長<br />

PCクラスタ<br />

1コストパフォーマンスに 優 れたCPU・ネットワーク<br />

CPU: Intel <strong>Xeon</strong>、ネットワーク: InfiniBand<br />

2オープン 性 が 高 く、ISVソフト・OSSが 豊 富<br />

→ 様 々な 広 い 分 野 で 活 用 しやすい<br />

→ 利 用 方 法 などのノウハウ・ 知 見 が 豊 富<br />

分 散 並 列 処 理<br />

高 速 ネットワーク<br />

無 断 での 引 用 、 転 載 を 禁 じます。 5<br />

Copyright 2013 FUJITSU LIMITED


Portfolio value ($m)<br />

様 々な 分 野 で 使 われるPCクラスタ<br />

CAE (Computer Aided Engineering)<br />

衝 突 解 析 流 体 解 析 構 造 解 析<br />

金 融 サービス<br />

金 融 工 学<br />

車 の 衝 突 解 析 、<br />

携 帯 電 話 の 落 下 解 析<br />

….<br />

ボディー 空 気 抵 抗 解 析 、<br />

部 品 の 冷 却 解 析<br />

….<br />

材 料 ・ 部 品 の 応 力 解 析<br />

高 層 建 築 の 地 震 応 答 解 析<br />

….<br />

オプションプライシング<br />

リスク 分 析<br />

….<br />

44<br />

42<br />

40<br />

38<br />

36<br />

34<br />

32<br />

30<br />

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20<br />

Trading day<br />

創 薬 開 発<br />

材 料 開 発<br />

コンピュータグラフィックス<br />

バイオインフォマティックス<br />

創 薬 開 発 の 解 析<br />

材 料 の 解 析<br />

レンダリング<br />

バイオインフォマティックス<br />

薬 剤 候 補 スクリーニング<br />

薬 剤 候 補 化 合 物 の 物 性 計 算<br />

….<br />

半 導 体 や 金 属 等 の 電 機<br />

特 性 解 析 。<br />

光 デバイスの 特 性 解 析<br />

….<br />

アニメーション<br />

ゲームコンテンツ 作 成<br />

….<br />

遺 伝 子 解 析<br />

タンパク 質 構 造 解 析<br />

….<br />

無 断 での 引 用 、 転 載 を 禁 じます。<br />

6<br />

6<br />

Copyright 2013 FUJITSU LIMITED<br />

2010 FUJITSU LIMITED


PCクラスタの 性 能 例<br />

• 衝 突 解 析 ソフト LS-DYNAのスケーラビリティ 性 能<br />

• 16 並 列 128 並 列 で、5.84 倍 の 性 能 向 上<br />

スピードアップ<br />

9<br />

8<br />

7<br />

6<br />

128 並 列<br />

5<br />

4<br />

スケーラビリティ<br />

3<br />

2<br />

16 並 列<br />

1<br />

0<br />

0 20 40 60 80 100 120 140<br />

並 列 数<br />

※ 試 験 データ : car2car<br />

• 複 数 のPCサーバで 一 つの 計 算 処 理 を 行 うことにより、<br />

処 理 時 間 の 大 幅 な 短 縮 が 可 能<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 7<br />

Copyright 2013 FUJITSU LIMITED


話 の 流 れ<br />

• 多 様 化 するHPCプラットフォーム<br />

• 専 用 スパコン<br />

• PCクラスタ<br />

• コプロセッサの 活 用 例 と 比 較<br />

•GROMACS<br />

•Himeno<br />

• コプロセッサ 活 用 のポイント<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 8<br />

Copyright 2013 FUJITSU LIMITED


絶 対 性 能 ・ 電 力 あたり 性 能<br />

コプロセッサの 特 長<br />

• 高 性 能<br />

• 高 コストパフォーマンス<br />

• 導 入 の 容 易 性<br />

• 移 植 ・チューニングが 必 要<br />

<strong>Xeon</strong><br />

(E5-2690)<br />

GPU<br />

<strong>Xeon</strong> <strong>Phi</strong><br />

(5110P)<br />

<strong>Xeon</strong> <strong>Phi</strong><br />

GPU<br />

(K20X)<br />

コア 数 (スレッド 数 ) 8 (16) 60 (240) 14 (2688)<br />

倍 精 度 演 算 性 能 [GFlops] 186 1,011 1,312<br />

ピークメモリバンド 幅 [GB/s] 51 320 208<br />

電 力 (TDP) [W] 135 225 235<br />

メモリ 容 量 [GB] ~ 数 百 8 6<br />

キャッシュ 容 量 (last level) [MB] 20 30 1.54<br />

Future<br />

<strong>Xeon</strong><br />

使 い 易 さ<br />

プログラム 記 述 いろいろ Native / Offload CUDA/OpenACC<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 9<br />

Copyright 2013 FUJITSU LIMITED


コプロセッサ 活 用 例 : GROMACS<br />

• 分 子 動 力 学 シミュレーションを 行 うフリーソフト 「GROMACS」<br />

たんぱく 質 の 分 子 構 造 をシミュレーションし、 性 質 を 探 る<br />

⇒GROMACSのコミュニティーは、ソースコードの 性 能 チューニングが 非 常 に 活 発<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 10<br />

Copyright 2013 FUJITSU LIMITED


GPGPU 性 能 例 : GROMACS<br />

• GPGPUをアクセラレータとして 使 用 し、ホストと 協 調 計 算 をする<br />

対 応 が 済 み。 公 開 サイトからダウンロード 可 能<br />

• GPGPUを 搭 載 するに 従 って、 性 能 が 向 上 する。<br />

GPGPU 1 枚 当 たりの 性 能 向 上 は、2 枚 の 時 がベスト<br />

(dhfr-solv-RF-1nm.bench 問 題 の 場 合 )<br />

180<br />

160<br />

140<br />

CPUのみ K20X x 1 K20X x 2 K20X x 4<br />

91.076 101.146 144.156 168.79<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

CPU<br />

K20X x 1<br />

K20X x 2<br />

K20X x 4<br />

0<br />

CPU K20X x 1 K20X x 2 K20X x 4<br />

• 自 らソースをGPGPU 向 けに 修 正 するのは 大 変 。<br />

既 にGPGPU 化 されたOSSやISVは 活 用 に 値 する。<br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 11<br />

Copyright 2013 FUJITSU LIMITED


<strong>Xeon</strong> <strong>Phi</strong> 性 能 例 : GROMACS<br />

• <strong>Xeon</strong>(E5シリーズ)に 対 して、AVX 命 令 を 直 接 アセンブラコーディングする<br />

チューニングにより、8.6 倍 の 性 能 向 上 が 実 現 されている<br />

• <strong>Xeon</strong> <strong>Phi</strong> 向 けのチューニングもコミュニティで 進 行 中 。SIMD 化 等 の<br />

チューニングにより、16 倍 程 度 の 性 能 向 上 を 期 待 。そのあかつきには、<br />

<strong>Xeon</strong>の2.7 倍 の 性 能 。<br />

⇒ ただし、 現 時 点 では<strong>Xeon</strong>(+GPGPU)が 得 策 。<br />

160<br />

140<br />

120<br />

SIMD 化 とアセンブラ 化 で<br />

<strong>Xeon</strong> <strong>Phi</strong> 対 応 されると、<br />

<strong>Xeon</strong>の2.7 倍 ()の 性 能<br />

100<br />

80<br />

60<br />

コンパイラ<br />

SIMD<br />

40<br />

20<br />

0<br />

<strong>Xeon</strong><br />

<strong>Xeon</strong><strong>Phi</strong><br />

無 FUJITSU 断 での 引 用 CONFIDENTIAL<br />

、 転 載 を 禁 じます。 12<br />

Copyright 2013 FUJITSU LIMITED


4<br />

Himeno BMT 測 定 結 果<br />

• 問 題 サイズ : M<br />

• プログラム 記 述 (チューニング 済 みソース)<br />

• <strong>Xeon</strong>(E5-2690)、<strong>Xeon</strong> <strong>Phi</strong>(5110p) native : C(OpenMP)<br />

• <strong>Xeon</strong> <strong>Phi</strong>(5110p) explicit offload : C(OpenMP + Offload)<br />

• GPGPU(K20)、GPGPU(C2075) : C+CUDA<br />

<strong>Xeon</strong>を1としたときの 相 対 値<br />

4<br />

3<br />

2<br />

3<br />

2<br />

プログラム 行 数<br />

性 能<br />

1<br />

0<br />

1<br />

0<br />

プログラム 行 数 性 能 (GFlops)<br />

<strong>Xeon</strong> 447 21.2<br />

<strong>Xeon</strong> <strong>Phi</strong> native 447 46.7<br />

<strong>Xeon</strong> <strong>Phi</strong> explicit offload 507 43.2<br />

GPGPU(K20) 944 71.6<br />

GPGPU(C2075) 944 46.6<br />

無 断 での INTERNAL 引 用 、 転 USE 載 を ONLY 禁 じます。 13<br />

Copyright 2013 FUJITSU LIMITED


コプロセッサ 活 用 のまとめ<br />

自 作 コードの 場 合<br />

使 いやすさ<br />

性 能<br />

<strong>Xeon</strong> ◎ ×<br />

<strong>Xeon</strong> <strong>Phi</strong><br />

○(チューニングしない)<br />

△(チューニングする)<br />

GPGPU ×<br />

(CUDA 化 はたいへん)<br />

△(チューニングしない)<br />

○(チューニングする)<br />

◎<br />

コプロセッサ 対 応 済 みISV/OSSの 場 合<br />

使 いやすさ<br />

性 能<br />

<strong>Xeon</strong> ◎ ×<br />

<strong>Xeon</strong> <strong>Phi</strong> ◎ ○<br />

GPGPU ◎ ◎<br />

無 断 での INTERNAL 引 用 、 転 USE 載 を ONLY 禁 じます。<br />

14<br />

Copyright 2013 FUJITSU LIMITED


富 士 通 ブースご 紹 介<br />

富 士 通 ブースでは 講 演 でご 紹 介 した、 各 種 最 新 プラットフォームに 関 するパンフレットと、<br />

最 新 サーバの 実 機 展 示 をご 用 意 してお 待 ちいたしております。<br />

[パンフレット/ 検 証 レポート]<br />

Hall B No.16<br />

弊 社 ブース<br />

本 セミナー 会 場<br />

[ 最 新 サーバ 実 機 展 示 ]<br />

4GPU 搭 載 可 能<br />

FUJITSU HX2560 M1<br />

※ 2Uサイズに4GPU(K20/K20X) 搭 載 可 能 です。<br />

是 非 Hall B No.16 富 士 通 ブースまで、お 越 しください。<br />

アンケートご 回 答 者 に、エコグッズ( 針 なしホチキス) 差 し 上 げます!<br />

無 断 での 引 用 、 転 載 を 禁 じます。<br />

15<br />

Copyright 2013 FUJITSU LIMITED

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!