性能事例
【速報!】 Intel Xeon Phi 7210(KNL)での姫野ベンチマーク性能検証
VTは、検証機としてKNL搭載マシンを導入し、早速姫野ベンチマークテストでの性能検証を実施しました。検証内容は、KNL単体、KNL vs XeonCPU の2通りです。
1.KNL単体の性能検証
検証環境
・KNL Intel Xeon Phi 7210 (1.3GHz 64c) x 1
・Memory 16GB DDR4 2400MHz x 6 + 16GB(On die)
・OS CentOS 7.2 (kernel 3.10.0-327.22.2.el7.xppsl_1.4.1.3272.x86_64)
・Compiler Intel 16.0.3.210
・MPI Intel MPI 5.1.3
検証結果(速報)
コメント
HTはOFFに設定、HT onのときは4倍の256コアとなります。動作モードはFLATでnuma nodeが2本見えます。numa node#0番がDDR4の96GB、#1番がKNLダイ内の16GBとなっています。Numactlなしで実行すると、1.3Ghzの普通のXeonの振る舞いに似た性能を示します。メモリバインドを1番にして実行すると、64並列で128GFLOPSの値がでた。メモリやNUMAのモードが複数あるので用途に応じた使分けが難しいが、KNLダイ内のMCDRAM 16GBでOKならメモリバンド幅は魅力的です。
2.KNL vs Intel Xeon cpuの性能検証
検証環境(Xeon。KNLは上記と同じ環境)
・Xeon E5 2697 V4(2.3GHz 18Core) x 2
・Memory 512GB(DDR4 2400MHz 64GB x 8
・OS CentOS 7.2 (kernel 3.10.0-327.22.2.el7.xppsl_1.4.1.3272.x86_64)
・Compiler Intel Fortran 17.0.0
・MPI Intel MPI 5.1.3
検証結果(速報)
Xeon E5 2697 V4 との比較においては、Intel Compilerを2017にして、さらにXeon E5 2697 V4の環境もCentOS 7.2として、OS,コンパイラMPIもKNLと同じ環境にて実行しました。
コメント
Intel MPI ,Intel Compiler 2017最新版でのXeonPhiの値は、2016updat3でコンパイルしたバイナリより向上している。XeonPhiのDDR4メモリでの実行は、1ソケットのXeonと考えれば悪くない(たとえばE5-1650v3(3.5Ghz 6c)では18GFLOPS程度)。