Topics
    検証環境(テストドライブセンター)
    Menu

    Intel Xeon Phi テストドライブセンター

    性能事例

    【速報!】 Intel Xeon Phi 7210(KNL)での姫野ベンチマーク性能検証

    VTは、検証機としてKNL搭載マシンを導入し、早速姫野ベンチマークテストでの性能検証を実施しました。検証内容は、KNL単体、KNL vs XeonCPU の2通りです。

    1.KNL単体の性能検証

    検証環境

    ・KNL Intel Xeon Phi 7210 (1.3GHz 64c) x 1
    ・Memory 16GB DDR4 2400MHz x 6 + 16GB(On die)
    ・OS CentOS 7.2 (kernel 3.10.0-327.22.2.el7.xppsl_1.4.1.3272.x86_64)
    ・Compiler Intel 16.0.3.210
    ・MPI Intel MPI 5.1.3

    検証結果(速報)

    KNL-BMT1

    コメント

    HTはOFFに設定、HT onのときは4倍の256コアとなります。動作モードはFLATでnuma nodeが2本見えます。numa node#0番がDDR4の96GB、#1番がKNLダイ内の16GBとなっています。Numactlなしで実行すると、1.3Ghzの普通のXeonの振る舞いに似た性能を示します。メモリバインドを1番にして実行すると、64並列で128GFLOPSの値がでた。メモリやNUMAのモードが複数あるので用途に応じた使分けが難しいが、KNLダイ内のMCDRAM 16GBでOKならメモリバンド幅は魅力的です。

     

    2.KNL vs Intel Xeon cpuの性能検証

    検証環境(Xeon。KNLは上記と同じ環境)

    ・Xeon E5 2697 V4(2.3GHz 18Core) x 2
    ・Memory 512GB(DDR4 2400MHz 64GB x 8
    ・OS CentOS 7.2 (kernel 3.10.0-327.22.2.el7.xppsl_1.4.1.3272.x86_64)
    ・Compiler Intel Fortran 17.0.0
    ・MPI Intel MPI 5.1.3

    検証結果(速報)

    Xeon E5 2697 V4 との比較においては、Intel Compilerを2017にして、さらにXeon E5 2697 V4の環境もCentOS 7.2として、OS,コンパイラMPIもKNLと同じ環境にて実行しました。

    KNL-BMT2

    コメント

    Intel MPI ,Intel Compiler 2017最新版でのXeonPhiの値は、2016updat3でコンパイルしたバイナリより向上している。XeonPhiのDDR4メモリでの実行は、1ソケットのXeonと考えれば悪くない(たとえばE5-1650v3(3.5Ghz 6c)では18GFLOPS程度)。