Topics
    製品情報
    Menu

    IBM Power System S812L

    ベンチマーク

    性能検証レポート(姫野ベンチマーク)

    POWER8での20並列での性能は、InfiniBand (FDR)で構成された最新Intel Haswell 4ノードクラスタに匹敵します。
    power8_result
    • 一般的な最適化オプション(-O3 -q64)で20並列のとき70 GFLOPSをマーク
      豊富なメモリ帯域が有効に働いている
    • Prefetchオプションをつけると20並列で一気に100 GFLOPS以上をマーク
      大容量なL4キャッシュが有効に働いている

    帯域比率およびB/F値の比較

    CPUPOWER8
    (3.06GHz, 12cores)
    Ivy Bridge EP
    (2.70GHz, 12cores)※1
    Haswell EP
    (2.30GHz, 18cores)※2
    CPUコア数24 (12/CPU)24 (12/CPU)36 (18/CPU)
    メモリー帯域384 GB/s119.4 GB/s136 GB/s
    メモリー帯域/コア16 GB/s/core4.9 GB/s/core3.7 GB/s/core
    FLOPS587.52 GFLOPS518.4 GFLOPS1324.8 GFLOPS
    B/F値0.650.230.10
    ※1 Xeon E5-2697 v2
    ※2 Xeon E5-2699 v3

     

    Intel Xeonとの比較

     Sandy
    Bridge
    EP
    Ivy
    Bridge
    EP
    Ivy
    Bridge
    EX
    Haswell
    EP
    Broadwell
    EP
    POWER8
    Clock rates1.8-3.6 GHz1.7-3.7 GHz1.9-3.4 GHz2.3 GHz3.0-4.1 GHz
    SMT options1, 2 *1, 2 *1, 2 *1, 21, 21, 2, 4, 8
    Max Threads /
    socket
    162430283696
    Max L1 Cache32 KB32 KB **32 KB **64 KB64 KB(?)64 KB
    Max L2 Cache256 KB256 KB256 KB256 KB256 KB(?)512 KB
    Max L3 Cache /
    socket
    20 MB30 MB37.5 MB35 MB45 MB96 MB
    (eDRAM)
    Max L4 Cache00000128 MB
    (eDRAM)
    Memory
    Bandwidth
    31.4-51.2 GB/s42.6-59.7 GB/s68-85 GB/s ***68 GB/s76.8 GB/s192 GB/s
    * Intel calls this Hyper-Threading Technology (No HT and with HT)
    ** 32KB running in “Non-RAS mode” Only 16KB in RAS mode
    *** 85GB running in “Non-RAS mode” = dual-device error NOT supported

     

    POWER8プロセッサ構成

    power8