Topics
    検証環境(テストドライブセンター)
    Menu

    AMD 最新CPU「EPYC」テストドライブセンター

    驚愕の性能事例

    1CPUで姫野ベンチ優に100GFLOPS超え!

    EPYC CPU(32コア/2.2GHz) x 2個、ノードあたりのメモリバンド幅:340.8GB/s、256GB DDR4メモリ構成の VT64 Server AE-1S で姫野ベンチマークテストを実施しました。

               


    比較対象のCPUは以下の通りです。

    • E5 2695v2 (2.4GHz 12c) x2 DDR3-1866
    • E5 2695v3 (2.3GHz 14c) x2 DDR4-2133
    • E5-2697v4 (2.3GHz 18c x 2) DDR4-2400

    AMDのEPYC ならびに Intel Xeon ともに計測可能な最大並列数での比較です。姫野ベンチマークテストは、Size=L、MPI版で測定しました。

    CPUあたり8チャネルDDR4メモリバンド幅の優位性

    EPYCは、4個のCPUダイを1つの物理的CPU姿に収めたMCM(Multi-Chip Module)製品です。各ダイは、それぞれ8個のZEN CPUコア、2チャネルDDR4(2666MHz)、32レーンPCI Expressを備えています。 一番着目したいのはメモリバンド幅。1CPUで合計8チャネルDDR4(2666MHz)を備え、理論値 170.4GB/sのバンド幅、1ノード(2CPU搭載)では、340.8GB/sとなり、IBM POWERを凌駕するメモリバンド幅は、HPCユーザにとってうれしい機能に尽きると言っても過言ではありません。

    AMD「EPYC」のnumanodeは8本みえるので、OSからは8ソケットマシンとみえます。従い、numactlがポイントです。 ベンチマークでは IFCを使いましが、Compiler Option「avx256」も無効(avx2まで)、”-x ” Option(CPU最適化)では動かない、という「逆境下」においてもこの成績を叩出したのは、豊富なメモリバンド幅によるものだと見ております。