NEC SX-AURORA PLATFORM

NEC SX-AURORA プラットフォーム

TOP >製品一覧 >NEC SX-AURORA プラットフォーム

「より速く、より手軽に」 
パーソナルな「スパコン」。進化した次世代イノベーションプラットフォーム

科学技術計算分野では、ベクトル演算(SIMD演算:Single Instruction, Multiple Data)が多用されます。x86 アークテクチャ等、現在のCPUは拡張命令としてベクトル演算のサポートを進めてきました。また、GPGPUの活用も進んでいますが、主にDeep Learningアプローチが中心で、倍精度以上の高精度での演算は不向きです。一方、いわゆるスーパーコンピュータと呼ばれる計算機は、ベクトル演算のための高性能なパイプライン化された実行ユニットを持ちます。ベクトル演算性能を発揮するためには、高速なメモリIOや、コンパイラやライブラリの最適化が極めて重要です。
NEC SX-AURORAプラットフォームは、x86アークテクチャ環境で、高性能なベクトル演算を可能にする画期的なプラットフォームです。ハードウェアに加え、専用のコンパイラやライブラリ、各種ツール類などもNECが開発し、提供されています。

SX-AuroraTSUBASA ベクトルエンジン VE2、アクティブFAN搭載モデル リーリース

SX-Aurora TSUBASAベクトルエンジン(VE)は、その高性能故に、マシン側に高い冷却性能や電源供給能力を要求します。
これまでは、NECによるVEを搭載したコンプリートマシンとしての提供がメインでしたが、アクティブFANモデルなどのカード単体リリースを機に、VTは、より多様なマシンにSX-AuroraTSUBASAベクトルエンジンを搭載し、ソフトウェアをバンドルしたモデルなども、ご提供してまいります。
NEC純正モデルに加え、VTオリジナルVT64シリーズとしてNEC認証サーバモデルへのVE搭載と環境の構築など、多彩なラインアップで、VEの高性能を余すところなく引き出せる、「スーパーコンピュータ」をお届けします。

FEATURE SX-Aurora TSUBASAの特長

x86/Linuxと融合した
Aurora TSUBASAアーキテクチャ

SX-Aurora TSUBASAアーキテクチャは、ベクトルエンジン:VE部と主にIO等のOS処理を行うホスト:VH部により構成されます。PCIeカードに搭載されるVE部はベクトルプロセッサ、および高速メモリから構成され、x86ホスト部とPCIe 経由で接続されています。x86ホストではLinux OSが稼働しますが、アプリケーションは全てVE側で実行されます。コンパイルされたアプリケーションの命令はVEの中のスカラプロセッサとベクタプロセッサおよび高速なメモリ上で実行されるということです。
その為、標準のx86/Linux環境から利用でき、メモリがボトルネックとならない高速なベクトル演算が可能なアークテクチャとなっています。

参照 日本電気株式会社NEC SX-AuroraTSUBASAシリーズ製品

高性能な新開発ベクトルエンジン

高性能なベクトルプロセッサ

ベクトル長が長い (64bit x 256要素) ※AVX512は(64bit x 8要素)

長いベクトル長での一括処理により、高い演算性能を発揮します。

参照 日本電気株式会社新ベクトルスーパーコンピュータ NEC SX-Aurora TSUBASAのご紹介

メモリ帯域が広い

高速演算でボトルネックとなるメモリ帯域は、HBM(High Bandwidth Memory) をHBM2に変更したことで、最大1.53TB/sに達します。
1VE当たり6チップで48㎇の容量を実現しています。
現行のCPUの最大メモリバンドは、1CPU当たり、AMD Epyc (Rome) 410GB/s、第三世代Xeon Scalable Processors (Ice-Lake) 204.5 GB/s 程度です。

※HBMメモリ
シリコン貫通ビア(TSV:Through Silicon Via)技術により、Dieの上にDRAMチップを積層したダイスタッキング型のDRAM技術です。CPUコアとメモリはSilicon Interposerという小さなサブ基板を介してインターフェイス幅は1,024bit(128bit×8)で接続されます。HBM2は信号速度と積層するメモリモジュールをそれぞれ倍の 2Gpbs/8GBにしたものです。
GPUのGDDR5/6メモリと比べて、高速で省電力ですが高価な高性能メモリです。


研究開発ツールとしての使い易さ

SX-AURORAシステムは研究者やエンジニアの生産性を高めるツールです。

ホスト部はOSとして一般的なLinux(Red Hat Enterprise Linux、及びCentOS)を採用し、InfiniBandなどHPC分野で標準的な周辺機器が利用可能です。

ベクトルプロセッサの性能を最大限引き出すために、以下のソフトウェアを日本電気株式会社が提供しています。

アルゴリズムがベクトル化可能で、かつOpenMPによって並列化されていればコンパイラの自動ベクトル化機能によってコンパイルするだけで、高い性能を得ることができます。

  • 自動ベクトル化・自動並列化機能を備えたAurora Tsubasaコンパイラ
    GNU互換で、アプリケーションの実効性能を向上させる高度な自動ベクトル化・自動並列化機能を備えたFortran/C/C++コンパイラ、及びシステム構成に最適化されたMPIライブラリ。
  • システムに最適化された科学技術計算ライブラリ
    業界標準のBLAS、FFT、FFTW、LAPACK、ScaLAPACKを含む、最適化された科学技術計算ライブラリ。
  • 各種ツール類
    NEC Ftrace Viewer:性能解析ツール、NEC Parallel Debugger:並列デバッガ。
参照 日本電気株式会社 ツールなどのリポジトリ(GitHub)

弊社では、OSインストール、専用のソフトウェア環境のセットアップを行い、高負荷状態でのエイジングおよび動作確認をした上で、お手元にお届けいたします。
また、ネットワーク設定、現地設置作業などのご用命にもきめ細かに対応いたします。ご利用状況に合わせた保守・エンジニアサポート、高速なネットワーク、大容量ストレージなどについても同時にご提案可能です。