Topics
    検証環境(テストドライブセンター)
    Menu

    IBM POWER8 テストドライブセンター

    概要

    「IBM POWER8テストドライブセンター」を開設

    2015年11月19日、HPC・クラウド・ビッグデータ向けIBM POWER8テストドライブセンターを立ち上げました。 お客様が普段お使いのLinuxOSで稼動するHPCシステム・クラウド・ビッグデータ向け プログラム(又はVTがご用意したベンチマークプログラム)を、「IBM POWER8テスト ドライブセンター」で提供される最新・最速のIBM Power System S822Lフルスペック 構成で動作させることができます。 「IBM POWER8テストドライブセンター」は、ご利用開始から起算して5営業日の間利用 が可能です。ご利用料金は無料です。ご利用にあたっては、お客様プログラムの動作環境 について事前にVTのSEがご相談にあたり、環境構築を行います。環境構築完了に合わせて VTからお知らせするユーザID/パスワードにて、インターネット経由SSHもしくは、お客様 ご自身による持込により簡単・お手軽にご利用が可能です。 POWER8に興味をお持ちのお客さまは、『POWER8でHPC向け高速計算が本当に動くのか』、 『POWER8でHPCの性能がどの程度でるのか』、 『HPCの実務としてどの程度使えるのか』、といった部分に関心をお持ちです。 Intel x86 系サーバを凌駕するパフォーマンスを実感できる「IBM POWER8テストドライブセンター」を一度お試しください。

    「HPCシステム向けとしてどこがすごいのか」を体感できます

    <流体計算の性能がすごい: InfiniBandで構成された最新Intel Haswell 4ノードクラスタの性能に匹敵>

    VTがご用意したHPCシステム向けベンチマークプログラム「姫野ベンチマークテストプログラム」において、 一般的なコンパイルオプションで24並列のとき70GFLOPSをマークします。 これは「384GB/sと豊富なメモリバンド幅」によるパフォーマンスです。 さらにprefetchオプション(データ先読みしてキャッシュに載せておく機能)をつけると、 24並列のとき一気に120GFLOPS以上をマークします。これは「256MBと大容量のL4キャッシュ」によるパフォーマンスです。この性能は、InfiniBandで構成された最新 Intel Haswell 4ノードクラスタの性能に匹敵します。

    ■実証例 (姫野ベンチマークテスト)
    himeno

    一般的な最適化オプション(-O3 -q64)で20並列のとき70GFLOPSをマーク →豊富なメモリ帯域が有効に働いている
    prefetchオプションをつけると20並列で一気に100GFLOPS以上をマーク →大容量なL4キャッシュが有効に働いている

    テストドライブ用POWER8 1台で、InfiniBand FDRで結合された最新Intel Haswell 4ノードクラスタシステムの性能に匹敵

    <疎行列計算の性能がすごい:製造業様にとってうれしい性能、 大規模1000万元超え疎行列計算で112GFLOPSをマーク>

    IBM Power System S822Lフルスペック構成で提供される疎行列ソルバー「WSMP」は、IBM ワトソン研究所で開発された疎行列計算に特化されたサブルーチンプログラムです。 数値計算ライブラリ ESSLと組み合わせて利用する事により、 大規模1000万元超えの疎行列計算でピーク性能比18%の112GFLOPSをマークします(一般的には10%またはそれ以下)。 疎行列計算を多用する製造業様にとってうれしい性能です。

    ■実証例 (POWER8とIntelプロセッサー性能比較)

    POWER8とIntelプロセッサーについて、それぞれ数値演算ライブラリ「WSMP(Watson Sparse Matrix Package)」と「MKL(Math Kernel Library)」を使用し、8並列性能評価を実施しました。 グラフの縦軸が処理時間、横軸がデータ量となっており、データ量が拡大するにつれ、オレンジで表示されたPOWER8が処理性能においてIntelプロセッサーより優位となるという結果が明らかになっています。 vt-img04

    IBM POWER8 vs Intel Xeon
      POWER8 Ivy Bridge EP Haswell EP
    クロック数 3.0-4.1 GHz 1.7-3.7 GHz 2.3 GHz
    最大L1キャッシュ 64 KB 32 KB 64 KB
    最大L2キャッシュ 512 KB 256 KB 256 KB
    最大L3キャッシュ/ソケット 96 MB (eDRAM) 30 MB 35 MB
    最大L4キャッシュ/ソケット 128 MB (eDRAM) 0 0
    メモリ帯域 384 GB/s 119.2 GB/s 136 GB/s
    POWER8のメリット

    (1) メモリバンド幅 POWER8ではXeonに比べてメモリバンド幅が、約3倍と非常に大きく、メモリバンド幅に依存するプログラムでは非常に有効です。 (2) L4キャッシュ 256MBと大容量なL4キャッシュを搭載し、prefetchオプション使えばさらに性能向上が期待できます。 お客様が普段お使いのHPC向けプログラムでどのくらいのパフォーマンスを引出せるか IBM Power System S822L フルスペック構成のパフォーマンスをご体感ください。

    「クラウド・ビッグデータ解析向けとしてどこがすごいのか」を体感できます

    「IBM POWER8テストドライブセンター」で提供される最新・最速のIBM Power System S822Lフルスペック構成は、 「384GB/sと豊富なメモリバンド幅」および「256MBと大容量のL4キャッシュ」に加えて下記の機能がご利用可能です。 この機能により、クラウド・ビッグデータ解析でもその威力を発揮します。

    <使えるMicro-Partitioning機能:仮想コア分割で省スペース・省電力を実現>

    Micro-Partitioning機能は、IBM Power System S822Lフルスペック構成で480コア規模のx86サーバ群に匹敵する仮想コアに分割が可能な機能です。 多数のx86サーバを運用するクラウド事業者様が直面する電源問題、スペースの問題をIBM Power Systemsに集約する事により、その問題を一気に解決する事が可能です。

    <安心便利なDynamic LPAR機能: 分散された仮想コアを自動負荷分散で人的リソース問題も解決>

    Dynamic LPAR機能は、Micro-Partitioning機能で分割された仮想コアの負荷状況により自動的に負荷分散できる機能です。 Webのアクセス集中など一時的に仮想コアに負荷がかかった場合など、Dynamic LPAR機能により自動的に負荷分散が行え、 クラウド事業者様の人的リソース問題も解決が可能です。

    使えるMicro-Partitioning機能 複数台のx86系サーバを1台のPOWER8に集約可能
    安心便利なDynamic LPAR機能 集約した1台のPOWER8内で自動的に負荷分散可能
    ■機能図
    kinou

    Micro-Partitioning機能 1つの物理コアを最大20の仮想コアに分割できる
    テストドライブ用POWER8 1台で480コア規模のx86サーバ群に匹敵する仮想コアに分割が可能

    Dynamic LPAR機能 仮想コアの負荷状況により自動的に負荷分散できる
    480コア規模のx86サーバ群に対する自動負荷分散をテストドライブ用POWER8 1台で自動制御が可能

     

    Webアプリケーション、メールサーバ機能など、お客様が普段ご利用のクラウド・ビッグデータ向けアプリケーションプログラムでDynamic LPAR機能およびMicro-Partitioning機能を使ってどのくらいのパフォーマンスを引出せるか IBM Power System S822L フルスペック構成のパフォーマンスをご体感ください。