Aurora スーパーコンピューターでのブレード収容完了

インテル® Max® シリーズ・ファミリーを搭載した10,624台のブレードの収容により、Auroraはエクサスケール・コンピューティングでの大きな成果を達成

ニュース

  • 2023年6月22日

  • インテル PRに問い合わせる

  • ソーシャルメディアでインテル・ニュースルームをフォローする:

    Twitter のロゴ
    YouTube のアイコン

author-image

投稿者:

(クレジット:アルゴンヌ国立研究所)

新着情報:本日、アルゴンヌ国立研究所のAuroraスーパーコンピューターにおいて、63,744基のインテル® データセンター GPU Max シリーズと21,248基のインテル® Xeon® CPU Max シリーズを搭載した10,624台のコンピュート・ブレードの完全装備が完了しました。

「Auroraは、インテルのMaxシリーズGPUの最初の導入事例であると同時に、インテル® Xeon® CPU Max シリーズ搭載システムとして最大であり、世界最大のGPUクラスターです。私たちは、歴史的なこのシステムへの貢献を誇りに感じると同時に、Auroraが実現する画期的なAI、科学、エンジニアリングに期待しています」

—  インテル コーポレーション 副社長 兼 スーパーコンピューティング事業部 事業部長、ジェフ・マクベイ(Jeff McVeigh)

Auroraとは:Auroraスーパーコンピューターは、ハイパフォーマンス・コンピューティング(HPC)の3本柱であるシミュレーション、データ解析、人工知能(AI)の可能性を最大限に引き出すことを目指し、インテル、ヒューレット・パッカード エンタープライズ(HPE)、米国エネルギー省(DOE)により共同開発されました。このシステムは、1,024を超えるストレージ・ノード(インテルの分散型非同期オブジェクトストレージであるDAOSを使用)により、毎秒31TB(テラバイト)の総帯域幅をもつ220PB(ペタバイト)のストレージ容量を有するほか、高性能なファブリックであるHPE Slingshotを採用しています。今年後半、Auroraは、理論ピーク性能で2エクサFLOP(エクサフロップス)を超える世界初のスーパーコンピューターとして、TOP500リストにランクインすると見込まれています。

Auroraは、インテル® GPU/CPU Max シリーズ・ファミリーの能力を最大限に生かします。インテル® GPU Max シリーズは、HPCやAIに代表される動的な新しいワークロードの需要に対応するように設計されています。インテル® GPU Max シリーズの初期の性能結果として、実環境での科学/エンジニアリング・ワークロードで最高水準の性能が実証され、OpenMCを用いた評価ではAMD MI250X GPUに対して最大2倍の性能を示し、その性能は数百ノードまでほぼリニアに伸びます*1。インテル® Xeon® CPU Max シリーズは、地球システムモデリングやエネルギー/製造向け*2など、実環境での多くのHPCワークロードで、競合製品に対して40%の性能優位性を有します。

重要な理由:研究者は、気候変動への取り組みから致死性疾患の治療法の発見まで、その解決に対して高度なコンピューティング技術が求められる大きな課題に直面しています。Auroraは、HPCおよびAIコミュニティのニーズに対応し、科学的探求の限界を押し広げるために必要なツールを提供します。

アルゴンヌ国立研究所副所長のリック・スティーブンス(Rick Stevens)氏は「私たちは検収に向けて取り組むとともに、Auroraを用いて科学用の大規模なオープンソースの生成AIモデルを学習させる予定です。Auroraは、60,000基以上のインテル® データセンター GPU Max シリーズ、非常に高速なI/Oシステム、オールSSDの大容量ストレージシステムを備えており、これらのモデルの学習に最適な環境です」と述べています。

仕組み:この最先端システムの中核として、スリムな長方形のブレードが組み込まれています。これらのブレードには、プロセッサーやメモリー、ネットワーキングと冷却技術が搭載されています。各ブレードにはインテル® Xeon® CPU Max シリーズ 2基とインテル® データセンター GPU Max シリーズ 6基が搭載されています。インテル® Xeon® CPU Max シリーズは、Auroraと同じアーキテクチャーであるテスト/開発システム「Sunspot」上ですでに優れた初期性能を達成しています。開発者は、oneAPIとAIツールを活用して、HPCとAIのワークロードを高速化させ、複数のアーキテクチャー間でのコードの移植性を向上させています。

これらのブレードの設置には繊細な作業が必要とされ、70ポンド(約32キログラム)のブレードを冷蔵庫大のAuroraのラックに垂直に組み込むために専用の機械を利用します。Auroraのシステムは、各ラックに64枚のブレードが収容される166のラックで構成され、これらのラックが8列にわたり配置され、アルゴンヌ・リーダーシップ・コンピューティング・ファシリティー(ALCF)のデータセンターでプロバスケットコート2面分のスペースを占めています。

ALCFのAuroraアーリー・サイエンス・プログラム(ESP)とDOEのエクサスケール・コンピューティング・プロジェクトの研究者は、テスト/開発システム「Sunspot」から完全装備されたAuroraへと、その活動環境を完全移行させます。この移行により、研究者はアプリケーションをフルシステムとなったAuroraでスケールアップできます。初期のユーザーは、このスーパーコンピューターのストレステストを行い、導入前に解決すべき潜在的なバグを特定します。これには、先頃、ISC'23カンファレンスで発表された科学用の生成AIモデル開発の取り組みも含まれています。

詳細:インテルのスーパーコンピューティング・ラボに潜入(ビデオ)インテル、冷却の未来に挑む広範でオープンなHPC+AIポートフォリオがパフォーマンスと科学向けジェネレーティブAIを強化インテル®データセンター向けGPU Maxシリーズ(製品概要)インテル®Xeon CPU Maxシリーズ(製品概要)Aurora.Intel.com(英語 エクサスケールでのHPCとAIブレード・ビデオ(インテル・ビジョン2022)

The Small Print:

Disclaimers and configuration:

Intel does not control or audit third-party data. You should consult other sources to evaluate accuracy.

Sunspot, Intel® Data Center GPU Max 1550: Testing as of 5/12/2023 by Argonne National Laboratory. Each Node: 2x 52C Intel® Xeon® Max CPU, 6x Intel® Data Center GPU Max Polaris, NVIDIA A100: Testing as of 5/12/2023 by Argonne National Laboratory. Each Node: 1x AMD EPYC Milan, 4x NVIDIA A100 40G PCIe Crusher, AMD Instinct MI250X: Testing as of 5/12/2023 by Argonne National Laboratory. Each Node: 1x Optimized 3rd Gen AMD EPYC, 4x AMD Instinct MI250X Intel does not control or audit third-party data. You should consult other sources to evaluate accuracy.

 

Geomean of 5 workloads [HPCG, NEMO-GYRE, Anelastic Wave Propagation, BlackScholes, OpenFOAM] 

  • HPCG
    • Intel Configuration: 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, SNC4, Total Memory 128 GB (8x16GB HBM2 3200MT/s), BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode revision=0x2c000020, CentOS Stream 8, Linux version 5.19.0-rc6.0712.intel_next.1.x86_64+server, HPCG from MKL_v2022.1.0. Test by Intel as of 9/2/2022. O AMD Configuration: 1-node, 2x AMD EPYC 9654, HT On, Turbo On, CTDP=360W, NPS=4, 1536GB DDR5-4800, BIOS 1.2, microcode 0xa101111, Red Hat Enterprise Linux 8.7, Kernel 4.18, AMD official binary. Test by Intel as of 03/27/23.
  • NEMO-GYRE
    • Intel Configuration: 1-node, 2x Intel® Xeon® Max 9480, HT ON, Turbo ON, NUMA configuration SNC4, Total Memory 128 GB (HBM2e at 3200 MHz), BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode revision=0x2c000020, CentOS Stream 8, Linux version 5.19.0-rc6.0712.intel_next.1.x86_64+server, NEMO v4.2 build with Intel® Fortran Compiler Classic and Intel® MPI from 2022.3 Intel® oneAPI HPC Toolkit with compiler flags “-i4 -r8 -O3 -fno-alias -march=core-avx2 - fp-model fast=2 -no-prec-div -no-prec-sqrt -align array64byte -fimf-usesvml=true”. Test by Intel as of 10/12/2022. o AMD Configuration: 1-node, 2x AMD EPYC 9654, HT On, Turbo On, CTDP=360W, NPS=4, 1536GB DDR5-4800, BIOS 1.2, microcode 0xa101111, Red Hat Enterprise Linux 8.7, Kernel 4.18, NEMO version 4.2 compiled with Intel® Fortran Compiler Classic and Intel® MPI from 2022.3 Intel® oneAPI HPC Toolkit with compiler flags “-O3 -xCORE-AVX2”. Test by Intel as of 03/27/23.
  • Anelastic Wave Propagation
    • Intel Configuration: 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, SNC4, 128 GB HBM2e, BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode Performance Footnotes revision=0x2c000020, CentOS Stream 8, Linux version 5.19, YASK v3.05.07 . Test by Intel as of 9/2/2022. o AMD Configuration: 1-node, 2x AMD EPYC 9654, HT On, Turbo On, CTDP=360W, NPS=4, 1536GB DDR5-4800, BIOS 1.2, microcode 0xa101111, Red Hat Enterprise Linux 8.7, Kernel 4.18, YASK v3.05.07. Test by Intel as of 03/27/23. 
  • BlackScholes
    • Intel Configuration: 1-node, 2x Intel® Xeon® Max 9480,HT On, Turbo On, SNC4, Total Memory 128 GB (8x16GB HBM2 3200MT/s), BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode revision=0x2c000020, CentOS Stream 8, Linux version 5.19.0-rc6.0712.intel_next.1.x86_64+server, Black Scholes v1.4. Test by Intel as of 9/2/2022. o AMD Configuration: 1-node, 2x AMD EPYC 9654, HT On, Turbo On, CTDP=360W, NPS=4, 1536GB DDR5-4800, BIOS 1.2, microcode 0xa101111, Red Hat Enterprise Linux 8.7, Kernel 4.18, Black Scholes v1.4. Test by Intel as of 03/27/23.
  • OpenFOAM
    • This offering is not approved or endorsed by OpenCFD Limited, producer and distributor of the OpenFOAM software via www.openfoam.com, and owner of the OPENFOAM® and OpenCFD® trademark
    • Intel Configuration: 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, SNC4, Total Memory 128 GB (8x16GB HBM2 3200MT/s), BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode revision=0x2c000020, CentOS Stream 8, Linux version 5.19.0-rc6.0712.intel_next.1.x86_64+server, OpenFOAM 8, Motorbike 20M @ 250 iterations, Motorbike 42M @ 250 iterations. Test by Intel as of 9/2/2022. o AMD Configuration: 1-node, 2x AMD EPYC 9654, HT On, Turbo On, CTDP=360W, NPS=4, 1536GB DDR5-4800, BIOS 1.2, microcode 0xa101111, Red Hat Enterprise Linux 8.7, Kernel 4.18, OpenFOAM 8, Motorbike 20M @ 250 iterations, Motorbike 42M @ 250 iterations. Test by Intel as of 03/27/23.