インテル® データセンター GPU Max シリーズ
インテル® データセンター GPU Max シリーズは、インテルで最も高性能かつ高密度の汎用ディスクリート GPU であり、1 つのパッケージに 1,000 億以上のトランジスターを搭載し、さらにインテルの基礎となる GPU コンピューティング・ビルディング・ブロックである最大 128 の Xe コアを搭載して、最大限の効果を発揮します。
インテル® データセンター GPU Max シリーズ
主な機能
インテル® データセンター GPU Max シリーズは、最も困難なハイパフォーマンス・コンピューティング (HPC) と AI ワークロードに対応するように設計されています。インテル® Xe Link の高速でコヒーレントなユニファイド・ファブリックは、あらゆるフォームファクターを実行する柔軟性を提供し、スケールアップとスケールアウトを可能にします。
最大 408MB の L2 キャッシュ
ディスクリート SRAM テクノロジーに基づく最大 408MB の L2 キャッシュ (Rambo)、最大 64MB の L1 キャッシュ、最大 128GB の高帯域幅メモリーにより、大容量と高帯域幅を実現します。
内蔵レイ・トレーシング・アクセラレーション
各インテル® データセンター GPU Max シリーズに最大 128 のレイ・トレーシング・ユニットを搭載し、科学的可視化とアニメーションを高速化。
インテル® Xe Matrix Extensions (XMX)
ディープ・シトリック・アレイで構築されたインテル® Xe Matrix Extensions (XMX) により、AI ワークロードを高速化し、ベクトルとマトリクス機能を単一のデバイスで実現します。
インパクトを最大化
インテル® データセンター GPU Max シリーズは、圧倒的なパフォーマンスで科学や発見を高速化します。
最大
2○
インテル® Max シリーズ GPU ラージ L2 キャッシュにより、HPC と AI ワークロードのパフォーマンスが競合製品よりも向上。1
最大
12.8○
インテル® oneAPI ツールにより最適化された 6 つのインテル® データセンター GPU Max シリーズにカーネルをオフロードすることで、インテル® Max シリーズの CPU で実行する LAMMPS ワークロードのパフォーマンスが、第 3 世代インテル® Xeon® プロセッサー・ファミリーよりも向上。2
最大
256○
クロックあたりの INT8 オペレーション。内蔵のインテル® XMX により、1 クロックあたり最大 256 INT8 オペレーションで、AI トレーニングと推論を高速化します。
最大
2○
インテル® Max シリーズ GPU ラージ L2 キャッシュにより、HPC と AI ワークロードのパフォーマンスが競合製品よりも向上。1
最大
12.8○
インテル® oneAPI ツールにより最適化された 6 つのインテル® データセンター GPU Max シリーズにカーネルをオフロードすることで、インテル® Max シリーズの CPU で実行する LAMMPS ワークロードのパフォーマンスが、第 3 世代インテル® Xeon® プロセッサー・ファミリーよりも向上。2
最大
256○
クロックあたりの INT8 オペレーション。内蔵のインテル® XMX により、1 クロックあたり最大 256 INT8 オペレーションで、AI トレーニングと推論を高速化します。
インテル® データセンター GPU Max シリーズのデモとビデオ
マシンラーニング用の Aurora ブレードのデモ
インテル® Max シリーズ・プロセッサーを搭載した 10,000 枚のブレードサーバーが、アルゴンヌ国立研究所の Aurora スーパーコンピューターに力を与えます。マシンラーニング推論プロセスが、トレーニング済みの AI モデルを使用して、マウス脳内の構造を特定し、3D 視覚化を作成する方法をプレビューします。
アルゴンヌ国立研究所からの Aurora のアップデート
アルゴンヌ国立研究所の関連研究室ディレクターを務める Rick Stevens 博士が、Aurora スーパーコンピューターのステータスとインテル® データセンター GPU Max シリーズに関する最新情報を共有します。
LAMMPS における材料科学の生産性
6 つのインテル® データセンター GPU Max シリーズにカーネルをオフロードし、新素材や改良素材を追求することで、第 3 世代インテル® Xeon® プロセッサー・ファミリーよりも最大 12.8 倍のパフォーマンス向上を達成した LAMMPS ワークロードをご覧ください。2
ソフトウェアおよびツール
コード移行ツールと最新のコンパイラー、ライブラリー、プロファイラー、最適化された AI フレームワークなど、業界で最も柔軟な CPU を可能にしているオープン・ソフトウェア・ソリューションをご覧ください。最新の HPC および AI ソフトウェア・デベロッパー・ツールについては、インテル® データセンター GPU Max シリーズのソフトウェアを参照してください。
インテルの HPC ストーリー
インテルの業界最先端の HPC ポートフォリオは、次世代のコンピューティング・イノベーションを促進するように設計されています。これらのテクノロジーは、幅広い要素全体での新たな飛躍的進歩を実現するよう最適化されており、イノベーターが障壁を突破して、全く新しい方法で複雑な問題を解決するのに役立ちます。
15 以上のインテル® データセンター GPU Max シリーズ OEM デザイン
通知および免責事項 34
免責事項
ワークロードと構成については、intel.com/performanceindex (Events: Supercomputing 22) (英語) を参照してください。実際のパフォーマンスはこのテスト結果と異なる場合があります。
LAMMPS (羊水、銅、DPD、液晶、ポリエチレン、タンパク質、Stillinger-Weber、Tersoff、水)
- インテル® Xeon® 8380: 2022年10月11日時点でのインテルによるテストで測定。1 ノード、2x インテル® Xeon® 8380 CPU、HT 有効、ターボ有効、NUMA 構成 SNC2、総メモリー 256 GB (16x16GB 3200MT/s、デュアルランク)、BIOS バージョン SE5C620.86B.01.01.0006.2207150335、ucode リビジョン=0xd000375、Rocky Linux 8.6、Linux バージョン 4.18.0-372.26.1.el8_6.crt1.x86_64、LAMMPS v2021-09-29 cmkl:2022.1.0、icc:2021.6.0、impi:2021.6.0、tbb:2021.6.0; スレッド / コア:; ターボ有効; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high;
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー: 2022年9月29日時点でのインテルによるテストで測定。1 ノード、2x インテル® Xeon® 8480+、HT 有効、ターボ有効、SNC4、総メモリー 512 GB (16x32GB 4800MT/s, DDR5)、BIOS バージョン SE5C7411.86B.8713.D03.2209091345、ucode リビジョン=0x2b000070、Rocky Linux 8.6、Linux バージョン 4.18.0-372.26.1.el8_6.crt1.x86_64、LAMMPS v2021-09-29 cmkl:2022.1.0、icc:2021.6.0、impi:2021.6.0、tbb:2021.6.0; スレッド / コア:; ターボ無効; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high;
- インテル® Xeon® CPU Max シリーズ: 2022年9月29日時点でのインテルによるテストで測定。1 ノード、2x インテル® Xeon® Max 9480、HT 有効、ターボ有効、NUMA 構成 SNC4、総メモリー 128 GB (HBM2e at 3200 MHz)、BIOS バージョン SE5C7411.86B.8424.D03.2208100444、ucode リビジョン=0x2c000020、CentOS Stream 8、Linux バージョン 5.19.0-rc6.0712.intel_next.1.x86_64+server、LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; スレッド / コア:; ターボ無効; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high;
インテルは、サードパーティーのデータについて管理や監査を行っていません。正確さを評価するには、他のソースを参照する必要があります。