インテル® Xeon® スケーラブル・プロセッサー・ファミリーとインテル® AVX-512
従来、AI、HPC、分析、ネットワークなどの負荷の高いワークロードには、パフォーマンスと成果を実現するための専用のハードウェアとディスクリート・アクセラレーターへの多大な投資が必要でした。このアプローチにより、多くの組織がパフォーマンスの需要を満たすことができる一方で、コストとスケーラビリティーの問題が、完全な成功を妨げる可能性があります。インテル® AVX-512 は、P-cores 搭載の、近く発売されるインテル® Xeon® 6 プロセッサーを含む、最新のインテル® Xeon® プロセッサーに搭載されています。
インテル® AVX-512 (インテル® Xeon® スケーラブル・プロセッサー・ファミリーの統合機能) は、高度なワークロードを簡素化し、コスト効率を向上して導入する支援をするために、AI、分析、科学シミュレーション、財務シミュレーション、その他のベクトルベースの演算を含むコンピューティング負荷の高いタスク向けに内蔵アクセラレーションを提供します。
インテル® AVX-512 は、最新のインテル® Xeon® プロセッサーで利用可能なインテル® HPC エンジンおよびインテル® AI エンジンに不可欠な要素であり、P-cores 搭載インテル® Xeon® 6 プロセッサーが近日中に公開されます。これらのパワフルな機能は、CPU を最大限に活用するのに役立つため、最適な効率と ROI により、革新的なユースケースを支援できます。内蔵アクセラレーターは、ディスクリート・アクセラレーターよりも使用が複雑でないことが多く、ソリューションの設計者が、価値実現までの時間を短縮するのに役立ちます。
AI、分析、財務シミュレーション、科学シミュレーションなどの高度なワークロードをサポートするオプションを検討する際には、内蔵アクセラレーターのオプションを評価することから始めます。ワークロードが、これらのアクセラレーターを活用して、インテル® Xeon® プロセッサーで効果的に実行される場合、追加のアクセラレーション・ハードウェアは必要ありません。これにより、導入と運用のコストを削減すると同時に、統合を簡素化できます。
インテル® AVX-512 の仕組み
インテル® AVX-512 アクセラレーターは、ベクトル処理を多用するワークロード向けのパフォーマンスを向上できる命令セットです。ベクトル処理は、多くの高度なコンピューティング・タスクの不可欠な部分であり、多数の整数や浮動小数点数を並列に演算操作します。
インテル® AVX-512 は、512 ビットのベクトル操作の広い機能を備え、専用のハードウェアを導入する必要なく、最も負荷の高いコンピューティング・タスクを処理できます。このアクセラレーターの大規模なレジスターは、8 つの 64 ビットと 16 の 32 ビットの整数に加えて、32 の倍精度浮動小数点数と 64 の単精度浮動小数点数をサポートします。
また、インテル® AVX-512 は、最大 2 つの 512 ビットの融合積和演算 (FMA) ユニットも提供します。ベクトル処理の幅を 2 倍にすることで、レジスターの数が前世代のインテル® AVX2 と比べて 2 倍になっています。
ビジネス成果を向上させるインテル® AVX-512 の利点
インテル® AVX-512 は、ディスクリート・アクセラレーター導入の複雑さとコストの必要なしに、ROI を最適化し、必要とする高度なワークロードのパフォーマンスを実現します。組織が、アプリケーションの構築と AI や HPC などの次世代の機能の活用を検討している場合、インテル® AVX-512 は、これらのアプリケーションを大規模に導入して運用するための重要なツールとなります。同様に、顧客に販売するためのソフトウェア・ソリューションを構築している場合でも、インテル® AVX-512 のサポートは、パフォーマンスとコスト効率の最適なバランスで、製品導入を支援します。例えば、OpenFOAM アプリケーションの製造分野における HPC パフォーマンスについて見ると、P-cores 搭載の、近く発売されるインテル® Xeon® 6 プロセッサーでは、第 5 世代 インテル® Xeon® プロセッサーと比較して 2.34 倍、第 2 世代 インテル® Xeon® プロセッサーと比較して7.55 倍の HPC パフォーマンスを実現できます。 第 5 世代インテル® Xeon® スケーラブル・プロセッサー1について見ると、第 3 世代インテル® Xeon® プラットフォームに比べ、第 5 世代インテル® Xeon® スケーラブル・プラットフォームでは、NAMD パフォーマンスが最大 3 倍向上しています。2
使用事例
インテル® AVX-512 は、科学的なシミュレーション、金融分析、人工知能 (AI) / ディープラーニング、3D モデリングと分析、画像およびオーディオ / ビデオ処理、暗号化、データ圧縮などのワークロード向けに、データセンターのパフォーマンスを高速化できます。
多くのインテルのお客様が、インテル® AVX-512 を活用して、組織により優れた成果を実現しています。インテルのカスタマー・スポットライト・ライブラリーにアクセスして、インテル® AVX-512 がパフォーマンス、ROI、スケーラビリティーの向上をどのように実現するか、実環境における例をご覧ください。
インテル® AVX-512 スタートガイド
インテル® AVX-512 の活用は、ソフトウェアのレベルから始まります。組織が内部使用または顧客販売向けにソフトウェアを作成している場合、インテルは幅広いサポートリソースを提供して、インテル® AVX-512 のサポートの実装を支援します。
開始するのに最適な場所の 1 つは、詳細なワークロード・チューニング・ガイドです。これは、特定のタイプのワークロード全体での、インテル® AVX-512 によるパフォーマンスの向上に関する手順を説明します。これらのガイドには、次のものが含まれます。
- ディープラーニング AI のパフォーマンスの向上
- NAMD 分子動力学アプリケーションの構築と実行
- LAMMPS のチューニング
- ClickHouse 分析データベース管理システムのパフォーマンスの最適化
- DPDK (データプレーン開発キット) による Open vSwitch (OvS) のチューニング
すべてのインテル® Xeon® スケーラブル・プロセッサー・ファミリーのチューニング・ガイドは、開発者向けソフトウェア・ツール・カタログからアクセスできます。インテル® AVX-512 およびその他のインテル® 命令セットの拡張機能について詳しくは、インテル® Architecture Instruction Set Extensions Programming Reference を参照してください。
また、インテル® oneAPI HPC ツールキット、インテル® oneAPI マス・カーネル・ライブラリー、およびインテル® oneAPI AI アナリティクス・ツールキットなどのインテル® oneAPI ツールキットとコンポーネントも提供しており、開発作業の効率化を支援しています。
最後に、インテル® デベロッパー・ゾーン・テクニカル・ライブラリーでは、インテル® アドバンスト・ベクトル・エクステンションの技術リソースの全リポジトリーをご覧いただけます。
インテル® AVX-512 を今すぐ試す
参考資料を参照することに加えて、インテル® デベロッパー・クラウドを使用して、インテル® ハードウェア、インテル® AVX-512、その他の統合アクセラレーション機能を試すことができます。
また、ワークロードの学習、プロトタイピング、テスト、および実行のためのこの無料のオンライン・プラットフォームには、多くのインテル® ソフトウェア開発ツールキット、ツール、ライブラリー向けのサポートも含まれています。
インテル® デベロッパー・クラウドにアクセスして登録し、高度なワークロード向けの完全なプラットフォームでの実践的な経験を積むことができます。
インテル® AVX-512 で、高度なワークロードをより効率的に支援
インテル® AVX-512 は、ソフトウェア・ソリューションで高度な機能を実現することを目指す上で、専用のアクセラレーター導入のコストと複雑さの必要なしにそれを可能にするものです。
インテル® Xeon® スケーラブル・プロセッサー・ファミリーのこの強力な統合機能をサポートすることで、組織 (または顧客) は、分析、AI、ネットワーク、HPC 全体での次世代テクノロジーの活用を、よりコスト効率と ROI に最適化された方法で実現することができます。