2024年9月24日に米国で発表された資料の抄訳です。
ニュースハイライト
- AIやHPCワークロードのパフォーマンスを倍増させるインテル® Xeon® 6 プロセッサー(P-cores採用)を発表
- 新製品のインテル® Gaudi® 3 AI アクセラレーターは、LLaMa 2 70Bの推論において、H100と比較して最大20%のスループットの向上、2倍の価格性能比を実現*1
AIがさまざまな業界を変革しつづける中、コスト効果が高く、短期間での開発と導入が可能なインフラストラクチャーに対する企業のニーズはますます高まっています。インテルは、この需要に応えるためにインテル® Xeon® 6 プロセッサー(P-cores採用)とインテル® Gaudi® 3 AI アクセラレーターを発表しました。これらの製品により、最適な電力効率(パフォーマンス/ワット)とより低い総保有コスト(TCO)を特徴とする、強力なAIシステムの提供を実現します。
インテル コーポレーション 上席副社長 兼 データセンター&AI事業本部 本部長、ジャスティン・ホタード(Justin Hotard)は「AIに対する需要がデータセンターの大幅な変革を促し、業界ではハードウェア、ソフトウェア、開発者ツールの選択肢を求める声が高まっています。インテルは、インテル® Xeon® 6 プロセッサー(P-cores採用)とインテル® Gaudi® 3 AI アクセラレーターの発表を通じて、顧客がすべてのワークロードをより高いパフォーマンス、効率性、セキュリティー環境で実行できるオープンなエコシステムの形成に取り組んでいます」と述べています。
インテル® Xeon® 6 プロセッサー(P-cores採用)とインテル® Gaudi® 3 AI アクセラレーターの登場
インテルのAIインフラストラクチャーの最新の成果として、データセンター向け製品ポートフォリオに次の2つの製品が加わりました。
- インテル® Xeon® 6 プロセッサー(P-core採用):演算負荷の高いワークロードの効率的な処理に特化して設計されたインテル® Xeon® 6 プロセッサーは、前世代製品と比較して2倍のパフォーマンスを実現*2します。コア数の増加や倍増したメモリー帯域幅、すべてのコアに組み込まれたAIアクセラレーション機能を特長とし、エッジ、データセンター、クラウドまで幅広い環境にわたり、AIのパフォーマンス要件に応えます。
- インテル® Gaudi® 3 AI アクセラレーター:大規模生成AI向けに最適化されたインテル® Gaudi® 3 AI アクセラレーターは、64個のTensorプロセッサー・コア(TPC)と8個の行列乗算エンジン(MME)を実装し、ディープ・ニューラル・ネットワーク(DNN)の演算処理を加速させます。さらに、学習処理と推論用に128GBのHBM2eメモリーを備え、ネットワーキングの拡張を可能にする24ポートの200Gbイーサネットを搭載しました。またインテル® Gaudi® 3 AI アクセラレーターは、PyTorchフレームワークや、先進のHugging Face Transformersモデル、Diffusersモデルとのシームレスな互換性も備えています。インテルは、先日、IBMと連携し、インテル® Gaudi® 3 AI アクセラレーターをIBM Cloud上のサービスとして展開すると発表しました。この連携を通じて、両社はパフォーマンスの向上に加え、AIの活用と拡張にかかる総保有コスト(TCO)の削減も目指します。
もっと:Intel Xeon 6 with P-cores and Gaudi 3 AI Accelerators (Press Kit) | Leadership performance with Intel Xeon 6900 P-core series (Fact Sheet) | 日本におけるメーカー様からのコメント (五十音順、敬称略) (Quote Sheet)
TCOでの優位性も備えたAIシステムの拡張
大規模なAI導入に際しては、柔軟な実装手段の選択、コスト・パフォーマンスの面での競争優位性、使いやすいAIテクノロジーなど、さまざまな検討事項が生じます。インテルは、x86ベースの強力なインフラストラクチャーと広範なオープン・エコシステムを有しています。このため、最適なTCOとパフォーマンス/ワットを備えた高価値なAIシステムの構築を目指す企業を支えることができます。この顕著な例として、GPUアクセラレーテッド・サーバーの73%に、ホストCPUとしてインテル® Xeon® プロセッサーが搭載されています*3。
インテルは効率的なAI導入を求める顧客の固有のニーズに応えるために、Dell Technologies、Supermicroをはじめとする業界トップクラスのシステム・メーカーとのパートナーシップを通じて、共同エンジニアリングに基づくシステムの開発を行っています。Dell Technologiesは現在、インテル® Gaudi® 3 AI アクセラレーターとインテル® Xeon® プロセッサーを活用した検索拡張生成(RAG)ベースのソリューションを共同で設計しています。
共同エンジニアリングの取り組みにより、プロトタイプと本番環境のギャップを解消
生成AIソリューションをプロトタイプから本番環境に対応するシステムへと移行させるためには、リアルタイムの監視、エラー処理、ログ記録、セキュリティー、拡張性などの課題に対処する必要があります。インテルではシステム・メーカーやパートナーとの共同エンジニアリングを通じて、このような課題の解決に努め、本番環境で動作するRAGソリューションを提供します。
Open Platform for Enterprise AI(OPEA)プラットフォームで構築されたRAGソリューションは、スケーラブルなRAGシステムにOPEAベースのマイクロサービスを統合できるだけでなく、インテル® Xeon® プロセッサーとインテル® Gaudi® アクセラレーターを搭載したAIシステムに最適化でき、また顧客がKubernetesからRed Hat OpenShift AI、Red Hat Enterprise Linux AIまでアプリケーションをスムーズに実装できるように設計されています。
企業向けAIアプリケーションの利用を拡大
インテル® Tiber™ デベロッパー・クラウドで提供されるポートフォリオには、クラウドからエッジまであらゆるAI環境で、アクセスやコスト、複雑さ、セキュリティー、効率性、拡張性など、さまざまな課題に対処するビジネス向けソリューションが含まれています。インテル® Tiber™ デベロッパー・クラウドではすでに、インテル® Xeon® 6 プロセッサーの評価とテストを行うプレビュー版システムの提供を開始しました。さらに、一部の顧客を対象に、AIモデルの導入検証用にインテル® Gaudi® 3 AI アクセラレーターの早期アクセスを提供します。また、大規模な本番環境向けのインテル® Gaudi® 3 AI アクセラレーター搭載クラスターの展開を次の四半期に開始する予定です。
新しいサービスには、信頼性の高いAIアプリケーションの開発を可能にするSeekrのエンド・ツー・エンドAIプラットフォーム「SeekrFlow」が含まれます。最新のアップデートでは、インテル® Gaudi®の最新リリースと、PyTorch 2.4、Intel oneAPI、AIツール2024.2を搭載したJupyter Notebookが提供されます。これには、新しいAIアクセラレーション機能とインテル® Xeon® プロセッサーのサポートが含まれています。
*1 https://www.intel.com/processorclaims/(英語):インテル® Gaudi® 3 AI アクセラレーターのセクションを参照。結果は異なる場合があります。
*2 https://www.intel.com/processorclaims/(英語):Intel® Xeon® 6 のセクションを参照。結果は異なる場合があります。
*3 出典:IDC Server Tracker report, based on Q1’24 system volume