インテルの主力製品は、コンピュータを動作させる「頭脳」であるプロセッサーですが、パフォーマンスを左右する重要な要素としてシステムメモリー(DRAM)が挙げられます。特にサーバーではその傾向が顕著であり、プロセッサー・コアの増加速度がメモリー帯域幅の増加を上回ってしまうため、コアあたりのメモリー帯域幅が低下してしまいます。
これまで天気予測モデル、計算流体力学、特定の種類のAIなどの負荷の高いコンピューティング作業では、この不均衡さが障害となることがありました。
しかし、インテルは業界パートナーと数年間にわたる開発を経て、この問題を解消する技術を確立しました。その結果、これまでにない史上最速のシステムメモリーを開発し、新たなオープン業界標準として導入しました。最近発表されたデータセンター向けのインテル® Xeon® 6プロセッサーは、この新しいメモリー「MRDIMM」に対応した最初の製品であり、極めて容易なプラグアンドプレイの方法とともに高いパフォーマンスを実現します。
インテル コーポレーション データセンター&AI(DCAI)事業本部 Xeon担当プロダクトマネージャーのバヌ・ジャイスワル(Bhanu Jaiswal)は「高性能コンピューティングのワークロードではかなりの割合でメモリー帯域幅の制約を受けており、MRDIMMはそうした制約を受けやすいワークロードに特に効果を発揮します」と説明しています。
DDR5 MRDIMM (Multiplexed Rank Dual Inline Memory Module)のローンチの背景は次の通りです。
業界パートナーと協力し、システムメモリーに並列処理を導入
データセンターで使用される最も一般的なメモリーモジュール「RDIMM」には、最新のプロセッサーと同様に並列処理を可能にするリソースが搭載されていますが、これまであまり活用されてきませんでした。
インテル コーポレーション DCAI事業本部 メモリー・パスファインディング担当シニアプリンシパルエンジニアのジョージ・ヴェルギス(George Vergis)は「ほとんどのDIMMには、性能と容量のために2つのメモリランクがあり、それが最適な構成といえます」と述べています。
モジュール上のメモリーチップがそれぞれ異なるランクに属します。RDIMMでは、複数のランク間でデータを独立して保存・アクセスできますが、同時に使用することはできません。
そこでヴェルギスは未使用の並列リソースが存在するのであれば、それらを組み合わせて活用できないかと考えました。その結果、DRAMモジュールにマルチプレクサ(MUX)と呼ばれる小型のインターフェースチップを配置するアイデアが生まれ、メモリーの両ランクを通じて同時にデータを流すことが可能になりました。
さらに、メモリバッファチップ(MUXバッファ)がMRDIMMの電気負荷を統合することで、RDIMMと比較して高速なインターフェース動作が実現しました。さらに、メモリーの両ランクに並列アクセスが可能となり、帯域幅が従来の2倍に向上しました。
その結果、最大帯域幅が6,400MT/sから8,800MT/sへと約40%向上され、数世代分の技術的進歩に匹敵する飛躍的な進化を遂げた史上最速のシステムメモリーが誕生しました。
高速化した標準的なメモリーモジュール
本発表をふまえるとインテルが再びメモリー事業に参入するのではないかと推測することもできますが、その可能性はありません。インテルは創業当時、メモリー企業として、EPROMやDRAMなどの技術を発明してきましたが、現在はメモリー事業から撤退しています。
しかし、インテルは撤退以降も常にさまざまなコンピューティングコンポーネントを相互運用可能かつ高性能にするため、「業界全体の底上げ」を目指す取り組みを続けています。ヴェルギスは、メモリー業界でオープンスタンダードを定めるJEDECの理事会にインテルの代表として参画しています。ヴェルギスは2018年にDDR5標準の策定への貢献によりJEDEC賞を受賞し、現在はDDR6の開発にも取り組んでいます(今年、JEDECはオープンスタンダードの推進における功績をたたえ、インテルのCEOであるパット・ゲルシンガーにも賞を贈りました)。
ヴェルギスと彼の共同研究者たちは2018年にこの開発を始め、2021年までにプロトタイプでコンセプトを証明しました。 インテルはメモリ・エコシステムと協力して最初のコンポーネントを製造し、2022年後半に新しいオープンスタンダードとしてJEDECに仕様を寄贈しました。
MRDIMMの特筆すべき点は、その使いやすさです。従来のRDIMMと同じコネクターおよびフォームファクターを採用しており、MUXチップを搭載した場合でもモジュール上の空きスペースにおさまるため、マザーボードの変更は一切不要です。
さらにMRDIMMは、RDIMMと同様に高度なエラー修正機能や信頼性、可用性、保守性(RAS)機能も備えています。ヴェルギスは、データバッファを介して別々のリクエストが多重化されても、データの完全性は維持されると説明しています。
これにより、データセンターの顧客は、新しいサーバーを注文する際にMRDIMMを選択するか、既存のサーバーのRDIMMをMRDIMMに交換することで、コードを変更せずに性能向上を実現できます。
インテル® Xeon® 6 プロセッサーと MRDIMMを組み合わせ、非常に高いパフォーマンスを実現
MRDIMMとの連携のためには、MRDIMMで動作可能なCPUが必要となります。その先駆けとなったのが、今年発表されたP-coresを搭載したインテル® Xeon® 6 プロセッサー(開発コードネーム:Granite Rapids)です。
最近行われた検証では、インテル® Xeon® 6 プロセッサーを搭載した同じ仕様のシステムをMRDIMMとRDIMMで比較したところ、MRDIMMを搭載したシステムは最大で33%高速に処理を完了しました。
ジャイスワルは、「MRDIMMがもたらす帯域幅の改善は、小型言語モデルや従来型のディープラーニング、推奨システムタイプのAIワークロードに非常に適しており、Xeon上で簡単に動作して大幅な性能向上が得られます」と説明しています。
主要なメモリーベンダーはすでにMRDIMMを市場に投入しており、他のメモリー・メーカーも順次展開予定です。NECなどのシステム・メーカーがサポートする中、量子科学技術研究開発機構や核融合科学研究所といった高性能コンピューティング研究所が、MRDIMMを搭載したPコア搭載のインテル® Xeon® 6 プロセッサーを積極的に採用しています。ジャイスワルは、「インテルは間違いなく他社をリードしており、システム・メーカーやメモリー・メーカーの強力なエコシステムに支えられています」と述べています。