第 2 世代インテル® Xeon® スケーラブル・プロセッサー

データ中心イノベーションのための基盤

データ中心の時代の変革を支援

進化を続けるデジタルの世界では、ビジネス、産業、科学、エンターテインメントの各分野で革新的なテクノロジー・トレンドが生まれており、世界経済への影響力も増しています。2020 年時点の Global 2000 企業の約半数にとって、デジタルによって機能強化された製品、サービス、体験を生み出すことができるかどうかが、ビジネス成功のカギとなることが予想されます。1 大手企業は、導入するテクノロジーや利用モデルを発展させることで、自社のデジタル収益を 80% 増やせると見込んでいます。2 こうした世界的な変革により、柔軟性の高いコンピューティング、ネットワーキング、ストレージに対する需要が急速に拡大しています。

このグローバルな変革により、柔軟なコンピューティング、ネットワーキング、ストレージに対する需要が急速に拡大しています。今後のワークロードには、即応性と幅広いパフォーマンス要件に応じてシームレスに拡張できるインフラストラクチャーが不可欠です。生み出されるデータ / 消費されるデータの急増、クラウド規模のコンピューティングの急速な拡大、5G ネットワークの台頭、ハイパフォーマンス・コンピューティング (HPC) と人工知能 (AI) の用途拡大などを考えると、現在のデータセンターやネットワークを今すぐ進化させなければ、競争の激しい業界において後れをとってしまうことは必然です。このようなニーズが、柔軟性を素早く発揮してスケーリングを実現できる、将来に対応した最新のデータセンターやネットワークのアーキテクチャーを推し進めています。

インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、パワフルなデータセンター・プラットフォームの基盤として、俊敏性と拡張性を飛躍的に向上させます。既存の価値基準を一新する設計を持つ、この革新的なプロセッサーは、コンピューティング、ストレージ、メモリー、ネットワーク、セキュリティーにおいて新たなレベルのプラットフォーム・コンバージェンスと機能を実現します。企業やクラウド / 通信サービス・プロバイダーは、機能が豊富で汎用性の高いプラットフォームを利用することで、意欲的なデジタル・イニシアチブの推進が可能になります。

効率性の向上と TCO の削減
エンタープライズ・アプリケーションから科学技術計算アプリケーションまで、あらゆるインフラストラクチャーを対象とするインテル® Xeon® スケーラブル・プロセッサー・ファミリーは、データセンターを最新化して運用効率を高めることを目的に設計されており、総保有コスト (TCO) の削減やユーザーの生産性向上にもつながります。インテル® Xeon® スケーラブル・プロセッサー・ファミリーで構築されたシステムは、前世代に比べ、パフォーマンスと画期的な機能が強化されたアジャイルサービスを提供するように設計されています。

インサイトを支援するパフォーマンス

組み込みの AI アクセラレーションを備えた、業界をリードするワークロード最適化プラットフォームは、マルチクラウドからインテリジェント・エッジまで、データ中心の時代にシームレスなパフォーマンス基盤を提供します。また、第 2 世代インテル® Xeon® スケーラブル・プロセッサーを搭載したインテル® Xeon® スケーラブル・プロセッサー・フ​​ァミリーは、一貫性があり、普及し、画期的なパフォーマンスの新しいレベルを実現します。

新しいインテル® Xeon® Platinum 9200 プロセッサー

第 2 世代インテル® Xeon® スケーラブル・プロセッサー

第 2 世代インテル® Xeon® スケーラブル・プロセッサーは、多様なワークロードに対して一貫したパフォーマンスを提供します

  課題 インテル® Xeon® スケーラブル・プロセッサー・ファミリーの優位性
エンタープライズとクラウド

互換性のある仮想インフラストラクチャーで複雑性を最小限に抑制

厳しい顧客 SLA に対応

導入が容易。インテルの VM は他のインテル® テクノロジー対応サーバーと共存可能。

迅速な応答時間。

HPC
ベクトル浮動小数点のパフォーマンスと効率を最大化 少ないサーバーでも高性能。
ストレージ 的確なストレージ応答を実現 的確なパフォーマンス。コア、キャッシュ、メモリー、I/O を 1 つのダイに搭載。
通信 多様なサービスを効率的に提供 アプリケーション、制御、パケット、信号処理に必要な機能を搭載したプラットフォームにより、優れた効率性とハードウェア・アクセラレーションを実現。

画期的なメモリー・イノベーションのサポート
パフォーマンスの新しい基盤は、インテルの画期的なインテル® Optane™ DC パーシステント・メモリー、新しいクラスのメモリー、およびデータ中心のクラス環境向けに設計されたストレージ・イノベーションのサポートから始まります。インテル® Optane™ DC パーシステント・メモリーは、最大 512 GB の個々のモジュール容量を備え、従来の DRAM と組み合わせると、最大 36 TBのシステムレベルのメモリ容量を提供できます。インテル® Optane™ DC パーシステント・メモリーは、前例のないシステムメモリ容量を手頃な価格で実現し、ワークロード処理とサービス提供を高速化することで DRAM メモリを補完します。

インテル® Optane™ DC パーシステント・メモリー搭載の新しい第 2世代インテル® Xeon® スケーラブル・プロセッサー 3 4

基本的な機能強化

  • コアあたりのパフォーマンスの向上: 最大 56 コア (9200 シリーズ) および最大 28 コア (8200 シリーズ) で、コンピューティング、ストレージ、ネットワークの使用量全体にわたるコンピューティング集中型ワークロードの高性能とスケーラビリティを実現
  • メモリー帯域幅 / 容量の拡大: インテル® Optane™ DC パーシステント・メモリーをサポートし、従来の DRAM と組み合わせると最大 36 TB のシステムレベルのメモリー容量をサポートします。メモリーの帯域幅と容量が 50% 増加しました。最大 2933 MT/ 秒 (1 DPC) の速度で、ソケットごとに 6 つのメモリーチャネルと最大 4 TBの DDR4 メモリをサポート
  • I/O の拡張: 48 レーンの PCIe* 3.0 帯域幅と I/O 集約型の厳しいワークロード向けのスループット
  • インテル® Ultra Path インターコネクト (Intel® UPI): 4 つのインテル® Ultra Path インターコネクト (Intel® UPI) (9200 シリーズ) および最大 3 つのインテル® Ultra Path インターコネクト (Intel® UPI) (8200 シリーズ) チャネルがプラットフォームのスケーラビリティを向上させます。最大 2 つのソケット (9200 シリーズ) と最大 8 つのソケット (8200シリーズ) まで。 インテル® Ultra Path インターコネクト (インテル® UPI) は、スループットとエネルギー効率の改善の完璧なバランスを提供します
  • VNNI を搭載したインテル® Deep Learning Boost (インテル® DL ブースト): Vector Neural Network Instruction (VNNI) を備えた新しいインテル® ディープラーニングブースト (インテル®DLブースト) は、人工知能の推論パフォーマンスを強化し、前世代 [d:7317]、第 2 世代インテル® Xeon® スケーラブルに比べて最大 30 倍のパフォーマンス向上を実現プロセッサーは、データセンター全体、エッジとバックに AI の準備を整えるのに役立ちます
  • インテル® インフラストラクチャー・マネジメント・テクノロジー (インテル® IMT): リソース管理のフレームワークであるインテル® インフラストラクチャー・マネジメント・テクノロジー (インテル® IMT) は、プラットフォームレベルの検出、レポート、および構成をサポートする複数のインテル機能を組み合わせています。このハードウェア支援型の監視、管理、およびリソース制御機能により、データセンターのリソースの効率性と使用率が向上します。
  • データセンター向け◊​​​インテル®セキュリティー・ライブラリー (インテル® SecL-DC): ソフトウェア・ライブラリーとコンポーネントのセットであるインテル®SecL-DC は、インテルのハードウェアベース・セキュリティ機能を有効にします。オープンソースのライブラリはモジュール式であり、一貫したインターフェイスを備えています。顧客とソフトウェア開発者は、クラウド規模でインテルのハードウェア強化のセキュリティ機能を使用して、プラットフォームを保護し、データを保護するソリューションをより簡単に開発するために使用できます。
  • インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512): インテル® AVX-512 では、旧世代のインテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) と比べてクロックサイクル当たりの FLOPS が倍増しており、各種アプリケーション (モデリングとシミュレーション、データ分析とマシンラーニング、データ圧縮、仮想化、デジタルコンテンツ作成など) における高負荷の演算タスクに対応できるようパフォーマンスとスループットが向上しています。
  • 妥協のないセキュリティ: すべての安全なデータトランザクションで暗号化のオーバーヘッドとパフォーマンスを制限します

革新的な統合

プラットフォーム統合により、インフラストラクチャー全体でパフォーマンスとレイテンシーが向上しています。

  • インテル® QuickAssist テクノロジー (インテル® QAT) 搭載: チップセット・ベースのハードウェア・アクセラレーションにより、増え続ける圧縮や暗号化のワークロードに対応して優れた効率性を実現すると同時に、サーバー / ストレージ / ネットワーク・インフラストラクチャー全体でデータ伝送とデータ保護が強化されます。
  • スケーラブルな iWARP* RDMA* を搭載した統合型インテル® イーサネット: 最大 4 つの 10 Gbps 高速イーサネット・ポートを提供し、高いデータ・スループットと低レイテンシのワークロードを実現します。ソフトウェア・デファインド・ストレージ・ソリューション、NVM Express* over Fabric ソリューション、仮想マシンの移行に最適です。チップセットに統合

業界をリードするメモリーとストレージのサポート

ストレージのイノベーションが、大量のデータを必要とするワークロードの効率性とパフォーマンスを飛躍的に高めます。

  • インテル® Optane™ DC パーシステント・メモリーのサポート: 画期的なメモリとストレージメモリの革新により、高速ストレージソリューションに画期的な機能を提供します。インテル® Optane™ DC SSDと組み合わせて、究極のストレージとデータパフォーマンスを実現
  • インテル® Optane™ DC SSD およびインテル® QLC 3D NAND ソリッドステート・ドライブのサポート: 業界をリードする高スループット、低遅延、高 QoS、および超高耐久性の組み合わせにより、データアクセスのボトルネックを解消します
  • インテル® ボリューム・マネジメント・デバイス (インテル® VMD) (インテル® VMD) で次世代ストレージを安心して導入: システムをシャットダウンせずに PCIe バスから NVMe SSD をホットスワップできます。さらに、標準化された LED 管理により、SSD ステータスが迅速に識別できます。この共通性により、エンタープライズ RAS (信頼性、可用性、保守性) 機能を NVMe SSD で利用できるようになるため、次世代ストレージを安心して導入できます。
  • インテル® インテリジェント・ストレージ・アクセラレーション・ライブラリー (インテル® ISA-L): 暗号化など、ストレージのオペレーションを最適化して、ストレージのパフォーマンスを向上させます。

パフォーマンス、拡張性をさらに高める補完的な製品

インテルは、この新しいプロセッサーを補完するハードウェアとソフトウェアを幅広く提供しています。

  • インテル® イーサネット 800 シリーズ製品は、アプリケーション・デバイス・キュー (ADQ) で最大 100 GbE のポート速度をサポートし、高速データ通信の遅延に敏感なワークロードに対応します。Data Plane Developer Kit (DPDK) は、NFV アクセラレーション、高度なパケット転送、非常に効率的なパケット処理のために、インテル® イーサネット 800 シリーズ製品全体でサポートされています。
    詳細については、intel.com/ethernet を参照してください。
  • インテル® FPGAは、仮想スイッチング、ネットワークサービス、データ分析、AI などの低遅延アプリケーション向けに、柔軟でプログラム可能なアクセラレーションを提供します。
    詳細については、intel.com/fpga を参照してください。
  • 開発者は、一般的なコンピューティングや高並列コンピューティングのためのさまざまなソフトウェア・ツールとライブラリーを使用して、インテル® アーキテクチャー用にアプリケーションを最適化できます。
    詳細については、software.intel.com を参照してください。

強化されたプラットフォーム・トラスト
データ・セキュリティーやプライバシーに関して増え続ける懸念や監視の強化に対処している企業にとって、データとプラットフォームの信頼性と保護は大きな関心事です。 インテル® Xeon® スケーラブル・プロセッサー・ファミリーにより、プラットフォーム・データの保護、弾力性、稼動率を備えた信頼性の高いインフラストラクチャーを構築できます。

あらゆるワークロードに対してデータ保護と信頼性を向上:

  • 強化されたインテル® Run Sure テクノロジー: 新機能により、企業の最も重要なワークロードのために高度な信頼性、可用性、保守性 (RAS) を提供し、サーバー稼動率を向上させます。エンハンスト MCA とリカバリー、適応性のあるマルチデバイス・エラー訂正、診断、従来なら致命的であったエラーの修復などのハードウェア支援型機能。さらに、メモリー・サブシステム内でデータ完全性の確保を支援
  • 統合されたインテル® QuickAssist テクノロジー (インテル® QAT) とインテル® プラットフォーム・トラスト・テクノロジー (インテル® PTT) が組み込まれたインテル® キー・プロテクション・テクノロジー (インテル® KPT): データの保存時 / 使用中 / 転送中に効率性に優れたキー・プロテクションおよびデータ保護機能を提供。ハードウェア支援型プラットフォームのセキュリティーを実現します。
  • One-Touch Activation 対応 インテル® インテル® トラステッド・エグゼキューション・テクノロジー (インテル® TXT): 強化されたプラットフォームセキュリティ、インテル® インテル® トラステッド・エグゼキューション・テクノロジー (インテル® TXT) のシンプルでスケーラブルな展開を提供

データセンターを流れるデータリッチなワークロードが増えると、この総合的なハードウェア支援型機能群によって、エンタープライズ環境とクラウド環境で提供される信頼性の高いサービスに対してデータおよびプラットフォーム・レベルの保護メカニズムが提供されます。

動的かつ効率性の高いサービス提供
インテル® Xeon® スケーラブル・プロセッサー・ファミリーでは、コンピューティング、メモリー、ネットワーク、ストレージのパフォーマンスがまとめて強化され、最適なソフトウェア・エコシステムと組み合わされます。そのため、ワークロードのニーズに基づいてオンプレミス / ネットワーク経由 / パブリッククラウドでリソースの動的セルフプロビジョニングを行う、完全に仮想化されたソフトウェア・デファインド・データセンターに最適なプラットフォームとなっています。

アジャイルデータセンター向けのパワフルなツールとテクノロジー

インテル® バーチャライゼーション・テクノロジー (インテル® VT-x) の機能:

  • モバイルベースの実行制御 (MBE) の仮想化: ハイパーバイザーが高い信頼性でカーネル・レベル・コードの完全性を検証および適用できるようにすることで、仮想化環境におけるマルウェア攻撃からの保護レベルを高めます
  • タイムスタンプ・カウンター・スケーリング (TSC) の仮想化: 異なる基本周波数で動作するプロセッサー間を仮想マシンが移動可能にすることで、ハイブリッド・クラウド環境のワークロードを最適化します

インテル® ノード・マネージャー (インテル® NM) 4.0: IT 部門がデータセンター内の給電 / 冷却 / 演算リソースをインテリジェントに管理できるようにします。これにより効率性が最大限に高まると同時に、コストのかかるオーバーヒートの可能性が低減します。

インテル® セレクトソリューションにより価値実現までの時間を短縮

今日の複雑なデータセンターにおいて、ハードウェア / ソフトウェア・インフラストラクチャーは「汎用的」ではありません。インテル® Select ソリューションは、実環境でのパフォーマンス最適化を目指し、憶測に頼らず、厳格なベンチマーク・テストと検証が実施されています。こうしたソリューションはインテル® Xeon® プロセッサーを基盤として、高度な分析、ハイブリッド・クラウド、ストレージ、ネットワークにおける今日の重要なワークロードに対応できるインフラストラクチャーの短期構築を可能にするものです。

企業と政府 – ビジネス向けの準備
高度な分析、ハイブリッド・クラウド、将来性のあるストレージの時代にいるメリットを活用するために最新化を進めている企業のデータセンターの場合、インテル® Select ソリューションにより、IT が主導するデータ駆動型のビジネス変革を加速させることができます。

通信サービス・プロバイダー – チューニング済みのネットワーク強化機能
将来の 5G 対応に向けてネットワークの変革を進めている通信サービス・プロバイダーの場合、インテル® Select ソリューションにより、顧客の新たなワークロードのニーズに対応する仮想ネットワーク強化機能を最大限に活用した検証済みの構成を適用して、ストレステスト済みの信頼性のあるインフラストラクチャーを迅速かつ効率的に導入できます。

ハイパフォーマンス・コンピューティング – インサイト獲得までの時間を短縮
企業だけでなく教育現場と政府機関も対象とした調査によると、インテル® Select ソリューションを基盤としたハイパフォーマンス・コンピューティング (HPC) の能力は、より深い洞察と複雑な問題の解決によって、現状におけるメインストリーム・データの限界を押し広げる手助けとなっています。

intel.com/selectsolutions で、インテル® Optane™ DC パーシステント・メモリー付きの新しい第 2 世代 インテル® Xeon® スケーラブル・プロセッサーを搭載したインテル® Select ソリューションの詳細をご覧ください。

大量のデータを利用する企業のための強力で高機能なプラットフォーム

多くの企業は、ビジネス・イニシアチブを形作る洞察を迅速に得られるように、自社に送信されてくる大量のデータストリームから価値を引き出したいと考えます。予測分析、マシンラーニング、HPC など、社内に従来からあるアプリケーションでも新しいアプリケーションでも、高度な演算機能や大容量の階層型データストレージのレベルを一層高める必要があります。現在、包括的なコンバージド手法を用いた最新のデータセンターが設計されています。この手法を用いると、自己管理型のハイブリッド・データセンターへの移行をシームレスかつスケーラブルに実現できると同時に、新しいサービスを柔軟に提供し、現在のインフラストラクチャー資産全体の TCO を向上することができます。

一方、基幹業務のワークロード (OLTP、ウェブ・インフラストラクチャーなど) を扱う組織では、TCO 削減とともにインフラストラクチャーのパフォーマンス強化が求められています。

インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、ハイブリッドクラウド、データ燃料時代に対応できる次世代のプラットフォームを通じて、企業に次世代のエンタープライズ機能を提供し、さらに日々の運用改善に役立ちます。この汎用性の高いプラットフォームは、メモリーと I/O の進歩と相まって、破壊的なレベルのコンピューティング・パフォーマンスを、コンピューティングを必要とするレイテンシーに敏感なアプリケーションにもたらします。革新的なインテル® Optane™ DC パーシステント・メモリーおよびインテル® QLC 3D NAND SSD データセンター・ファミリーと組み合わせて、ストレージ、キャッシング、およびメモリ全体で大容量のデータを管理し、インテル® Xeon® スケーラブル・プロセッサー・フ​​ァミリーで構築されたプラットフォームは、データとクラウド時代の厳しい要求に対応が可能です。

インテル® Xeon® スケーラブル・プロセッサー・ファミリーには、さまざまなワークロード要件に合わせたパッケージング・オプションが幅広く揃っており、コンピューティング、ストレージ、ネットワーキングなどの用途に合わせて効率性の高い仮想インフラストラクチャーを導入できるよう設計されています。

インテル® Optane™ DC パーシステント・メモリー搭載の新しい第 2世代インテル® Xeon® スケーラブル・プロセッサー

企業のイノベーションに適した特長

  • 第 2 世代インテル® Xeon® スケーラブル・プロセッサー
  • インテル® Optane™ パーシスタント・メモリー
  • インテル® ディープラーニング・ブースト (インテル® DL ブースト)
  • インテル® スピード・セレクト・テクノロジー (インテル® SST)
  • インテル® イーサネット 800 シリーズ
  • インテル® Optane™ DC SSD および インテル® QLC 3D NAND SSD
  • インテル® インフラストラクチャー・マネジメント・テクノロジー (インテル® IMT)

クラウドに最適化された 5 G対応ネットワークと次世代仮想ネットワーク向けの次世代プラットフォーム

来る 5G の時代には、ワイヤレス・ネットワークでも有線ネットワークでも、コンシューマー向けサービス、企業向けサービス、メディア・アプリケーションから成る全く新しいエコシステムとクラスが実現されるでしょう。新しい IoT、仮想コンピューティング、分析によって促進される、このように多彩なデータを扱う革新的なユースケースは、通信サービス・プロバイダーにとって収益アップの大きなチャンスとなります。

目的に応じて構築された固定機能のインフラストラクチャーから新世代のオープン・ネットワークに移行することは、5G 時代を迎えるにあたって、最初に行うべき重要なステップです。ネットワーク機能仮想化 (NFV) を用いたソフトウェア・デファインド・ネットワークなら、通信サービス・プロバイダーとその顧客である企業の両方が新しいサービスの機会を得て、運用効率を高めることができます。柔軟で最適化された業界標準のサーバーと、オーケストレーションされた仮想ネットワーク機能を用いると、未来型のインフラストラクチャーで革新的なサービスを簡単かつ効率的に提供できるようになります。

このような分散型の通信ネットワークは、ネットワーク・コアからエッジまで、増え続けるデータ量と多様なネットワーキング・ワークロードにおいて非常に高いレベルの拡張性、俊敏性、プログラマビリティーを実現します。

インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、クラウド向けに最適化された仮想型の 5G 対応ネットワークを構築するための、次世代プラットフォームの土台となります。また、新しいアプリケーションの需要や、主要ワークロード (アプリケーションとサービス、コントロール・プレーン処理、ハイパフォーマンス・パケット処理、信号処理など) のコンバージェンスを処理できるように容易に拡張および適合できるアーキテクチャーを備えています。この新しいプロセッサーは、クラウド経済と連携し、自動性と応答性が高く、5G によって実現される新しい / 機能強化されたサービスを迅速かつ安全に提供できる俊敏性に優れたネットワークの基盤となります。

Networking/NFV “N” SKUs 向けに特化した新しい第 2 世代インテル® Xeon® スケーラブル・プロセッサー

通信サービス・プロバイダーの革新のハイライト

  • Networking/NFV 向けに特化した第 2 世代インテル® Xeon® スケーラブル・プロセッサー “N” SKU
  • インテル® Optane™ パーシスタント・メモリー
  • インテル® QAT を使用した暗号化および圧縮のハードウェア・アクセラレーション
  • インテル® イーサネット 800 シリーズ
  • 通信インフラストラクチャーの汎用性を最大限に高めるインテル® FPGA
  • インテル® インフラストラクチャー・マネジメント・テクノロジー (インテル® IMT)

通信サービスプロバイダー向けに最適化された追加リソース
オープンソースのデータプレーン開発キット (DPDK) を利用すれば、インテル® アーキテクチャー上で通信オペレーションを最適化できます。DPDK は、プロセッサのコア数とパフォーマンスが増加するにつれてパフォーマンスを拡張できることを実証しています。ベクトルパケット処理 (VPP) IPsec などのワークロードは、この強化されたパフォーマンスの恩恵を受けています。さらに、これらのライブラリーには、新しいプロセッサー機能 (インテル® AVX-512、メモリーや I/O の機能強化など) がこの新機能を利用できるよう、事前に最適化されたメカニズムが備わっています。そのため、直接的な開発の労力をそれほど注ぎ込むことなく、パケット処理のパフォーマンスを向上できます。

インテルは、5G 時代のネットワーク進化に最適なプログラム (インテル® ネットワーク・ビルダーズ・ユニバーシティーなど) を提供しています。これらのプログラムが提供するソリューション・ガイダンスやトレーニングを利用すれば、通信サービス・プロバイダーは自信を持ってネットワーク変革イニシアチブを進めることができます。

HPC とハイパフォーマンス・データ分析の飛躍的イノベーション

今日の科学的発見は、革新的なアルゴリズム、新しいデータソースとデータ量、コンピューティングとストレージの進化に支えられています。指数関数的に広がるボリュームと多様なデータの恩恵を受ける HPC クラスターは、進化する高性能データ分析 (HPDA) ワークロードを実行するためのエンジンでもあり、ビジネスと人間の理解に驚くべき発見と洞察をもたらします。マシンラーニング、ディープラーニング、AI は、自律システムや自動運転車両などの次世代アプリケーションを駆動するために、膨大なデータを対象とした大規模演算機能を集約させたものです。

インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、推論とトレーニングの両方で高いスループットを備えた AI の共通プラットフォームを提供します—2017年7月に導入されたインテル® Xeon® スケーラブル・プロセッサーと比較して、9200 シリーズでは最大 30 倍の推論 、8200 シリーズでは最大 14 倍の推論 スループットとなりました。

HPC はもはや、単なる大規模な科学機関のドメインではありません。一般企業も HPC の演算サイクルをますます多用する傾向にあり、世界最大級の HPC クラスターのいくつかは、民間の石油 / ガス会社にあります。個別化医療の研究では、高度に集中した治療計画に HPC が適用されています。新しい HPC の導入により、単一のスーパーコンピューターでシミュレーション、AI、視覚化、および分析を組み合わせた、従来とは異なる用途向けの革新的で統合されたアーキテクチャを採用しています。

HPC プラットフォームは、最小のクラスターから最大のスーパーコンピューターまで、コンピューティング、メモリー、ストレージ、およびネットワーク全体のバランスを必要とします。インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、非常に高い拡張性を備え (数万コアまで) 、こうしたバランスを実現するよう設計されています。コア数の向上やメッシュ・アーキテクチャーから、新たに統合されたテクノロジーやインテル® Optane™ DC パーシステント・メモリーおよびストレージデバイスのサポートまで、インテル® Xeon® スケーラブル・プロセッサー・ファミリーは、リソースのあらゆるインターセクションでボトルネックを生み出すことなくコンピューティング、メモリー、ストレージ、ネットワークのパフォーマンスを最大化するという HPC の究極の目標を達成します。

エンドツーエンドの高性能ファブリックである、インテル® Omni-Path Architecture (Intel®OPA) とインテル® Xeon® スケーラブル・プロセッサ・フ​​ァミリーの統合により、分散並列コンピューティング・クラスターのパフォーマンスとスケーリングの両方が実現します。最大 32 ノードのほぼ線形のスケーリングにより、相互接続によって抑制されない大規模な HPC ソリューションを構築できます。インテル® Xeon® スケーラブル・プロセッサー・ファミリーとインテル® Omni-Path アーキテクチャー (インテル® OPA)は、多くのデータセンターで高度に並列化されたワークロードの新しい発見と高速なソリューションを実現します。

HPC 向け 第 2 世代インテル® Xeon® スケーラブル・プロセッサー

  • インテル® Xeon® Platinum 9200 プロセッサー
  • インテル® Optane™ パーシスタント・メモリー
  • インテル® Ultra Path インターコネクト (インテル® UPI)
  • インテル® ディープラーニング・ブースト (インテル® DL ブースト)
  • インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512)
  • インテル® Omni-Path アーキテクチャー (インテル® OPA) ホスト・ファブリック・インターフェイス
  • インテル® Optane™ DC SSD

HPC、HPDA、AI 向けのその他のテクノロジー
生産性の高いさまざまなソフトウェアツール、最適化されたライブラリ、基本的なビルディングブロック、および汎用および高度な並列コンピューティングのための柔軟なフレームワークにより、ワークフローが簡素化され、開発者が HPC および AI の IA の機能を最大化するコードを作成できるようになります。

Caffe および ensorFlow* を含む一般的な IA 向けディープラーニング・フレームワークに最適化されており、データ・サイエンティストに高い価値とパフォーマンスをもたらします。

インテル® Parallel Studio XE 2017 には、IA 上でのディープラーニング・フレームワークを高速化するディープ・ニューラル・ネットワーク向けインテル® マス・カーネル・ライブラリー (インテル® MKL) や、ビッグデータ分析を高速化するインテル® データ・アナリティクス・アクセラレーション・ライブラリー (インテル® DAAL) などのパフォーマンス・ライブラリーが含まれています。

HPC 向けに最適化されたリソース
インテル® Modern Code Developer Community は、HPCin を通じ Exascale の時代に向けて発見を継続するために、開発者とデータサイエンティストが、ベクトル化、メモリおよびデータレイアウト、マルチスレッド、およびマルチノード・プログラミングなどのオンラインおよび対面のコードモダナイゼーション技術セッションに簡単にアクセスできるようにします。

第 2 世代インテル® Xeon® スケーラブル・プロセッサーの概要

インテル® Xeon® スケーラブル・プロセッサー・ファミリー

インテル® Xeon® Platinum 9200 プロセッサー

インテル® Xeon® Platinum 9200 プロセッサーは、ハイパフォーマンス・コンピューティング、高度な人工知能および分析に最適に設計されています。インテル® アーキテクチャーとしては史上最高のラック当たり FLOPS を誇り、すべてのインテル® Xeon® プロセッサー・プラットフォームの中でも最高の DDR ネイティブ・メモリー帯域幅をサポートすることで、圧倒的なレベルのパフォーマンスを提供します。

  • プロセッサーあたり最大 56 のインテル® Xeon® スケーラブル・プロセッサー・コア
    2U プラットフォームごとに 2 つのプロセッサー
    (インテル® サーバーシステム S9200WK データセンターブロック)
  • プロセッサーあたり 12 メモリーチャネル、ノード あたり 24 メモリチャネル
  • AI 推論の高速化とパフォーマンスを強化する新しいインテル® Deep Learning Boost (インテル® DL Boost) インストラクションを搭載
  • 密度とパフォーマンスが最適化された拡張マルチチップ・パッケージ

インテル® Xeon® Platinum 8200 プロセッサー

第二 2 世代のインテル® Xeon® Platinum プロセッサーは、安全で俊敏なハイブリッド・クラウド・データセンターの基盤です。このプロセッサー・ファミリーは、ハードウェアベースの高度なセキュリティーと 2、4、8+ のソケット構成に対応しており、抜群の処理パフォーマンスを備えています。ミッション・クリティカルなリアルタイム分析、マシンラーニング、人工知能、マルチクラウド・ワークロードを想定して構築されています。信頼できるハードウェア支援型のデータ・サービス・デリバリーを実現し、I/O、メモリーストレージ、ネットワーク・テクノロジーで飛躍的な進化を遂げているこのプロセッサー・ファミリーは、今後ますます増加するデータから実用的なインサイトを引き出すことができます。

インテル® Xeon® Gold 6200 プロセッサーおよびインテル® Xeon® Gold 5200 プロセッサー

インテル® Xeon® Gold 6200 プロセッサーは、メモリー速度の向上、メモリー容量の拡張、4 ソケットの拡張性をサポートしており、大幅に向上したパフォーマンス、高度な信頼性、ハードウェア支援型セキュリティーを実現します。要求の厳しいメインストリーム・データセンター、マルチクラウド・コンピューティング、ネットワークおよびストレージのワークロードに合わせて最適化されています。インテル® Xeon® Gold 5200 プロセッサーは、向上したパフォーマンスとともに、高度な信頼性とハードウェア支援型セキュリティーをお手頃な価格で提供します。最大 4 ソケットの拡張性を備え、広範なワークロードに適しています。

インテル® Xeon® Silver 4200 プロセッサー

インテル® Xeon® Silver プロセッサーは、必要不可欠なパフォーマンス、向上したメモリー速度、電力効率を発揮します。エントリーレベルのデータセンター・コンピューティング、ネットワーク、ストレージに求められるハードウェア支援型のパフォーマンスが得られます。

エントリーレベルのパフォーマンスとハードウェア拡張セキュリティ

インテル® Xeon® Bronze プロセッサーは、小規模ビジネスや基本的なストレージサーバーを対象としたエントリーレベルのパフォーマンスを提供します。ハードウェア支援型の信頼性、可用性、保守性により、こうしたエントリー・ソリューションのニーズを満たすように設計されています。

 

インテル® Xeon® Bronze プロセッサー (3200 シリーズ)

インテル® Xeon Silver プロセッサー (4200 シリーズ)

インテル® Xeon® Gold プロセッサー (5200 シリーズ)

インテル® Xeon® プロセッサー

Gold プロセッサー

(6200 シリーズ)

インテル® Xeon® Platinum プロセッサー

(6200 シリーズ)

インテル® Xeon® Platinum プロセッサー
(9200 シリーズ)

広範なパフォーマンスとセキュリティー

サポートされる最大コア数

6 コア

16 コア

18 コア

24 コア

28 コア

56 コア

サポートされている最高周波数

1.9 GHz

3.50 GHz

3.90 GHz

4.40 GHz

4 GHz

3.80 GHz

サポートされている CPU ソケットの数

最大 2

最大 2

最大 4

最大 4

最大 8

最大 2

インテル® Ultra Path インターコネクト (インテル® UPI)

2

2

2

3

3

4

インテル® UPI Speed

9.6 GT/s

9.6 GT/s

10.4 GT/s

10.4 GT/s

10.4 GT/s

10.4 GT/s

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512)

1 FMA

1 FMA

1 FMA

2 FMA

2 FMA

2 FMA

メモリーの高速サポート (DDR4)

2133 MT / 秒

2400 MT / 秒

2666 MT / 秒

2933 MT / 秒

2933 MT / 秒

2933 MT / 秒

サポートされているソケットごとの最大メモリ容量 ◊

1 TB

1 TB

1 TB, 2 TB, 4.5 TB

1 TB, 2 TB, 4.5 TB

1 TB, 2 TB, 4.5 TB

1.5 TB

16Gb DDR4 DIMM サポート

*

*

*

*

*

*

Vector Neural Network Instruction (VNNI) 搭載のインテル® ディープラーニング・ブースト (インテル® DL BOOST)

*

*

*

*

*

*

インテル® Optane™ DC パーシステント・メモリー・モジュール・サポート

 

*

*

*

*

 

インテル® Omni-Path アーキテクチャー (ディスクリート PCIe* カード)

*

*

*

*

*

*

インテル® QuickAssist テクノロジー (チップセットに統合)

*

*

*

*

*

 

インテル® QuickAssist テクノロジー (ディスクリート PCIe* カード)

*

*

*

*

*

*

インテル® Optane™ DC SSD

*

*

*

*

*

*

インテル® DC SSD データセンター・ファミリー (3D NAND)

*

*

*

*

*

*

PCIe 3.0

*

*

*

*

*

*

インテル® QuickData テクノロジー (CBDMA)

*

*

*

*

*

*

非透過ブリッジ (NTB)

*

*

*

*

*

*

インテル® ターボ・ブースト・テクノロジー 2.0

 

*

*

*

*

*

インテル® ハイパースレッディング・テクノロジー (インテル® HT テクノロジー)

 

*

*

*

*

*

ノード・コントローラーのサポート

 

 

 

*

*

*

◊ 一部のプロセッサーのみでサポート
高い信頼性

信頼性、可用性、保守性 (RAS) 機能

スタンダード

スタンダード

スタンダード

アドバンスト

アドバンスト

アドバンスト

インテル® Run Sure テクノロジー

 

 

 

*

*

*

俊敏性と効率性

インテル® スピード・セレクト・テクノロジー (インテル® SST) ◊

 

*

*

*

*

 

インテル® インフラストラクチャー・マネジメント・テクノロジー

*

*

*

*

*

*

インテル® リソース・ディレクター・テクノロジー (インテル® RDT)

*

*

*

*

*

*

インテル® Volume Management Device (インテル® VMD)

*

*

*

*

*

*

インテル® バーチャライゼーション・テクノロジー (インテル® VT)

*

*

*

*

*

*

インテル® スピード・シフト・テクノロジー

*

*

*

*

*

*

インテル® ノード・マネージャー 4.0

*

*

*

*

*

*

モードベースの実行制御

*

*

*

*

*

*

仮想化のためのタイムスタンプ・カウンター・スケーリング (TSC)

*

*

*

*

*

*

◊ 一部のプロセッサーのみでサポート
セキュリティー

データセンター向けインテル® セキュリティー・ライブラリー (インテル® SecL - DC)

*

*

*

*

*

*

インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512)

*

*

*

*

*

*

統合されたインテル® QAT 付きインテル® キー・プロテクション・テクノロジー (インテル® KPT)

*

*

*

*

*

*

インテル® プラットフォーム・トラスト・テクノロジー (PIT)

*

*

*

*

*

*

One-Touch Activation (OTA) 対応インテル® トラステッド・エグゼキューション・テクノロジー (インテル® TXT)

*

*

*

*

*

*

第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリー

SKU の番号付け
インテル® Xeon® スケーラブル・プロセッサー・ファミリーのプロセッサー番号は、ブランドとそのクラスに従って、パフォーマンス、機能、プロセッサー世代、およびオプションに基づいた英数字スキームを使用します。

クラウドへの投資でより多くのことを実行

インテル® テクノロジーならば、期待どおりパワフルな 1 米ドル当たりのパフォーマンスを実現できます。インテル® アーキテクチャーを基盤とするクラウドでは、データベース、ハイパフォーマンス・コンピューティング (HPC)、ウェブなど、データ負荷の高いクリティカルなワークロードを、より高いパフォーマンスで、総保有コストを抑えて実行することが可能です。5 6 7 8 9

パフォーマンスが 2.84 倍向上

HammerDB、PostgreSQL*、MongoDB* など、データベース・ワークロードで、1 米ドル当たりのパフォーマンスが最大 2.84 倍向上。5

詳しくはこちら

パフォーマンスが 4.15 倍向上

High Performance LINPACK および LAMMPS で 1 米ドル当たりのパフォーマンスが最大 4.15 倍向上。6

詳しくはこちら

パフォーマンスが 1.74 倍向上

サーバーサイド Java* で 1 米ドル当たりのパフォーマンスが向上、WordPress* PHP/HHVM で 1 米ドル当たりのパフォーマンスが 1.74 倍向上。7

詳しくはこちら

パフォーマンスが 2.25 倍向上

メモリー帯域幅を消費するアプリケーションで 1 米ドル当たりのパフォーマンスが最大 2.25 倍向上。8

詳しくはこちら

第 2 世代インテル® Xeon® スケーラブル・プロセッサー SKU

最新の情報については intel.com/xeon または ark.intel.com をご覧ください。

プロセッサー識別子

コア数

キャッシュ (MB)

TDP (ワット)

プロセッサー・ベース動作周波数 (GHz)

最大ターボ周波数 (GHz)

最大メモリースピード (MT / 秒)

メモリー容量
M/L SKU Suffix

PLATINUM 9282

56

77

400 番台

2.6

3.8

2933

3TB

PLATINUM 9242

48

71.5

350

23

3.8

2933

3TB

PLATINUM 9222 ◊

32

71.5

250

23

3.70

2933

3TB

PLATINUM 8280

28

38.5

205

2.7

4

2933

1TB / 2TB / 4.5TB

PLATINUM 8276

28

38.5

165

2.2

4

2933

1TB / 2TB / 4.5TB

PLATINUM 8270

26

35.75

205

2.7

4

2933

1 TB

PLATINUM 8268

24

35.75

205

2.9

39

2933

1 TB

PLATINUM 8260

24

35.75

165

2.4

39

2933

1TB / 2TB / 4.5TB

PLATINUM 8256

4

16.5

105

3.8

39

2933

1 TB

PLATINUM 8253

16

22

125

2.2

3

2933

1 TB

GOLD 6258R 28 38.5 205 2.7 4.0 2933 1 TB
GOLD 6256 12 33 205 3.6 4.5 2933 1 TB

GOLD 6254

18

24.75

200

3.1

4

2933

1 TB

GOLD 6252

24

35.75

150

2.1

3.70

2933

1 TB

GOLD 6250 8 35.75 185 39 4.5 2933 1TB / 4.5TB◊
GOLD 6248R 24 35.75 205 2.6 4.0 2933 1 TB

GOLD 6248

20

27.5

150

2.5

39

2933

1 TB

GOLD 6246R 16 35.75 205 3.4 4.1 2933 1 TB

GOLD 6246

12

24.75

165

3.3

4.2

2933

1 TB

GOLD 6244

8

24.75

150

3.6

4.4

2933

1 TB

GOLD 6242R 20 35.75 205 3.1 4.2 2933 1 TB

GOLD 6242

16

22

150

2.80

39

2933

1 TB

GOLD 6240R 24 35.75 165 2.4 4.0 2933 1TB / 4.5TB

GOLD 6240

18

24.75

150

2.6

39

2933

1TB / 2TB / 4.5TB

GOLD 6240 28 38.5 165 2.2 4.0 2933 1TB / 4.5TB

GOLD 6238

22

$30.25

140

2.1

3.70

2933

1TB / 2TB / 4.5TB

GOLD 6234

8

24.75

130

3.3

4

2933

1 TB

GOLD 6230R 26 35.75 150 2.1 4.0 2933 1 TB

GOLD 6230

20

27.5

125

2.1

39

2933

1 TB

GOLD 6226R 16 22 150 2.9 39 2933 1 TB

GOLD 6226

12

19.25

125

2.7

3.70

2933

1 TB

GOLD 5222

4

16.5

105

3.8

39

2933

1 TB

GOLD 5220R 24 35.75 150 2.2 4.0 2667 1 TB

GOLD 5220

18

24.75

125

2.2

39

2667

1 TB

GOLD 5218R 20 27.5 125 2.1 4.0 2667 1 TB

GOLD 5218

16

22

125

23

39

2667

1 TB

GOLD 5217

8

11

115

3

3.70

2667

1 TB

GOLD 5215

10

13.75

85

2.5

3.4

2667

1TB / 2TB / 4.5TB

SILVER 4216

16

22

100

2.1

3.2

2400

1 TB

SILVER 4215R 8 11 130 3.2 4.0 2400 1 TB

SILVER 4215

8

11

85

2.5

3.5

2400

1 TB

SILVER 4214R 12 16.5 100 2.4 3.5 2400 1 TB

SILVER 4214

12

16.5

85

2.2

3.2

2400

1 TB

SILVER 4210R 10 13.75 100 2.4 3.2 2400 1 TB

SILVER 4210

10

13.75

85

2.2

3.2

2400

1 TB

SILVER 4208

8

11

85

2.1

3.2

2400

1 TB

BRONZE 3206R 8 11 85 1.9 1.9 2133 1 TB

BRONZE 3204

6

$8.25

85

1.9

1.9

2133

1 TB

インテル® スピード・セレクト・テクノロジー (インテル® SST) SKU を搭載したネットワーク/ NFV専用

6252N

24

35.75

150

23

3.6

2933

1 TB

6230N

20

27.5

125

23

39

2933

1 TB

5218N

16

22

105

23

3.70

2667

1 TB

検索アプリケーション値に特化した SKU

5220S

18

24.75

125

2.7

39

2667

1 TB

ロングライフサイクルと NEBS-Thermal に優しい SKU

6238T

22

$30.25

125

1.9

3.70

2933

1 TB

6230T

20

27.5

125

2.1

39

2933

1 TB

5220T

18

24.75

105

1.9

39

2667

1 TB

5218T

16

22

105

2.1

3.8

2667

1 TB

4210T 10 13.75 95 23 3.2 2400 1 TB

4209T

8

11

70

2.2

3.2

2400

1 TB

シングルソケット・バリューに特化した SKU
6212U 24 35.75 164 2.4 39 2933 1 TB
6210U 20 27.5 150 2.5 39 2933 1 TB
6209U 20 27.5 125 2.1 39 2933 1 TB
6208U 16 22 150 2.9 39 2933 1 TB

VM 密度値に特化した SKU

6262V

24

33

135

1.9

3.6

2400

1 TB

6222V

20

27.5

115

1.8

3.6

2400

1 TB

インテル® スピード・セレクト・テクノロジー (インテル® SST) を搭載した SKU

8260Y

24

35.75

165

2.4

39

2933

1 TB

6240Y

18

24.75

150

2.6

39

2933

1 TB

4214Y

12

16.5

85

2.2

3.2

2400

1 TB

◊ インテル® Xeon® Platinum 9222 プロセッサー: インテル® ターボ・ブースト・テクノロジー の周波数と基本周波数は暫定的なものです。最終値は今後公開されます。

製品名

SKU

10Gb/1Gb イーサネットのポート

圧縮

暗号化

RSA暗号

 

インテル® QuickAssist テクノロジー (インテル® QAT)

インテル® C621 チップセット

LBG-1G

0/4

N/A

N/A

N/A

インテル® C622 チップセット

LBG-2

2 / 4

N/A

N/A

N/A

インテル® C624 チップセット

LBG-4

4 / 4

N/A

N/A

N/A

インテル® C625 チップセット

LBG-E

4 / 4

20 Gb/ 秒

20 Gb/ 秒

20K Ops/ 秒

インテル® C626 チップセット

LBG-M

4 / 4

40 Gb/s

40 Gb/s

40K Op/ 秒

インテル® C627 チップセット

LBG-T

4 / 4

100 Gb/ 秒

100 Gb/ 秒

100K Ops/ 秒

インテル® C628 チップセット

LBG-L

4 / 4

100 Gb/ 秒

100 Gb/ 秒

100K Ops/ 秒

インテル® サーバーシステム S9200WK データセンター ・ブロック (DCB) 技術仕様
インテル® Xeon® Platinum 9200 プロセッサーをサポート

フォームファクター

2U ラック・エンクロージャ; 最大 4 つの独立したウォームスワップ・コンピューティング・モジュール

CPU

最大 56 コアのインテル® Xeon® Platinum 9200 プロセッサー

メモリー

プラットフォームごとに DDR4-2933 MT/ 秒 DIMMS, 24 DIMMs @ 1DPC

8GB〜128GB の DIMM オプション、数、および構成可能な容量をサポート

ストレージ

DCB あたり最大 8 個の M.2 SSD (1U 計算モジュール付き計算モジュールあたり 2 つ、2U 計算モジュールを備えた最大 4 つの M.2 SSD および 4 つのホットスワップ U.2 NVMe SSD)

M.2 および U.2 の番号と容量が構成可能

イーサネット

統合 1Gbase-T RJ45 (コンピュート・モジュールごとに 2 つのポート)、オプションの共有 1Gbase-T RJ45 管理ポートシャーシカード

冷却

高流量空冷または統合液冷オプションで利用可能

I/O

1U 計算モジュールあたり 2 x16 第 3 世代 PCIe スロット; 高速ネットワークをサポートするための 2U コンピューティング・モジュールあたり 4 x16 第 3 世代 PCIe スロット

管理機能

専用の統合管理モジュール

セキュリティーとサービス性

TPM 2.0 (オプション); ホットスワップ / 冗長ファン、および PSU; 光路診断 LED

すべての機能の包括的なリストではありません。詳細については、intel.com/serverproduct を参照してください。

第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリー


詳細情報

インテル® テクノロジーの機能と利点はシステム構成によって異なり、対応するハードウェアやソフトウェア、またはサービスの有効化が必要となる場合があります。実際の性能はシステム構成によって異なります。

◊ 絶対的なセキュリティーを提供できる製品やコンポーネントはありません。

テスト結果は、特定のシステムにおける個々のテストでのコンポーネントの性能を実証するものです。ハードウェア、ソフトウェア、システム構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なります。性能やベンチマーク結果について、さらに詳しい情報をお知りになりたい場合は、https://www.intel.com/benchmarks を参照してください。

性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、ほかの製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。詳細については、http://www.intel.com/benchmarks/ (英語) を参照してください。

インテル® アドバンスト・ベクトル・エクステンション (インテル® AVX) は、特定のプロセッサー演算に高スループットを提供します。プロセッサーの電力特性はさまざまであるため、インテル® アドバンスト・ベクトル・エクステンション (インテル® AVX) 命令を使用すると、a) 一部の部品が定格周波数未満で動作し b) インテル® ターボ・ブースト・テクノロジー 2.0 を搭載した一部の部品は、ターボ周波数のいずれかまたは最大を達成しません。実際の性能はハードウェア、ソフトウェア、システム構成によって異なります。詳細については、https://www.intel.com/go/turbo を参照してください。

インテル® コンパイラーでは、インテル製マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® SSE2、インテル® SSE3、インテル® SSSE3 命令セットなどの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル製マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。

記載されているコスト削減シナリオは、指定の状況と構成で、特定のインテル® プロセッサー搭載製品が今後のコストに及ぼす影響と、その製品によって実現される可能性のあるコスト削減の例を示すことを目的としています。状況によって異なる可能性があります。インテルは、いかなるコストもコスト削減も保証いたしません。

インテルは、本資料で参照しているサードパーティーのベンチマーク・データまたはウェブサイトについて管理や監査を行っていません。本資料で参照しているウェブサイトにアクセスし、参照データが正しいかどうか確認することをお勧めします。

© Intel Corporation.インテル、インテルのロゴ、インテル Optane DC 、インテル Xeon は、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

FTC 最適化に関するお知らせ
インテル®ソフトウェア 開発ツール (コンパイラーまたはライブラリー) を使用して達成できるパフォーマンス上の利点について主張する場合は、主張と同じ表示面 (スライド) ですべてのテキストを使用する必要があります。

最適化に関する注意事項:インテルのコンパイラーでは、インテルのマイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® SSE2、インテル® SSE3、インテル® SSSE3 命令セットなどの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル製マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。

注意事項の改訂 #20110804
パフォーマンス実績は構成情報に記載された日に実施したテストに基づくものであり、公開中のセキュリティー・アップデートがすべて適用されているとは限りません。詳細については、公開されている構成情報を参照してください。絶対的なセキュリティーを提供できる製品やコンポーネントはありません。性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、ほかの製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。詳細については、https://www.intel.com/benchmarks/ (英語) を参照してください。

2019年3月1日時点の推奨価格設定。インテルは、いかなるコストもコスト削減も保証いたしません。購入を検討される場合は、ほかの情報や性能テストも参考にすることをお勧めします。

免責事項

3

ノード当たりの VM 数が 36% 増加、VM 構成当たりの推定コストが 30% 低下。

 

Config1-DDR4 (類似コスト)

Config2 - インテル® Optane™ パーシステント・メモリー (類似コスト)

テスト実施者

インテル

インテル

テスト日

2019/1/31

2019/1/31

プラットフォーム

社外秘 – 開示の必要がある場合、 M. Strassmaier にお問い合わせください

社外秘 – 開示の必要がある場合、 M. Strassmaier にお問い合わせください

ノード数

1

1

ソケット数

2

2

CPU

Cascade Lake B0 8272L

Cascade Lake B0 8272L

コア / ソケット、スレッド / ソケット

26/52

26/52

HT

オン

オン

ターボ

オン

オン

BKC バージョン – 例 ww47

WW42

WW42

インテル® Optane™ パーシステント・メモリー FW バージョン

5253

5253

システム DDR メモリー構成: スロット / 容量 / 実行速度

24 スロット / 32GB / 2666

12 スロット / 16GB / 2666

システム DCPMM 構成: スロット / 容量 / 実行速度

 

8 スロット / 128GB / 2666

メモリー総容量 / ノード (DDR、DCPMM)

768GB、0

192GB、1TB

ストレージ – ブート

Samsung PM963 M.2 960GB x 1

Samsung PM963 M.2 960GB x 1

ストレージ – アプリケーション・ドライブ

Samsung PM963 M.2 960GB x 7、インテル® SSD S4600 (1.92TB) x 4

Samsung PM963 M.2 960GB x 7、インテル® SSD S4600 (1.92TB) x 4

NIC

インテル® X520 SR2 (10Gb) x1

インテル® X520 SR2 (10Gb) x1

PCH

LBG QS/PRQ – T – B2

LBG QS/PRQ – T – B2

その他 HW (アクセラレーター)

 

 

OS

Windows Server* 2019 RS5-17763

Windows Server* 2019 RS5-17763

カーネル

 

 

ワークロードおよびバージョン

OLTP クラウド・ベンチマーク

OLTP クラウド・ベンチマーク

コンパイラー  
ライブラリー  
その他 SW (フレームワーク、トポロジー…)  

 

 

1- ベースライン

2- 構成詳細

システム数

1

1

ソケット当たりメモリー・サブシステム

DRAM- 384GB (12 x 32GB)

2GB (4 X 128GB AEP + 6 x 16GB DRAM、2-2-1、メモリーモード

CPU SKU| システム当たりの数

8276 (CLX、Plat、28 コア) 2

8276 (CLX、Plat、28 コア) 2

ストレージ詳細 | 総ストレージコスト

HDD / SDD の数 $7,200

HDD / SDD の数 $7,200

SW ライセンス詳細 | システム当たりのコスト

SW コスト (コアまたはシステム当たり) $0

SW コスト (コアまたはシステム当たり) $1

関連値指標

22.00

30.00

システムのタイプ

DRAM- Purley

AEP- メモリーモード

CPU とプラットフォーム一致

TRUE

TRUE

CPU コスト

2 x 8276 (CLX、Plat、28 コア) $17,438

2 x 8276 (CLX、Plat、28 コア) $17,439

メモリー・サブシステム

合計容量: 768GB (384GB / ソケット) $8,993

合計容量: 1024GB (512GB / ソケット) $7,306

DRAM

24 x 32GB $8,993

12 x 16GB $2,690

AEP

N/A $0

8 x 128GB $4,616

ストレージ

HDD / SDD の数 $7,200

HDD / SDD の数 $7,200

RBOM

シャーシ、PSU、ブートドライブなど $1,300

シャーシ、PSU、ブートドライブなど $1,300

SW コスト

SW コスト (コアまたはシステム当たり) $0

SW コスト (コアまたはシステム当たり) $0

合計システムコスト

$34,931

$33,244

システムコスト

1

0.951689

インデックス付き値指標

1

1.36

インデックス付き値 / $

1

1.43

4


ノード当たりの VM 数が 36% 増加、VM 構成当たりの推定コストが 30% 低下。


 

Config1-DDR4 (類似コスト)

Config2- インテル® Optane™ パーシステント・メモリー (類似コスト)

テスト実施者

インテル

インテル

テスト日

2019/1/31

2019/1/31

プラットフォーム

社外秘 – 開示の必要がある場合、 M. Strassmaier にお問い合わせください

社外秘 – 開示の必要がある場合、 M. Strassmaier にお問い合わせください

ノード数

1

1

ソケット数

2

2

CPU

Cascade Lake B0 8272L

Cascade Lake B0 8272L

コア / ソケット、スレッド / ソケット

26/52

26/52

HT

オン

オン

ターボ

オン

オン

BKC バージョン – 例 ww47

WW42

WW42

インテル® Optane™ パーシステント・メモリー FW バージョン

5253

5253

システム DDR メモリー構成: スロット / 容量 / 実行速度

24 スロット / 32GB / 2666

12 スロット / 16GB / 2666

システム DCPMM 構成: スロット / 容量 / 実行速度

 

8 スロット / 128GB / 2666

メモリー総容量 / ノード (DDR、DCPMM)

768GB、0

192GB、1TB

ストレージ – ブート

Samsung PM963 M.2 960GB x 1

Samsung PM963 M.2 960GB x 1

ストレージ – アプリケーション・ドライブ

Samsung PM963 M.2 960GB x 7、インテル® SSD S4600 (1.92TB) x 4

Samsung PM963 M.2 960GB x 7、インテル® SSD S4600 (1.92TB) x 4

NIC

インテル® X520 SR2 (10Gb) x1

インテル® X520 SR2 (10Gb) x1

PCH

LBG QS/PRQ – T – B2

LBG QS/PRQ – T – B2

その他 HW (アクセラレーター)

 

 

OS

Windows Server* 2019 RS5-17763

Windows Server* 2019 RS5-17763

カーネル

 

 

ワークロードおよびバージョン

OLTP クラウド・ベンチマーク

OLTP クラウド・ベンチマーク

コンパイラー  
ライブラリー  
その他 SW (フレームワーク、トポロジー…)  

 

 

1- ベースライン

2- 構成詳細

システム数

1

1

ソケット当たりメモリー・サブシステム

DRAM- 384GB (12 x 32GB)

2GB (4 X 128GB AEP + 6 x 16GB DRAM、2-2-1、メモリーモード

CPU SKU| システム当たりの数

8276 (CLX、Plat、28 コア) 2

8276 (CLX、Plat、28 コア) 2

ストレージ詳細 | 総ストレージコスト

HDD / SDD の数 $7,200

HDD / SDD の数 $7,200

SW ライセンス詳細 | システム当たりのコスト

SW コスト (コアまたはシステム当たり) $0

SW コスト (コアまたはシステム当たり) $1

関連値指標

22.00

30.00

システムのタイプ

DRAM- Purley

AEP- メモリーモード

CPU とプラットフォーム一致

TRUE

TRUE

CPU コスト

2 x 8276 (CLX、Plat、28 コア) $17,438

2 x 8276 (CLX、Plat、28 コア) $17,439

メモリー・サブシステム

合計容量: 768GB (384GB / ソケット) $8,993

合計容量: 1024GB (512GB / ソケット) $7,306

DRAM

24 x 32GB $8,993

12 x 16GB $2,690

AEP

N/A $0

8 x 128GB $4,616

ストレージ

HDD / SDD の数 $7,200

HDD / SDD の数 $7,200

RBOM

シャーシ、PSU、ブートドライブなど $1,300

シャーシ、PSU、ブートドライブなど $1,300

SW コスト

SW コスト (コアまたはシステム当たり) $0

SW コスト (コアまたはシステム当たり) $0

合計システムコスト

$34,931

$33,244

システムコスト

1

0.951689

インデックス付き値指標

1

1.36

インデックス付き値 / $

1

1.43

 

5

パフォーマンス・テストに使用されるソフトウェアとワークロードは、パフォーマンスがインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などのパフォーマンス・テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。これらの要因のいずれかを変更すると、結果が異なることがあります。製品の購入を検討される場合は、ほかの製品と組み合わせた場合の本製品のパフォーマンスなど、ほかの情報やパフォーマンス・テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。

パフォーマンス実績は構成情報に記載された日に実施したテストに基づくものであり、公開中のアップデートがすべて適用されているとは限りません。詳細については、公開されている構成情報を参照してください。絶対的なセキュリティーを提供できる製品やコンポーネントはありません。

インテル® テクノロジーを使用するには、対応するハードウェア、ソフトウェア、またはサービスの有効化が必要となる場合があります。

コストと結果は状況によって変わります。

インテルは、サードパーティーのデータについて管理や監査を行っていません。正確さを評価するには、他のソースを参照する必要があります。

結果はインテル® P2CA が AWS* の価格体系 (米ドル / 時間、標準 1 年間、一括前払いなし) を使用して算出 (2019年7月12日時点)。AWS* EC2 R5 インスタンスおよび R5a インスタンス (https://aws.amazon.com/ec2/instance-types/) 上で実施したパフォーマンス / 米ドル・テスト、96 基の vCPU インテル® Xeon® スケーラブル・プロセッサーの 1 米ドル当たりのパフォーマンスを AMD EPYC* プロセッサーの数値と比較。

ワークロード: HammerDB* PostgreSQL*
結果: AMD EPYC* のパフォーマンス / 米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス / 米ドルは 1.85 倍 (値が大きいほど高性能)
データベース: HammerDB* – PostgreSQL* (値が大きいほど高性能):
AWS* R5.24xlarge (インテル) インスタンス、HammerDB* 3.0 PostgreSQL* 10.2、メモリー: 768GB、ハイパーバイザー: KVM、ストレージタイプ: EBS io1、ディスク容量 200GB、ストレージ総容量 200GB、Docker* バージョン: 18.06.1-ce、RedHat* Enterprise Linux* 7.6、3.10.0-957.el7.x86_64、共有バッファー 6400MB、256 ウェアハウス、96 ユーザー。スコア「NOPM」439931、測定はインテルが2018年12月11日 ~ 2018年12月14日に実施。
AWS* R5a.24xlarge (AMD*) インスタンス、HammerDB* 3.0 PostgreSQL* 10.2、メモリー: 768GB、ハイパーバイザー: KVM、ストレージタイプ: EBS io1、ディスク容量 200GB、ストレージ総容量 200GB、Docker* バージョン: 18.06.1-ce、RedHat* Enterprise Linux* 7.6、3.10.0-957.el7.x86_64、共時バッファー 6400MB、256 ウェアハウス、96 ユーザー。スコア「NOPM」212903、測定はインテルが2018年12月20日に実施。

ワークロード: MongoDB*
結果: AMD EPYC* のパフォーマンス / 米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス / 米ドルは 2.84 倍 (値が大きいほど高性能)
データベース: MongoDB* (値が大きいほど高性能):
AWS* R5.24xlarge (インテル) インスタンス、MongoDB* v4.0、ジャーナル無効、ファイルシステムへの同期無効、wiredTigeCache=27GB、maxPoolSize = 256、7 MongoDB* インスタンス、14 クライアント VM、1 YCSB クライアント / VM、96 スレッド / YCSB クライアント、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、スコア 1229288 ops/sec、測定はインテルが 2018年12月10日に実施。
AWS* R5a.24xlarge (AMD*) インスタンス、MongoDB* v4.0、ジャーナル無効、ファイルシステムへの同期無効、wiredTigeCache=27GB、maxPoolSize = 256、7 MongoDB* インスタンス、14 クライアント VM、1 YCSB クライアント / VM、96 スレッド / YCSB クライアント、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、スコア 388596 ops/sec、測定はインテルが 2018年12月10日に実施。
詳細については、www.intel.com/benchmarks (英語) を参照してください。

6

結果はインテル P2CA が AWS* の価格体系 (米ドル / 時間、標準 1 年間、一括前払いなし) を使用して算出 (2019年7月12日時点)。
AWS* EC2 M5 インスタンスおよび M5a インスタンス (https://aws.amazon.com/ec2/instance-types/) 上で実施したパフォーマンス / 米ドル・テスト、96 基の vCPU インテル® Xeon® スケーラブル・プロセッサーの 1 米ドル当たりのパフォーマンスを AMD EPYC* プロセッサーの数値と比較。

ワークロード: LAMMPS*
結果: AMD EPYC* のパフォーマンス / 米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス / 米ドルは 4.15 倍 (値が大きいほど高性能)
HPC 材料科学 – LAMMPS (値が大きいほど高性能):
AWS* M5.24xlarge (インテル) インスタンス、LAMMPS バージョン: 2018-08-22 (コード: https://lammps.sandia.gov/download.html)、ワークロード: 水滴 – 512K 個、インテル® ICC 18.0.3.20180410、インテル® MPI ライブラリー Linux* OS 版、バージョン 2018 アップデート 3 ビルド 20180411、48 MPI ランク、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS=2、スコア 137.5 タイムステップ / 秒、測定はインテルが 2018年10月31日に実施。
AWS* M5a.24xlarge (AMD*) インスタンス、LAMMPS バージョン: 2018-08-22 (コード: https://lammps.sandia.gov/download.html)、ワークロード: 水滴 – 512K 個、インテル® ICC 18.0.3.20180410、インテル® MPI ライブラリー Linux* OS 版、バージョン 2018 アップデート 3 ビルド 20180411、48 MPI ランク、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS=2、スコア 55.8 タイムステップ / 秒、測定はインテルが 2018年11月7日に実施。
AMD* が AVX2 をサポートするように変更 (AMD は AVX2 しかサポートしないため、この変更は必要でした):
sed -i 's/-xHost/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi
sed -i 's/-qopt-zmm-usage=high/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi

ワークロード: High-performance Linpack*
結果: AMD EPYC* のパフォーマンス / 米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス / 米ドルは 4.15 倍 (値が大きいほど高性能)
HPC Linpack (値が大きいほど高性能):
AWS* M5.24xlarge (インテル®) インスタンス、HP Linpack バージョン 2.2 (https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite ディレクトリー: benchmarks_2018.3.222/linux/mkl/benchmarks/mp_linpack/bin_intel/intel64)、インテル® ICC 18.0.3.20180410 (AVX512 有効)、インテル® MPI ライブラリー Linux* OS 版、バージョン 2018 アップデート 3 ビルド 20180411、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS=24、2 MPI プロセス、スコア 3152 Gb/s、測定はインテルが 2018年10月31日に実施。
AWS* M5a.24xlarge (AMD) インスタンス、HP Linpack バージョン 2.2、(HPL ソース: http://www.netlib.org/benchmark/hpl/hpl-2.2.tar.gz、バージョン 2.2、icc (ICC) 18.0.2 20180210 を BLIS ライブラリー・バージョン 0.4.0 のコンパイルとリンクに使用、https://github.com/flame/blis、追加コンパイラー・フラグ: -O3 -funroll-loops -W -Wall –qopenmp、make arch=zen OMP_NUM_THREADS=8、6 MPI プロセス)、 インテル® ICC 18.0.3.20180410 (AVX2 有効)、インテル® MPI ライブラリー Linux* OS 版、バージョン 2018 アップデート 3 ビルド 20180411、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS=8、6 MPI プロセス、スコア 677.7 Gb/s、測定はインテルが 2018年11月7日に実施。

7

結果はインテル® P2CA が AWS* の価格体系 (米ドル / 時間、標準 1 年間、一括前払いなし) を使用して算出 (2019年7月12日時点)。
AWS* EC2 M5 インスタンスおよび M5a インスタンス (https://aws.amazon.com/ec2/instance-types/) 上で実施したパフォーマンス / 米ドル・テスト、96 基の vCPU インテル® Xeon® スケーラブル・プロセッサーの 1 米ドル当たりのパフォーマンスを AMD EPYC* プロセッサーの数値と比較。

ワークロード: サーバーサイド Java* 1 JVM
結果: AMD EPYC* のパフォーマンス / 米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス/米ドル = 1.74 倍 (値が大きいほど高性能)
サーバーサイド Java* (大きいほど高性能):
AWS* M5.24xlarge (インテル) インスタンス、Java* サーバー・ベンチマーク (NUMA バインディングなし)、2JVM、OpenJDK* 10.0.1、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、スコア 101767 トランザクション/秒、測定はインテルが 2018年11月16日に実施。
AWS* M5a.24xlarge (AMD*) インスタンス、Java* サーバー・ベンチマーク (NUMA バインディングなし)、2JVM、OpenJDK* 10.0.1、RedHat* Enterprise Linux* 7.5、カーネル 3.10.0-862.el7.x86_64、スコア 52068 トランザクション / 秒、測定はインテルが 2018年11月16日に実施。

ワークロード: Wordpress* PHP / HHVM*
結果: AMD EPYC* のパフォーマンス/米ドルをベースラインの 1 とすると、インテル® Xeon® スケーラブル・プロセッサーのパフォーマンス/米ドルは 1.75 倍 (値が大きいほど高性能)
ウェブ・フロント・エンド Wordpress* (値が大きいほど高性能):
AWS* M5.24xlarge (インテル) インスタンス、oss-performance/wordpress Ver 4.2.0、Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic、ワークロード・バージョン: 4.2.0、クライアント・スレッド数: 200、PHP 7.2.12-1、perfkitbenchmarker_version=v1.12.0-944-g82392cc、Ubuntu* 18.04、カーネル Linux* 4.15.0-1025-aws、スコア 3626.11 TPS、測定はインテルが 2018年11月16日に実施。
AWS* M5a.24xlarge (AMD*) インスタンス、oss-performance/wordpress Ver 4.2.0、Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic、ワークロード・バージョン: 4.2.0、クライアント・スレッド数: 200、PHP 7.2.12-1、perfkitbenchmarker_version=v1.12.0-944-g82392cc、Ubuntu* 18.04、カーネル Linux* 4.15.0-1025-aws、スコア 1838.48 TPS、測定はインテルが 2018年11月16日に実施。
詳細については、www.intel.co.jp/benchmarks (英語) を参照してください。

8

AWS* M5.4xlarge (インテル) インスタンス、McCalpin Stream (OMP バージョン)、(出典: https://www.cs.virginia.edu/stream/FTP/Code/stream.c)、インテル® ICC 18.0.3 20180410 (AVX512 有効)、-qopt-zmm-usage=high, -DSTREAM_ARRAY_SIZE=134217728 -DNTIMES=100 -DOFFSET=0 –qopenmp, -qoptstreaming-stores always -o $OUT stream.c、Red Hat* Enterprise Linux 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS: 8、KMP_AFFINITY: proclist=[0-7:1]、granularity=thread, explicit、スコア 81216.7 MB/s、測定はインテルが 2018年12月6日に実施。
AWS* M5a.4xlarge (AMD) インスタンス、McCalpin Stream (OMP バージョン)、(出典: https://www.cs.virginia.edu/stream/FTP/Code/stream.c)、インテル® ICC 18.0.3 20180410 (AVX2 有効)、-DSTREAM_ARRAY_SIZE=134217728, -DNTIMES=100 -DOFFSET=0 –qopenmp -qopt-streaming-stores always -o $OUT stream.c、Red Hat* Enterprise Linux 7.5、カーネル 3.10.0-862.el7.x86_64、OMP_NUM_THREADS: 8, KMP_AFFINITY : proclist=[0-7:1]、granularity=thread,explicit、スコア 32154.4 MB/s、測定はインテルが 2018年12月6日に実施。
OpenFOAM の免責宣言。この提供物は、OpenFOAM ソフトウェアを作成して、www.openfoam.com 経由で配布し、さらに OpenFOAM* および OpenCFD* 商標を所有者している OpenCFD Limited から承認を受けたものでも保証を受けたものではありません。
リザーブド・インスタンス料金表に基づく AWS* の価格体系 (2019年1月12日時点、標準 1 年間) (https://aws.amazon.com/ec2/pricing/reserved-instances/pricing/) Linux / Unix の 1 時間単位のオンデマンド使用価格体系 (https://aws.amazon.com/ec2/pricing/on-demand/)。

9

インテル® Xeon® Platinum 9282 プロセッサーとインテル® ディープラーニング・ブースト (インテル® DL ブースト) で推論のスループットが最大 30 倍に向上: 2019年2月26日にインテルが社内で実施したテストの結果に基づきます。プラットフォーム: Dragon rock 2 ソケットインテル® Xeon® Platinum 9282 プロセッサー (ソケット当たり 56 コア)、HT 有効、ターボ有効、メモリー総容量 768GB (24 スロット / 32GB / 2933MHz)、BIOS: SE5C620.86B.0D.01.0241.112020180249、CentOS* 7 カーネル 3.10.0-957.5.1.el7.x86_64、ディープラーニング・フレームワーク: インテル® Optimization for Caffe* バージョン: https://github.com/intel/caffe d554cbf1、ICC 2019.2.187、MKL DNN バージョン: v0.17 (コミットハッシュ: 830a10059a018cd2634d94195140cf2d8790a75a)、モデル: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt、BS=64、データレイヤーなし合成データ: 3x224x224、56 インスタンス / 2 ソケット、データタイプ: INT8 vs. インテルによるテスト結果 (2017年7月11日時点): 2S インテル® Xeon® Platinum 8180 プロセッサー CPU @ 2.50GHz (28 コア)、HT 無効、ターボ無効、スケーリング・ガバナーは intel_pstate ドライバーから「performance」に設定、384GB DDR4-2666 ECC RAM 搭載。CentOS Linux* リリース 7.3.1611 (コア)、Linux* カーネル 3.10.0-514.10.2.el7.x86_64。SSD: インテル® SSD データセンター S3700 シリーズ (800GB、2.5 インチ SATA 6Gb/s、25nm、MLC)。パフォーマンスを測定時の設定: 環境変数: KMP_AFFINITY='granularity=fine, compact‘、OMP_NUM_THREADS=56、CPU 周波数設定: cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe: (http://github.com/intel/caffe/)、リビジョン f96b759f71b2281835f690af267158b82b150b5c。推論は “caffe time --forward_only” コマンドで、トレーニングは “caffe time” コマンドで測定。“ConvNet” トポロジーには、合成データセットを使用。その他のトポロジーについては、データをローカルストレージに保存し、トレーニング前にメモリーにキャッシュ。トポロジーの仕様の詳細については、次のサイトを参照。https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。インテル® C++ コンパイラー (バージョン 17.0.2 20170213)、インテル® マス・カーネル・ライブラリー (インテル® MKL) スモール・ライブラリー (バージョン 2018.0.20170425)。Caffe は「numactl -l」で実行。