• <Intel.co.jp のその他の情報
Masthead Light

インテル® Xeon Phi™ 製品ファミリー

高並列処理で画期的なイノベーションを推進

高並列アプリケーションに先進のパフォーマンスを提供

インテル® Xeon Phi™ コプロセッサーの高並列処理で、画期的なイノベーションを推進しましょう。1 チップで 1 テラ FLOPS を超える倍精度ピーク性能を実現。インテル® Xeon® プロセッサーの消費電力当たり並列処理性能を最高水準に引き上げます。1,2,3,4 x86 互換なので、「再コーディング」せずに「再利用」が可能。すべてのインテル® Xeon® プロセッサー・ファミリー搭載プラットフォームで、言語、ツール、アプリケーションをそのまま利用できます。   

インテル® Xeon Phi™ コプロセッサー:

単一のプログラミング・モデル

インテル® Xeon® プロセッサー、インテル® Xeon Phi™ コプロセッサーのいずれも、インテル® アーキテクチャーをサポートするプログラミング言語、モデル、ツールの広範なエコシステムを利用できます。つまり、一方のプロセッサー・ファミリーで動作するアプリケーションは、もう一方のプロセッサー・ファミリーでも動作します。この共通性により、ソフトウェア開発の複雑さを大幅に軽減できます。既存のアプリケーションのスループットを最大限に引き上げるには、チューニングと再コンパイルが必要になりますが、開発者はプログラム全体を再設計したり、新しいツールやプログラミング・モデルを習得する必要はありません。使い慣れたツールと手法を用いて、既存のコードを再利用したり、共通のコードベースを維持することができます。

さまざまなニーズに応えるコプロセッサー・ファミリー

インテル® Xeon Phi™ コプロセッサーは、最大 61 個のコアと 244 スレッドで構成され、最大 1.2 テラ FLOPS の演算性能を発揮します。ハードウェア、ソフトウェア、ワークロード、パフォーマンス、効率性における多様な要件に対応するため、さまざまな製品が用意されています。

インテル® Xeon Phi™ コプロセッサー・ボード

インテル® Xeon Phi™ コプロセッサー 3100 製品
ファミリー

インテル® Xeon Phi™ コプロセッサー 3100 製品ファミリーは、抜群の並列性能を発揮します。モンテカルロ法、ブラックショールズ、HPL (High-Performance Linpack)、ライフサイエンスなど、演算処理中心のワークロードに最適な選択肢です。

製品仕様を表示 >

インテル® Xeon Phi™ コプロセッサー・ボード

インテル® Xeon Phi™ コプロセッサー 5100 製品
ファミリー

インテル® Xeon Phi™ コプロセッサー 5100 製品ファミリーは、高密度コンピューティングに最適化されており、広いメモリー帯域幅を必要とするワークロード (STREAM など)、大容量メモリーを必要とするワークロード (レイトレーシングなど)、この両方を必要とするワークロード (リバース・タイム・マイグレーション (RTM) など) に最適です。

製品仕様を表示 >

インテル® Xeon Phi™ コプロセッサー・ボード

インテル® Xeon Phi™ コプロセッサー 7100 製品
ファミリー

インテル® Xeon Phi™ コプロセッサー 7100 製品ファミリーは、インテル® Xeon Phi™ 製品ファミリーのなかで最高レベルの機能と演算性能、メモリー容量を提供します。インテル® ターボ・ブースト・テクノロジー 1.0 をサポートしており、電力および温度のヘッドルームを利用してピーク・ワークロード時にコアの動作周波数を引き上げます。

製品仕様を表示 >

インテル® Xeon Phi™ コプロセッサー・ボード

圧倒的なパフォーマンス

1 テラ FLOPS を超える倍精度ピーク性能を実現。1,2,3

インテル® Xeon® プロセッサー E5 ファミリー搭載サーバーに比べて、インテル® Xeon Phi™ コプロセッサーには次のような利点があります。 

  • 高並列アプリケーションでパフォーマンスが最大 2.5 倍に向上1,5,6
  • ピーク FLOPS が最大 3.2 倍に向上1,3,7
  • メモリー帯域幅が最大 2.2 倍に拡大1,8
  • 金融サービス・アプリケーションによってはパフォーマンスが最大 10 倍に向上1,9
  • 消費電力当たり性能が最大 4 倍に向上1,4

インテル® Xeon® プロセッサー E5 ファミリー搭載サーバーにインテル® Xeon Phi™ コプロセッサーを追加することにより、ラック当たり FLOPS が最大 8 倍に向上し、サーバー密度を引き上げることができます。1,3,10

 

インテル® Xeon Phi™ コプロセッサー・ボード

インテル® アーキテクチャーのプログラミングが容易

インテル® Xeon® プロセッサーとインテル® Xeon Phi™ コプロセッサーは、次のような共通の言語、モデル、ツールを使用できるため、アプリケーションはどちらにも対応します。

  • 使い慣れた標準の開発ツール (新しい言語やツールを習得する必要がありません)
  • インテル® Cluster Studio XE といったインテルのツールや、他のベンダーの多様なツール
  • Message Passing Interface、OpenMP、Fortran の DO CONCURRENT*、インテル® スレッディング・ビルディング・ブロック、インテル® Cilk™ Plus といった一般的な手法

柔軟性の高い実行

柔軟性の高いコンピュート・モジュール

インテル® Xeon Phi™ コプロセッサーが提供するコンピューティングの柔軟性を活用:

  • インテル® Xeon® プロセッサーと組み合わせて、高並列コードの処理を高速化できます。
  • 基本的なアクセラレーターと違って、このコプロセッサーでは IP アドレスを設定して個別にアプリケーションを実行できるため、独立したハイパフォーマンス・コンピューティング・コンピュート・ノードを構築できます。

免責事項

open

1. 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。詳細については、http://www.intel.com/jp/performance/ を参照してください。

2. 記述は、コプロセッサー 1 基の倍精度理論ピーク性能の計算値に基づきます。16 DP FLOPS/動作周波数/コア x 61 コア x 1.238 GHz = 1.208 テラ FLOPS。

3. 結果はインテル社内での分析に基づいて推定されており、情報提供のみを目的としています。システム・ハードウェア、ソフトウェアの設計、構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。

4. 2 ソケット インテル® Xeon® プロセッサー E5-2670 搭載サーバーとインテル® Xeon Phi™ コプロセッサー 7120P 1 基を比較 (インテルが消費電力当たりの DGEMM (倍精度汎用行列乗算) 性能を測定。スコア 309 GF/s @ 335W と 829 GF/s @ 195W を比較)。

5. 2 ソケット インテル® Xeon® プロセッサー E5-2600 製品ファミリー搭載サーバーとインテル® Xeon Phi™ コプロセッサーを比較 (2.52 倍: 2012年6月のロスアラモス国立研究所による測定値。分子動力学アプリケーションで 2 ソケット インテル® Xeon® プロセッサー E5-2687 (8 コア、3.10GHz) と出荷前のインテル® Xeon Phi™ コプロセッサー (60 コア、1GHz) 1 基を比較。 ワークロード処理時間 4 時間 7 分 10 秒と 1 時間 38 分 16 秒を比較) (2.53 倍: 2012年10月の Sinopec による測定値。地震探査アプリケーションでコプロセッサーなしの 2 ソケット インテル® Xeon® プロセッサー E5-2680 (8 コア、2.70GHz) 搭載サーバーと、出荷前のインテル® Xeon Phi™ コプロセッサー (61 コア、1.091GHz) を 2 基搭載した同じサーバーを比較。 ワークロード処理時間 1342 秒と 528.6 秒を比較)。

6. インテルは、本資料で参照しているサードパーティーのベンチマークまたは Web サイトの設計や実装について管理や監査を行っていません。本資料で参照している Web サイトまたは類似の性能ベンチマークが報告されているほかの Web サイトも参照して、本資料で参照しているベンチマークが購入可能なシステムの性能を正確に表しているかを確認されるようお勧めします。

7. 倍精度理論ピーク FLOPS (インテル® Xeon® プロセッサー E5-2670 (8 コア、2.60GHz) 2 基とインテル® Xeon Phi™ コプロセッサー 7120P (61 コア、1.238 GHz) 1 基を比較)。 

8. 2 ソケット インテル® Xeon® プロセッサー E5-2600 製品ファミリー搭載サーバーとインテル® Xeon Phi™ コプロセッサーを比較 (2.2 倍:2012年10月のインテルによる測定値。STREAM Triad ベンチマークで 2 ソケット インテル® Xeon® プロセッサー E5-2670 (8 コア、2.60GHz) とインテル® Xeon Phi™ コプロセッサー 7120P (61 コア、1.238GHz) 1 基を比較。スコア 79.5GB/s と 175GB/s を比較)。

9. 2 ソケット インテル® Xeon® プロセッサー E5-2600 製品ファミリー搭載サーバーとインテル® Xeon Phi™ コプロセッサーを比較 (10.75 倍: 2012年10月のインテルによる測定値。単精度モンテカルロ・シミュレーションで 2 ソケット インテル® Xeon® プロセッサー E5-2670 (8 コア、2.60GHz) とインテル® Xeon Phi™ コプロセッサー SE10P (61 コア、1.10GHz) 1 基を比較。 45,501 オプション/秒と 489,354 オプション/秒を比較)

10. (Phi を追加した場合のラック当たり FLOPS) 2 ソケット インテル® Xeon® プロセッサー E5-2670 搭載サーバーと、インテル® Xeon Phi™ コプロセッサー 7120P を 2 基搭載した同じ 2 ソケット・サーバーを比較 (倍精度理論ピーク FLOPS の計算値: 332.8 GF/s と (332.8 + (2 x 1208 GF/s)) を比較)。