最適化されたハイパフォーマンス・コンピューティング (HPC) アーキテクチャーとアプリケーションを構築

新しいテクノロジーとソフトウェア開発ツールは、ユーザー、システム構築者、ソフトウェア開発者向けて、幅広い HPC アーキテクチャーとコンピューティング・モデルのパワーを解放します。

HPC システムのビルディング・ブロック

  • HPC システムの設計には、並列コンピューティング、クラスター・コンピューティング、グリッド/分散コンピューティング戦略の組み合わせが含まれる場合があります。

  • オンプレミス・インフラストラクチャーとパブリック・クラウド・リソースを組み合わせたハイブリッド・クラウド・アプローチにより、必要に応じてスケールアップし、機会損失リスクを減らすことができます。

  • インテルの HPC テクノロジーには、プロセッサー、メモリー、インテル搭載のハイパフォーマンス・ネットワーキング、ソフトウェアが含まれており、ハイパフォーマンス、非常に拡張性の高いシステムの基盤を提供します。

  • oneAPI のオープンな規格に準拠したクロスアーキテクチャー・プログラミングにより、さまざまな異種のアーキテクチャー・タイプと分散コンピューティング・モデル全体にわたって、最適に実行される HPC アプリケーションが可能になります。

  • インテルのライブラリーとツールにより、効率的なコードと最適化を介して、お客様がインテルのシステムを最大限に活用することができます。

author-image

投稿者:

今日の加速化するビジネス環境において、HPC テクノロジーを成功させる基盤は、明確に定義された HPC アーキテクチャーから始まります。組織のワークロードとコンピューティングの目標に応じて、さまざまな HPC システムデザインとサポートリソースを利用し、生産性の向上とスケーラブルなパフォーマンスを実現できます。

HPC システムの設計

HPC アーキテクチャーは、ニーズに基づいた多くの形式を取り入れています。組織は、HPC システムを設計する各種方法から選択できます。

複数のアーキテクチャーにわたる並列コンピューティング

HPC 並列コンピューティングにより、HPC クラスターは大規模なワークロードを実行し、同時に実行される別々の計算タスクに分割することが可能です。

これらのシステムは、スケールアップまたはスケールアウトするように設計できます。スケールアップの設計では、単一システム内にジョブの取得と分割を含むため、個々のコアが作業を実行して、サーバーの可能な限り多くの部分を活用することができます。一方、スケールアウトの設計は、同じジョブを取得し、管理可能なパーツに分割して、すべての作業を並列に実行する複数のサーバーまたはコンピューターへと配布しています。

シミュレーション、モデリング、高度な分析などの集約的なワークロードが一般的になるにつれて、HPC システムは、CPU だけでなくアクセラレータを組込むように設計されています。これらのアクセラレーターには、開発者がサポートする必要のある、より広範で異種の有力な構成が導入されています。

開発者は oneAPI クロスアーキテクチャー・プログラミングを使用し、より生産性とパフォーマンスに優れた開発のために、CPU、GPU、FPGA アーキテクチャー全体で使用できる単一のコードベースを作成することができます。oneAPI デベロップメントは、独自のプログラミング・モデルの制約を削除し、新しいハードウェアの採用を緩和し、コードのメンテナンスを削減することで、HPC イノベーションを加速することが可能です。oneAPI およびインテル® oneAPI ツールキットは、C++、SYCL、Fortran、OpenMP、MPI、Python などの HPC 開発者が必要な既存のオープンスタンダードと言語をサポートします。oneAPI およびインテル® oneAPI ツールキットの詳細を入手する

クラスター・コンピューティング

ハイパフォーマンス・コンピューティング・クラスターは、ローカルエリア・ネットワーク (LAN) を介して、複数のコンピューター、またはノードをリンクします。これらの相互接続されたノードは、最先端の計算能力を備えた 1 台のコンピューターとして機能します。HPC クラスターは、システム内のノードにまたがって、1 つの問題を解決したり、1 つの複雑な計算タスクを実行したりするように独自に設計されています。HPC クラスターには定義済みのネットワーク・トポロジーがあり、組織は妥協のない処理速度で高度な計算に取り組むことができます。

グリッドと分散コンピューティング

HPC グリッド・コンピューティングと HPC 分散コンピューティングは、同義のコンピューティング・アーキテクチャーです。これらには、複雑な問題の解決や大規模な計算タスクの実行など、共通の目標を共有するネットワークを介して接続された複数のコンピューターが含まれます。このアプローチは、別々のかたまりに分割してグリッド全体に分散できるジョブに取り組むのに理想的な方法です。システム内の各ノードは他のノードと通信することなく、独立してタスクを実行できます。

HPC クラウド・インフラストラクチャー

これまでは、HPC システムは、オンプレミス・インフラストラクチャーが提供する容量と設計に制限されてきました。現在では、クラウドは追加のリソースを使用して、現地の容量を拡張します。

最新のクラウド管理プラットフォームにより、ハイブリッド・クラウド・アプローチが可能になります。これにより、オンプレミス・インフラストラクチャーとパブリック・クラウド・サービスが融合し、利用可能なすべてのリソース間でワークロードがシームレスに流れるようになります。これにより、HPC システムの導入や、迅速なスケールアップを可能に方法について、柔軟性をさらに高め、合計所有コスト (TCO) を最適化する機会を増やすことができます。

通常、オンプレミス HPC システムは、クラウドで 24 時間 365 日稼働している同等の HPC システムよりも低い TCO を提供します。ただし、ピーク時の容量に合わせたサイズのオンプレミス・ソリューションは、そのピーク時の容量に達した場合にのみ完全に利用されます。多くの場合、オンプレミス・ソリューションは十分に活用されず、リソースがアイドル状態になります。ただし、利用可能な容量が不足しているために計算できないワークロードは、機会を失う可能性があります。

つまり、クラウドを使用してオンプレミス HPC インフラストラクチャーを時間的制約があるジョブ向けに強化すると、大きな機会を逃すリスクを軽減できます。

クラウドで HPC イノベーションを推進するために、インテル® ソフトウェア・ガード・エクステンションズ (インテル® SGX)、インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) などのテクノロジーを適用し、クラウド・サービス・プロバイダーとの連携を徹底することで、パフォーマンスを最大化し、初期化を簡素化します。インテルの HPC クラウド・テクノロジーの詳細と、成果向上の支援方法については、こちらをご覧ください

スケーラビリティーとパフォーマンスのための HPC プロセッサーの選択

インテルは、HPC テクノロジーに関する幅広い専門知識により、最も要求の厳しい将来のワークロードを処理するためのパフォーマンス要件を提供します。インテル® Xeon® スケーラブル・プロセッサーは、重要な HPC ワークロードの様々なパフォーマンス要件をサポートするために、シームレスに拡張できる汎用性の高いプラットフォームを提供します。近日発売予定の Xe HPG マイクロアーキテクチャーをベースにしたデータセンター GPU は、インテル® Xeon スケーラブル・プロセッサー・プロセッサーに理想的な補完を加え、パフォーマンスをさらに向上させるのに役立ちます。

インテルのエコシステムと連携して、インテルは最適化された HPC システム設計の実現に向けた青写真作成における取り組みを優先しました。パフォーマンス要件の検証を行うため、インテル® Cluster Checker (インテル® oneAPI HPC ツールキットの一部) は、HPC クラスターシステムが完全であり、オンプレミスと HPC クラウドシステム間を移動するための優れた移植性で並列アプリケーションを実行するように構成されていることを確認します。

インテル® CoFluent™ テクノロジーを使用すると、複雑なシステムの展開を高速化し、シミュレートされたハードウェアとソフトウェアの相互作用をモデリングすることで最適な設定を決定できます。

HPC メモリーのブレークスルー

メモリーは、HPC システムデザインに不可欠なコンポーネントです。システムの短期データストレージを行うメモリーは、ワークフローのパフォーマンスを制限する要因になる可能性があります。インテル® Optane™ テクノロジーは、ストレージ階層とメモリー階層のギャップを埋めることにより、データセンターのこれらのボトルネックを克服し、コンピューティングの供給を維持するのに役立ちます。

高帯域幅メモリーは、HPC プログラミングで使用される GPU にも含まれている場合に成功を示し、すぐに x86 プロセッサーにおいても利用できるようになります。多くの場合、高帯域メモリー・テクノロジーは、コードの変更なしにバインドされるメモリー帯域幅のコードを高速化することができます。また、DDR メモリーコストの削減にも役立ちます。

HPC ファブリックを使用したパフォーマンスのスケーリング

より効率的に小規模な HPC システムをスケールするには、組織は HPC クラスターをサポートするように設計されたハイパフォーマンス・ファブリックを必要とします。

インテルのハイパフォーマンス・ネットワーキング (HPN) は、馴染みのある費用対効果の高いイーサネット・テクノロジーを使用して、最適化されたパフォーマンスを提供します。これにより、クラスター・マネージャーには、HPC および機械学習のトレーニングで必要とされるものをカバーするエンドツーエンドのソリューションが提供されます。oneAPI を含む既存の人気の高い HPC や AI ミドルウェアおよびフレームワークは、OpenFabrics Interfaces(OFI、libfabrics とも呼ばれます) およびインテル® Ethernet Fabric Suite を通じて、インテルの HPN で使用することができます。

HPC 成功へのより簡単な道筋

インテルは、HPC アプリケーション、アーキテクチャー、さらに、どの HPC システム (オンプレミス、クラウド、ハイブリッドのいずれか) がユーザーの結果の生成と成果の最大化を促進するために必要とされるのかを深く理解する専門知識を提供します。インテル® テクノロジーの基盤に基づいた HPC アーキテクチャーにより、将来の HPC やエクサスケール、ゼッタスケールのニーズを満たす準備ができます。

さらに、oneAPI ツールキットでは、開発者が HPC プログラミングの取り組みを簡素化できるよう準備し、より多くのハードウェア・タイプをサポートして、ビジネスの成果を最大化することができます。

よくある質問 (FAQ)

よくある質問

ハイパフォーマンス・コンピューティング・アーキテクチャーとは、HPC システムの構築に使用されるさまざまなコンポーネントとパッケージ化の方法を指します。しばしば、これらのコンポーネントには、FPGA や GPU、さらにメモリー、ストレージ、ネットワーキング・コンポーネントなどの CPU やアクセラレーターが含まれています。さまざまなアーキテクチャーのノードまたはサーバーが、並列ノードまたはクラスターノードのいずれかとして一斉に動作し、複雑なコンピューティングなどのタスクを処理します。

任意の HPC システムで最も重要な 3 つのコンポーネントは、プロセッサー、FPGA または GPU などのアクセラレーター、およびネットワーキング接続です。高帯域幅メモリーは別の重要な考慮事項です。