クラウドにおける HPC の効率的な実現
ハイパフォーマンス・コンピューティング (HPC) アプリケーションのためのクラウド利用が継続的に増加
クラウドにおける HPC 市場は 2024年までに 90 億米ドル規模へ成長すると予測1
HPC シミュレーションが金融サービス、医療、輸送の分野のイノベーションを促進
インテルと AWS は 10 年以上にわたってコラボレーションを続け、HPC と人工知能 (AI) のニーズを満たしてアプリケーション開発者とそのユーザーを支援する生産性の高いクラウド環境を推進してきました。
インテルと AWS による標準規格をベースとしたアプローチは、豊富な機能を備えたクラウド環境を提供し、カスタマイズによって多様な HPC および AI ワークロードの要求に対応できます。
AWS 開発者のためのコラボレーションの主な特徴
1.革新的なインテルのハードウェア
内蔵された機能が AI と HPC ワークロードのパフォーマンスを強化
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) は、科学的シミュレーション、財務分析、AI とディープラーニング、3D モデリングと分析、画像とオーディオ / ビデオ処理、暗号化処理、データ圧縮処理などの幅広いワークロードにメリットをもたらします。
ディープラーニング推論を加速
インテル® ディープラーニング・ブースト (インテル® DL ブースト) は、ベクトル・ニューラル・ネットワーク命令 (VNNI) によってインテル® AVX-512 を強化します。このテクノロジーは、画像分類、音声認識、言語翻訳やオブジェクト検出などのワークロードに大きなメリットをもたらします。
最も必要な時にさらに高速なパフォーマンスを実現2
インテル® ターボ・ブースト・テクノロジー 2.0 は、プロセッサー・コアが電力、電流、温度の仕様限界未満で稼動している場合に、自動的に定格の動作周波数よりも高速でプロセッサー・コアを動作させることができます。新しくリリースされた Amazon EC2 M5zn インスタンスは、全コアターボ周波数が最大 4.50GHz のクラウドで最速なインテル® Xeon® スケーラブル・プロセッサー・ファミリーを提供します。
2.インテルによる世界クラスの開発者向けツールの詳細
開発者は、インテル® アーキテクチャーの機能を採用することで、スケールアップとスケールアウトのアプリケーション・パフォーマンスを最適化できます。標準規格をベースに統合された、インテルのプログラミング・モデル、インテル® oneAPI (ベータ版) は次を提供します。
- 分析およびデバッグツールによって、コード最適化を発見し、世代を超える継続的なコード改善を実現。
- TensorFlow や PyTorch などの最適化された AI およびマシンラーニング・フレームワークはインテル® AVX 512 やインテル® DL ブーストといったインテル® アーキテクチャー機能を活用。3
- OpenVINO™ ツールキットの利用により、異なるアーキテクチャーにまたがる導入を実現。
- インテル® ディストリビューション for Python の利用により、データサイエンスと AI フレームワークのパフォーマンスを向上。インテル® ディストリビューション for Python が、どのよう予測可能動作に関する実験を加速するのか、詳細をご覧ください。
- インテル® DevCloud では、開発者は無償の開発サンドボックスで多数のテクノロジーを試用可能。
インテル® OneAPI 業界イニシアチブの業界レビューを読む
3.ソリューションを容易に導入
標準的なクラスター・アーキテクチャーにパッケージ化されたハードウェアとソフトウェア。
ユーザーが HPC ソリューションを取得、実行する方法を加速化および簡易化。
インテル® HPC Platform Specification により、共通のインターフェイスを利用して対象プラットフォームの幅広いアプリケーション・ニーズに対応。
インテルおよび AWS は、HPC ワークロード実行に最適化されたソリューションを作成するためコラボレーションを行い、AWS ParallelCluster を使ったシミュレーションおよびモデリング向けインテル® Select ソリューションをリリースしました。
4.開発を加速化し、投資収益率を向上させるそのほかの機能
- 開発者とユーザーが最適化やソリューション統合実現のために費やせる時間は限られています。より簡単な方法が必要です。
- インテルと AWS は、最適化の調整によってクラウドベース HPC のこの障壁を排除し、AWS Elastic Fabric Adapter とインテル® MPI ライブラリーを利用してパフォーマンスを向上させました。
- Open Fabrics インターフェイスに基づいて構築されたこの組み合わせは、100 GbE のファブリック・パフォーマンスとアプリケーション・ワークロードを多くのインスタンスにスケールアウトするのに必要な低レイテンシーを提供します。
- このソリューションは AWS ParallelCluster を利用してパッケージ化されています。