第 2 世代インテル Xeon スケーラブル・プロセッサーを搭載した Amazon EC2 M5n インスタンスで、Apache Spark ワークロードの最大 1.72 倍のスループットで、より多くのデータを分析

Apache Spark*

  • 小規模インスタンスのスループットが 1.57 倍に向上し、より多くのデータを分析できます。

  • 中規模のインスタンスのスループットは 1.42 倍。

  • 大規模なインスタンスのスループットは 1.72 倍。

author-image

投稿者:

Amazon Web Services M5n シリーズ・インスタンスの機能インテル® Xeon®スケーラブル・プロセッサー

Amazon EC2 M5n シリーズ・インスタンス第 2 世代インテル Xeon スケーラブル・プロセッサーでマシンラーニングのスループットを向上

ビッグデータが拡大し続ける中、組織は、市場で俊敏性を維持するために、そのデータから得られた教訓を整理し、活用する方法を見つける必要があります。クラウドでデータ分析を実行すると、オンプレミス管理の手間を軽減できますが、インスタンスの選択が複雑なデータ分析ワークロードのパフォーマンスに与える影響を識別することは困難です。Amazon EC2 の Apache Spark ワークロードでは、第 2 世代インテル Xeon スケーラブル・プロセッサーによって有効化された M5n インスタンスを選択することで、一度により多くのデータを並べ替えてより高速なインサイトを得るためのスループットを提供できます。

Amazon EC2 インスタンスを比較する 2 つのマシンラーニング実装のテストでは、第 2 世代のインテル Xeonにより有効化された新しい M5n シリーズのインスタンス。

スケーラブル・プロセッサーは、インテル Xeon E5 v4 プロセッサーを搭載した従来の M4 シリーズ・インスタンスを上回り、Apache Spark* ワークロード向けの最大 1.72 倍のデータ・スループットを実現しました。

マシンラーニングのワークロードが必要なサイズ、小さなインスタンス、中インスタンス、大規模インスタンスなど、古い M4 インスタンスよりも第 2 世代インテル Xeonスケーラブル・プロセッサー・ファミリーを搭載した M5n シリーズ・インスタンスを選択することで、より多くのデータを分析し、実用的なインサイトを迅速に提供できます。

小規模インスタンスのインサイト獲得までの時間を短縮

組織が収集するすべてのデータは、組織が迅速にそれを理解できる場合にのみ価値があります。例えば、顧客の好みの予測や類似の推論は、ビジネスに影響を与えるためにリアルタイムで動作する必要があり、これにはより速く結果を提供できる最新のテクノロジーが必要です。

図 1。Naave Bayesian分類に関する小規模インスタンス (8 vCPU/ 32GB RAM) と HiBench ベンチマーク・スイートの k-means クラスター・ワークロードにおける相対的なスループット比較。

小さなインスタンスと 8 つの vCPU を比較したテストでは、第 2 世代インテル® Xeon® スケーラブル・プロセッサーを搭載した Amazon EC2 M5n インスタンスの選択が示されています。これは、インテル Xeon E5 v4 プロセッサーを搭載した M4 シリーズ・インスタンスの Apache Spark マシンラーニング・ワークロードの最大 1.57 倍のスループットを提供します。

中間インスタンスでのインサイト取得までの時間を短縮

小規模インスタンスと同様に、16 vCPU の中インスタンスを比較したテストでは、第 2 世代インテル® Xeon®スケーラブル・プロセッサー・ファミリーを搭載した Amazon EC2 M5n インスタンスが、Apache Spark でのマシンラーニングの実装を改善しました。この場合、古い M4 インスタンスの最大 1.42 倍のスループットを提供しました。

図 2。Na Nchbench ベンチマーク・スイートの Nanchve Bayesian 分類と k-means クラスター・ワークロードに関する中間インスタンス (16 vCPU / 64GB RAM) における相対的なスループット比較。

大規模なインスタンスのインサイト獲得までの時間を短縮

テストの結果、大規模なインスタンス・サイズ (64 vCPU を使用) ではマシンラーニング・パフォーマンスが劇的に向上し、k-means クラスター・ワークロードにおいて M4 シリーズ・インスタンスの最大 1.72 倍のスループットを提供することが示されています。

図 3。Nanch ベンチマーク・スイートの Nanchve Bayesian 分類と k-means クラスター・ワークロードに関する大規模インスタンス (64 vCPU / 256GB RAM) における相対的なスループット比較。

つまり、データから迅速に実用的な洞察を得ることを目指している組織は、必要なインスタンスのサイズに関係なく、第 2 世代インテル Xeonスケーラブル・プロセッサーによって有効化された、アップグレードした Amazon EC2 M5n インスタンスを選択することで恩恵を受けることができます。

詳細情報

第 2 世代インテル Xeon スケーラブル・プロセッサーを搭載した Amazon EC2 M5n シリーズ・インスタンスで Apache Spark の導入を開始するには、https://www.intel.co.jp/content/www/jp/ja/partner/showcase/aws/overview.html にアクセス してください

テストの詳細については、 http://facts.pt/3Kjn66x を参照してください。

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。 このページの英語版をご覧ください。