Napatech のサムネイル

IPU が ストレージ・ワークロードの計算オーバーヘッドを削減

Napatech は、インテル® IPU 搭載 F2070X IPU と Link-Storege* ソフトウェアを統合し、NVMe over TCP ワークロードをオフロードし、計算オーバーヘッドを削減します。

概要

  • エンタープライズおよびクラウド・データセンターは、パフォーマンス、レイテンシー、スケーラビリティー、管理、リソース使用率の利点により、NVMe/TCP ストレージ・テクノロジーの採用が増加しています。しかし、サーバーのホスト CPU に必要なストレージ・イニシエーター・ワークロードの実装は、大量のコンピューティング・オーバーヘッドを課し、サービスやアプリケーションを実行するために利用可能な CPU コア数を制限します。

  • Napatech の統合ハードウェア・ソフトウェア・ソリューションは、F2070X IPU で実行される Link-Storage ソフトウェア・スタックで構成され、ストレージ・ワークロードをホスト CPU から IPU へオフロードするとともに、アプリケーション・レベルでのソフトウェアの互換性を完全に維持することでこの問題に対応します。

  • Napatech のストレージ・オフロード・ソリューションは、ストレージ機能が消費するホスト CPU コアを開放します。これはソフトウェア・ベースの実装に比較してパフォーマンスを大幅に改善し、データセンター、CAPEX、OPEX、エネルギー消費を削減します。また、セキュリティーの分離をシステムにもたらし、サイバー攻撃に対する保護を強化します。

author-image

投稿者:

NVM Express のロゴこのソリューションの概要では、Napatech の統合ハードウェア・ソフトウェア・ソリューションがどのように NVMe/TCP ストレージ・ワークロードをホスト CPU から IPU にオフロードしてCAPEX、OPEX、エネルギー消費を大幅に削減するかを説明します。また、セキュリティーの分離をシステムにもたらし、サイバー攻撃に対する保護を強化します。

NVMe over TCP とは何ですか?

NVMe/TCP は、標準的なデータセンター・ファブリックを使用してネットワーク上で Non-Volatile Memory Express (NVMe) ストレージ・デバイスにアクセスできるストレージ・テクノロジーです。 図 1 を参照してください。

現代のクラウドおよびエンタープライズ・データセンターでは、NVMe/TCP を採用するところが増えています。これは Internet Small Computer System Interface (iSCSI) ファイバーチャネルなどの旧来のストレージ・プロトコールに比較して、次のような優れた利点を提供できるためです。

図 1.分散型ストレージ・アーキテクチャー

 

  • パフォーマンスの向上: NVMe は、最新の高速 NAND 搭載ソリッドステート・ドライブ (SSD) を最大限に活用するように設計されており、従来のストレージ・プロトコルより大幅に高速なデータ転送レートを提供します。NVMe/TCP は、これらの利点をネットワーク・ストレージ環境にも拡張し、データセンターがファブリック上でハイパフォーマンス・ストレージを達成します。

  • レイテンシーの削減: NVMe/TCP のレイテンシーの低さは、データ集約型のアプリケーションやリアルタイムのワークロードにとって重要です。NVMe/TCP は、コミュニケーション・オーバーヘッドを最小限に抑え、プロトコル返還の必要性を排除することで、ストレージ・アクセス・レイテンシーを削減し、全体のアプリケーション・パフォーマンスを向上させます。

  • スケーラビリティー: データセンターは大規模なストレージの展開を扱うことが多く、NVMe/TCP はネットワーク上で柔軟かつ効率的なストレージ・アクセス・ソリューションを提供することにより、シームレスなスケーラビリティーを実現します。NVMe デバイスの数が増加するにつれて、データセンターは大きなボトルネックなく、ハイパフォーマンス・レベルを維持できます。

  • 共有ストレージ・プール: NVMe/TCP により、複数のサーバーやアプリケーションに同時にアクセスできる共有ストレージ・プールを作成できます。この共有ストレージ・アーキテクチャーは、リソース使用率を改善し、ストレージ管理を簡素化し、コストを大幅に節約します。

  • レガシー・インフラストラクチャーとの互換性: データセンターにはしばしば、イーサネット、InfiniBand、またはファイバーチャネル・ネットワーク上に構築された既存のインフラストラクチャーがあります。NVMe/TCP により、現在のファブリックへの投資を活用しながら、ネットワーク・インフラストラクチャー全体をオーバーホールすることなく、新しい NVMe ベースのストレージ・テクノロジーを統合できます。

  • 高いリソース使用率: NVMe/TCP により、各サーバーの専用ストレージ・リソースの必要性を減らすことで、リソース使用率を向上させます。複数のサーバーがネットワーク上で共有 NVMeストレージ・デバイスにアクセスでき、高額な NVMe ストレージ・リソースの使用を最適化します。

  • 将来への備え: データセンターが進化し、より高速なストレージ・テクノロジーを採用するにつれて、NVMe/TCP はストレージ・アクセスに前向きなアプローチを提供し、ストレージ・ネットワークが最新のアプリケーションおよびワークロードの高まる需要に対応できるようにします。

全体として、NVMe/TCP は、データセンターに強力で柔軟なストレージ・ソリューションを提供し、ハイパフォーマンス、低レイテンシー、高い使用率を共有されたスケーラブルなストレージ環境を実現します。

ソフトウェアのみのストレージ・アーキテクチャーの制限

ストレージ向け NVMe/TCP の優れた利点にもかかわらず、データセンターのオペレーターは、すべての必要なストレージ・イニシエーター・サービスがホストサーバー CPU 上のソフトウェアで実行される実装に関連して、大きな制限があることを認識している必要があります。図 2 を参照してください。

ネットワーク・ストレージ
図 2.ソフトウェア・ベースのネットワーク・ストレージ

 

まず、ストレージ仮想化ソフトウェア、ハイパーバイザー、またはバーチャル・スイッチ (vSwitch) がサイバー攻撃で侵害された場合、システム・レベルのセキュリティー・リスクが発生します。

次に、テナント・ワークロード間を完全に分離する方法はありません。単一のアーキテクチャーがマルチテナント環境で複数の顧客のアプリケーションとデータをホストします。アプリケーションまたは仮想マシン (VM) が最も利用可能なリソースを使用し、共有インフラストラクチャーにおける他のテナントに対してシステム・パフォーマンスを低下させた場合、「ノイジーネイバー」問題が発生します。

最後に、ホスト CPU コアのかなりの部分は、ストレージ仮想化ソフトウェア、ハイパーバイザー、vSwitch などのインフラストラクチャー・サービスを実行するために必要です。これにより、VM、コンテナ、アプリケーション向けに収益化できる CPU コア数が減少します。通常、データセンターの CPU リソースの 30% ~ 50% がインフラストラクチャー・サービスによって消費されていると報告されています。

ハイパフォーマンス・ストレージ・サブシステムでは、ホスト CPU が、Transmission Control Protocol (TCP)、Remote Direct Memory Access over Converged Ethernet (RoCEv2)、InfiniBand、ファイバーチャネルなど、いくつかのプロトコルの実行を必要とする場合があります。ホスト CPU がこれらのストレージ・プロトコルおよびその他のインフラストラクチャー・サービスを実行するために集中的に使用されている場合、テナントのアプリケーションに利用できる CPU コア数が大幅に減少します。例えば、16 コアの CPU でも 10 コアの CPU のパフォーマンスしか提供できない場合があります。

このような理由などにより、ソフトウェアのみのアーキテクチャーは、データセンター・ストレージにとって大きなビジネスおよび技術的課題をもたらします。

IPU ベースのストレージ・オフロード・ソリューション

NVMe/TCP ワークロードを、ハイパーバイザー、vSwitch その他のインフラストラクチャー・サービスに加えて IPU にオフロードする (図 3 参照) ことにより、ソフトウェアのみの実装の制限に対処し、データセンターのオペレーターに多大なメリットをもたらします。

 

  • CPU 使用率: NVMe/TCP 通信は、NVMe コマンドとデータを TCP トランスポート・プロトコル内にカプセル化します。ホスト CPU は、これらのカプセル化およびカプセル化解除タスクをオフロードすることなく処理します。これらの操作を専用のハードウェアにオフロードすることで、CPU は他の重要なタスクに集中し、全体的なシステム・パフォーマンスと CPU 使用率を向上させます。

  • レイテンシーの低下: NVMe/TCP 通信タスクを専門ハードウェアにオフロードすることで、ストレージ・コマンドの処理レイテンシーを大幅に削減できます。その結果、アプリケーションは、リモートの NVMe ストレージ・デバイスにアクセスする際の応答時間の短縮とパフォーマンスの向上を実現できます。

  • 効率的なデータ移動: 非 CPU アプリケーション・タスクをディスクリート・ハードウェア・アクセラレーターにオフロードすることで、汎用 CPU を使用するよりも効率的にデータ移動操作を実行できます。大規模なデータ転送およびバッファー管理を効果的に処理し、レイテンシーを削減し、全体のスループットを向上させます。

  • スケーラビリティーの向上: NVMe/TCP タスクのオフロードは、大規模なストレージ導入におけるスケーラビリティーを向上させます。CPU をネットワーク・コミュニケーションの処理から解放することにより、システムはより多くの同時接続およびストレージ・デバイスを CPU に縛られずにサポートできます。

  • エネルギー効率: 特定のタスクを専用ハードウェアにオフロードすることで、ホスト CPU の消費電力を削減できます。こうしたエネルギー効率は、消費電力が重要な考慮事項である大規模なデータセンター環境において、特に重要です。

ipu 分散型ストレージ
図 3.IPU 対応分散型ストレージ​​​​

 

NVMe/TCP ストレージ・ワークロードに適用される上記の利点に加えて、IPU ベースのシステム・アーキテクチャーは、インクリメンタルなセキュリティー分離オプションを提供することで、インフラストラクチャー・サービスをテナントのアプリケーションから分離します。これにより、ストレージ、ハイパーバイザー、vSwitch サービスが、テナント・アプリケーションによって開始されたサイバー攻撃に侵害されないようにします。インフラストラクチャー・サービス自体は、IPU 自体のブートプロセスが安全であるため保護されており、一方 IPU はホストサーバーの Root of Trust として機能します。

Napatech の統合ハードウェア・ソフトウェア・ソリューション

Napatech は、F2070X IPU で実行されるハイパフォーマンスの Link-Storage ソフトウェア・スタックで構成され、データセンター・ストレージのオフロード向けに統合されたシステムレベルのソリューションを提供します。図 4 を参照してください

図 4.F2070X IPU で実行されている Napatech のストレージ・オフロード

 

Link-Storage ソフトウェアには、次のような豊富な機能セットが組み込まれています。

 

  • NVMe/TCP ワークロードのホストから IPU への完全なオフロード;

  • TCP ワークロードのホストから IPU への完全なオフロード;

  • NVMe から TCP イニシエーター;

  • Storage Performance Development Kit Remote Procedure Call (SPDK RPC) インターフェイス上のストレージ構成;

  • マルチパス NVMe サポート;

  • 16 のブロックデバイスの virtio-blk インターフェイスを介したホストへのプレゼンテーション;

  • 共通の Linux* ディストリビューションにおける標準 virtio-blk ドライバーとの互換性;

  • ホスト CPU と IPU 間のセキュリティーの分離。ネットワーク・インターフェイスはホストに公開しません。

Link-Storage に加えて、F2070X は Link-Virtualization ソフトウェアもサポートしており、Open vSwitch (OVS)、ライブ移行、VM から VM へのミラーリング、VLAN/VxLAN カプセル化とカプセル化解除、Q-in-Q、受信側スケーリング (RSS) ロードバランス、リンク集約、Quality of Service (QoS) などの機能を含む、オフロード、加速化、および仮想化されたデータプレーンを提供します。

F2070X は ASIC ではなく FPGA および CPU をベースとしているため、プラットフォームの全機能を導入後にアップデートできます。既存のサービスの変更、新機能の追加、または特定のパフォーマンス・パラメーターの微調整のいずれにおいても、こうした再プログラミングは、純粋に既存のサーバー環境内のソフトウェア・アップグレードとして、ハードウェアを接続解除、削除、または交換することなく実施できます。

Napatech F2070X IPU

インテル® IPU プラットフォーム F2000X-PL 搭載 Napatech F2070X IPU は、インテル® Agilex™ 7 FPGA F シリーズおよびインテル® Xeon® D プロセッサーを搭載した、フルハイト、ハーフレングス (FHHL)、デュアルスロット・フォームファクターの 2x 100G PCIe カードです。

F2070X IPU の標準構成は、4GB DDR4 メモリー 4 バンクを備えたインテル® Agilex™ 7 FPGA AGF023 と、8GB DDR4 メモリー 2 バンクを備えた 2.30GHz のインテル® Xeon® D-1736 プロセッサーとなっています。特定のワークロードをサポートするために、ほかの構成オプションを提供することができます。

F2070X IPU は、PCIe 4.0 x16 (16GTps) インターフェイスを介してホストに接続し、また追加の PCIe 4.0 x16 (16GTps) インターフェイスで FPGA とプロセッサー間を接続します。

2 つのフロントパネル QSFP28/56 ネットワーク・インターフェイスが次のネットワーク構成をサポートします。

 

  • 2x 100G
  • 8x 10G または 8x 25G (ブレークアウト・ケーブルを使用)。

専用 PTP RJ45 ポートは、外部 SMA-F および内部 MCX-F コネクターとの時間同期をオプションで提供します。IEEE 1588v2 時刻同期がサポートされています。

専用 RJ45 イーサネット・コネクターは、ボード管理を提供します。安全な FPGA 画像アップデートにより、IPU の導入後に新しい機能を追加または既存の機能をアップデートできます。

プロセッサーは、UEFI BIOS、PXE ブートサポート、SSH 経由のフル・シェル・アクセス、および UART を搭載した Fedora Linux を実行します。

インテル® IPU F2000X アダプター
インテル® IPU プラットフォーム F2000X-PL アダプター