インテル® Ethernet Fabric Suite ソフトウェアのインストール・ガイド

ドキュメント

インストール & セットアップ

000059662

2021/09/09

ベーシックインテル® Ethernet Fabric Suiteパッケージ をダウンロードするか、FS パッケージをインテル® Ethernet Fabric Suiteしてください

この記事では、インテル® Ethernet Fabric Suite (インテル® EFS) ソフトウェアのインストールを開始するための手順と情報を提供します。

このセクションでは、管理ノードまたはファブリックのホストノードにインテル® Ethernet Fabric Suiteソフトウェアをインストールする情報と手順を説明します。

次のいずれかの方法でソフトウェアをインストールします。

  • TUI メニュー (推奨)
  • CLI コマンド
  • インテルが提供する Linux* ディストリビューション・ソフトウェア・パッケージ

インストール TUI を使用して管理ノードにインテル EFSソフトウェアをインストールし、FastFainstall を使用して管理ノードを設定することをお勧めします。

メモ

管理ノードで適切な設定を行わないと、一部のツールやアプリケーションが動作しなくなる場合があります。例えば、MPI アプリケーションではパスワードレスの SSH が必要となる場合があり、FastFaズマの一部の機能は適切な SNMP 設定に依存します。インテル® Ethernet Fabric Suite (インテル® EFS) ソフトウェアをインストールした後で FastFa cedar TUI または CLI コマンドを使用して管理ノードを設定することは非常に重要です。

管理ノードを構成した後は、FastFaの tUI またはプロビジョニングまたはディスクレス・ブート・メカニズムを使用して、残りのホストすべてにベーシック・ソフトウェアをインストールできます。

メモ

プロビジョニング・システムを使用している場合は、プロビジョニング・システムに付属するドキュメントを参照してください。

インストールを開始する前に、以下の手順を実行してください。

  • 互換性のあるオペレーティング・システムと必要な OS RPM のインストールの前提条件については、 この記事 を参照してください。
  • インストール前の要件については、 この記事 を参照してください。
  • GPUDirect* サポートが必要な場合は、NVIDIA_GPU_DIRECTのエクスポートを含むソフトウェア・インストール・ガイドの NVIDIA* ソフトウェアのダウンロードとインストール (オプション) セクションにアクセスします。
  • IEFS ソフトウェア・パッケージをダウンロードして抽出しました。
  • Install CLI コマンドを使用してカスタマイズされたインストールを使用している場合は、コマンドラインオプションを準備します。
  • 設定する各インターフェイスの IP アドレスと netgears のリストを収集します。

INSTALL コマンドライン・オプションの使用

ベーシックおよび FS のインストール用の ./INSTALL コマンドは、次のディレクトリーから発行されます。

  • インテル基本ディレクトリー: Intel2-Basic.DISTRO.VERSION
  • インテル FS ディレクトリー: Intel2-FS.DISTRO.VERSION

構文
./INSTALL [-v|-vv] -R osver [-a|-n|-U|-u|-s|-O|-N| -i comp| -e comp] [-G] [-E comp] [-D comp] [-user-space] [-without-depcheck] [--rebuild] [-force] [-answer keyword=value]
または
./INSTALL -C
または
./INSTALL -V

オプション

  • オプションが選択されていない: インテル® EFS ソフトウェア TUI が表示されます。
  • -v: スプログ機能を提供します。 /var/log/iefs.log ファイルにログします。
  • - vv: 非常に多くのデバッグログを提供します。 /var/log/iefs.log ファイルにログします。
  • -R osver: カーネルを実行するのではなく、特定の OS カーネルバージョンに強制的にインストールします。
  • -a: デフォルトのオプションを使用して、すべての上位層プロトコル (ULP) とドライバーをインストールします。
  • -n: デフォルトのオプションですべての ULP とドライバーをインストールしますが、自動起動オプションは変更しません。
  • -U: 現在インストールされているすべての ULP とドライバーをデフォルトのオプションでアップグレード /再インストールします。また、自動起動オプションは変更しません。
  • -u: デフォルトのオプションですべての ULP とドライバーをアンインストールします。
  • -s: インストールされているすべてのソフトウェアの自動起動を有効にします。
  • -O: 現在変更されている rpm 構成ファイルを保持します。
  • -N: 新しいデフォルトの rpm 設定ファイルを使用します。
  • -i comp: デフォルトのオプションを使用して、指定したコンポーネントをインストールします。このオプションはコマンドラインに複数回表示される場合があります。
大事な

このコマンドを使用して既存の FS に対して個々のコンポーネントをアップグレードまたはダウングレードすると、以前にインストールされたすべてのコンポーネントがインストールされている個々のコンポーネントのバージョンに更新されます。

  • -e comp: デフォルトのオプションで特定のコンポーネントをアンインストールします。このオプションはコマンドラインに複数回表示される場合があります。
  • -E comp: 特定のコンポーネントの自動起動を有効にします。このオプションは -D と共に、またはコマンドラインに複数回表示されます。
メモ自動起動用に設定されているインストール済みソフトウェアを制御するには、このオプションを -a、-n、-i、-e、-U   オプションと組み合わせます。
  • -D comp: 特定のコンポーネントの自動起動を無効にします。このオプションは -E と共に、またはコマンドラインに複数回表示される場合があります。
メモ自動起動用に設定されているインストール済みソフトウェアを制御するには、このオプションを -a、-n、-i、-e、-U オプションと組み合わせます。
  • --user-space: インストール中にカーネル・スペース・コンポーネントをスキップします。
  • --withoutdepcheck: OS の依存性のチェックを無効にします。
  • --rebuild: カーネルモジュール srpms の再構築を強制します。
  • --force: ディストリビューションが一致しない場合でも、強制的にインストールを実行します。このオプションを使用すると、未定義の動作が生じる可能性があります。
  • --answer キーワード=value: 操作中に生じる可能性のある質問に対する回答を提供します。質問のない質問への回答は無視されます。回答が無効な場合、インタラクティブ・インストールのプロンプトが表示されたり、非インタラクティブ・インストール用のデフォルトが使用されたりします。

よくある質問

ARPTABLE_TUNNING 大規模ファブリックのカーネル ARP テーブルサイズの調整
RoCE RDMA トランスポートROCE_ON
LIMITS_SEL リソース制限セレクター

  • -C: サポートされているコンポーネント名のリストを表示します。
  • -V: ソフトウェアのバージョン番号を出力します。
  • -G: GPU サポート・コンポーネントをインストールします。

その他の情報

  • サポートされているコンポーネント (comp) 名: eth_tools, psm3, fastfa eth_rdma , openmpi_gcc_ofi, mpisrc, delta_debug
  • サポートされているコンポーネント (comp) 名: eth 、mpi、psm_mpi
  • -G (GPU) インストール用コンポーネント:
    RHEL* の場合: iefs-kernel-updates-de,iefs-kernel-updates-dkms, kmod-iefs-kernel-updates, iefs-kernel-updates-debuginfo, libpsm3-fi, libpsm3-fi-debuginfo, openmpi_gcc_cuda_ofi
    SLES* の場合: iefs-kernel-updates-de cedar, iefs-kernel-updates-kmp-default, iefs-kernel-updatesdkms, libpsm3-fi, openmpi_gcc_cuda_ofi
 TUI メニューを使用してインストールする

[インテル® EFS ソフトウェア] メニューを使用して、インテル® Ethernet Fabric Suite ソフトウェア基本パッケージと FS ソフトウェア・パッケージの両方をインストールできます。設定する各インターフェイスの IPV4 IP アドレスと net スチバチスのリストがあります。

インテル® EFS ソフトウェアをインストールするには、次の手順を実行します。

注意

処理中の操作を中断しないでください。一部の操作は完了まで数分かかる場合があります。

 

ステップタスク / プロンプトアクション
1コマンドプロンプトで、ディレクトリーをインストール・ソフトウェア・パッケージの場所に変更します。
  • ベーシックについては、次のように入力してEnterキーを押します
  • FS では、次のように入力してEnterキーを押します バージョンはディストリビューションと CPU です。
2コマンドプロンプトで、インストール・スクリプトを 開始 します。

./INSTALL と入力してEnterキーを押します

 
メモ
  • GPU サポートで FS をインストールするには、./INSTALL -G を 使用 します。
  • 異なるルート・ディレクトリーを使用して FS をインストールするには、chinstall使用します。
  • chlinux 環境のカーネル・バージョンがホストのカーネル・バージョンと異なる場合は、./INSTALL -R を 使用して、ターゲットの OS カーネルバージョンで FS のインストールを強制します。
3 1) ソフトウェアのインストール / アンインストール を選択します。1 と入力します
4インストールする項目を確認します。デフォルトを受け入れます (アクションは必要ありません)。
N をクリックして次のページに移動します。
メモ

項目を変更する必要がある場合は、項目に関連付けられているアルファベットと数字を入力して、[インストール] または [インストールしない] を切り替えます。

5インストールを開始します。P と入力してアクションを実行します。
注: これには数分かかる場合があります。
6インストール用 OFA バージョン・リリースの準備...OFA SRPM の再構築 (a=all、SRPM ごとに p=プロンプト、必要に応じて n= のみ?
[n]
プレス 入力 をクリックしてデフォルトを受け入れます。
メモ

システムには、インストール中に応答が必要なプロンプトが表示されます。

7各システムプロンプトについて...デフォルトを次に受け入れます。 押して 入力 続行します。
メモ

デフォルトのプロセスの中には、完了まで数分かかる場合があります。

8[自動起動] メニューインテル® EFS表示されたら、項目を確認します。インテルでは、すべての自動起動選択をデフォルトの値に設定しておくことをお勧めします。
メモ

項目を変更する必要がある場合は、項目に関連付けられているアルファベットと数字を 入力 して 、[有効] または [ 無効]を切り替えます。

9インテル® EFS自動起動操作を実行します。P と入力します
10各システムプロンプトで「任意のキーを押して続行します...」。任意のキーを押します。
メモ

インストールが完了すると、メインメニューに戻ります。

11コマンド・プロンプトが表示されたら、TUI から終了します。X と入力します
12サーバーを再起動します再起動 そして プレス 入力.
メモ

再起動プロセスを中断しないでください。
お使いのオペレーティング・システムによっては、再起動に数分かかる場合があります。

13インストールが正常に完了したことを確認します。 iefsconfig -V と 入力してEnterキーを押します
  CLI コマンドを使用したインストール

./INSTALL コマンドを使用すると、インテル® Ethernet Fabric Suiteソフトウェア基本パッケージと FS ソフトウェア・パッケージの両方をインストールできます。

./INSTALL コマンドには、単一コンポーネントのインストール、コンポーネントの自動起動の有効化と無効化など、多くのオプションがあります。このセクションでは、デフォルトのインストール方法について説明しますが、よりカスタマイズされたインストール用に固有のオプションを含む install コマンドを追加することができます。

設定する各インターフェイスの IPV4 IP アドレスと net スチバチスのリストがあります。

デフォルトの インテル® EFS ソフトウェア構成をインストールするには、次の手順を実行します。

ステップタスク / プロンプトアクション
1コマンドプロンプトで、ディレクトリーを場所に 変更 します。
インストール・ソフトウェア・パッケージの数:
  • [基本] に次のように入力、Enterキーを押します
    cd Intel22-Basic.DISTRO.VERSION
  • FS の場合、次のように入力してEnterキーを押します
    cd Intel 22-FS.DISTRO.VERSION (DISTRO)バージョン はディストリビューションと CPU です。
2コマンドプロンプトで、インストール・スクリプトを開始します。

./INSTALL -n と入力してEnterキーを押します
メモ:

  • GPU サポートで FS をインストールするには、./INSTALL -n -G使用します。
  • 異なるルート・ディレクトリーを使用して FS をインストールするには、chinstall使用します。
  • chlinux 環境のカーネル・バージョンがホストのカーネル・バージョンと異なる場合は、./INSTALL -R を使用して、ターゲットの OS カーネルバージョンで FS のインストールを強制します。
3コマンドプロンプトで、サーバーを再起動します。 rebootと入力してEnterキーを押します
インテルが提供する Linux* ディストリビューション・ソフトウェア・パッケージを使用してインストールする

インテル® Ethernet Fabric Suite (インテル® EFS) ソフトウェア FS パッケージには、インテル® EFS ソフトウェアをインストールするための OS 固有のリポジトリーが含まれています。

このセクションでは、FS パッケージ・リポジトリーを使用してインストールする手順を説明します。

インテルは、FS のインストールを容易にするために仮想パッケージを導入しました。

  • プリフィクスが付いた仮想パッケージ ethmeta_、INSTALL スクリプト内の FS コンポーネントのメタパッケージです。メタパッケージをインストールすると、対応するコンポーネントがインストールされます。
  • プリフィクスが付いた仮想パッケージ ethnode_ は、HPC ノードに一般的な FS をインストールするための別名パッケージです。

デフォルトのインストール・オプション

このインストール方法は、デフォルトのオプションインテル® EFSパッケージをインストールします。異なるオプションを使用してインストールするには、インストールの前に以下のシステム環境変数を設定してください。

  • 変数名: ETH_ARPTABLE_TUNING
    値:
    1 - 大規模ファブリックのカーネル ARP テーブルの調整を有効にします (デフォルト)
    0 - 大規模ファブリックのカーネル ARP テーブルの調整を無効にする
  • 変数名: ETH_ROCE_ON
    値:
    1 - サポートされている NIC で RoCE を有効にします (デフォルト)
    0 - サポートされている NIC で RoCE を無効にする
  • 変数名: ETH_LIMITS_CONF
    値:
    1 - 調整済みメモリー制限設定を有効にします (デフォルト)
    0 - 調整済みメモリー制限設定を無効にする

インテル EFSパッケージに含まれるリポジトリー

インテル EFS パッケージには次のリポジトリーが含まれています。
IEFS_PKGS: ストレージノードなど、コンピュート・ノード、管理ノード、またはサービスノードにインストールするために必要なすべてのソフトウェアが含まれます。
IEFS_PKGS_CUDA: NVIDIA カードを含むノードにインストールするために必要なすべてのソフトウェアが含まれます。

メモこの 2 つのリポジトリーは、どのノードでも実行できません。1 つのみ存在するか、有効になっていることを確認します。

INSTALL スクリプトを使用して相互運用します。

インテルでは 、yum/zypper リポジトリー・ベースのインストールとスクリプト・ベースのインストールを混在しないことを推奨します。この操作を実行すると、予期しない動作を引き起こす可能性があります。ただし、インストール・メカニズムを切り替えることができます。

  • スクリプトベースのインストールから yum/zypper ベースのインストールに切り替えます。
    お客様はいつでも yum/zypper ベースのインストールに切り替えることができます。特別な操作は必要ありません。 yum/zypper ベースのインストールに切り替えるには: スクリプトですでに一部または完全にインストールインテル® EFS場合 、yum/zypper ベースのインストールはインストール済みのパッケージを識別し、インストール中にそれらをスキップします。
  • yum/zypper ベースのインストールからスクリプトベースのインストールに切り替えます。
    yum/zypper ベースのインストールのメタパッケージとエイリアスパッケージは、インテル® EFSパッケージに対する追加の依存性を導入します。これは、コードが直接 rpm コマンドを使用してインストールを実行するため、スクリプトベースのインストールに影響を与える可能性があります。これはパッケージの依存性に影響を及ぼします。スクリプトベースのインストールに切り替えるには: まずメタ・パッケージとエイリアス・パッケージを削除する必要があるため、インテルではこれを処理するためにINSTALLscript を改善しました。INSTALL -a または-U または-n を使用すると、スクリプトベースのインストールに切り替わります。INSTALL   -u はメタ・パッケージとエイリアス・パッケージを含むすべてのパッケージを削除します。また、スクリプトベースのインストールを開始する前に、yum/zypper コマンドを使用してメタパッケージとエイリアスパッケージを手動で削除することもできます。

リポジトリーの環境への導入

IntelInstall-FS.-x86_64..tgz パッケージには、インテル® EFS・ソフトウェアのインストールに使用されるリポジトリーが含まれています。また、カーネル rpm をチェックして再構築し、ローカル・リポジトリーを作成し、各コンピューティング、管理、およびサービスノードにインストールするパッケージを推奨する、ethcreaterepo と呼ばれるスクリプティング・スクリプトも含まれています。

このスクリプトを使用してローカル・リポジトリーを作成し、GPU サポート要件に合わせて適切なバージョンのカーネル rpms と適切なリポジトリーが作成されていることを確認することをお勧めします。

例えば 、ETH_PKGS_CUDA・ リポジトリーがすでに存在していて 、ETH_PKGS 用リポジトリーに置き換えたい場合、スクリプトはETH_PKGS_CUDA をバックアップして削除し、GPU バージョンのパッケージが意図せずにインストールされることを防ぎます。

ローカル・リポジトリーが正常に作成された後は、組織のニーズに基づいてエンタープライズ・リポジトリーに転送し、ノード間での共有を可能にします。以下は ethcreaterepo の使用情報を示しています。
使用:
ethcreaterepo [-G]
ethcreaterepo -i
ethcreaterepo --help
インテル® Ethernet Fabric Suiteパッケージのローカルリポジトリを作成します。
オプション:
-G は GPU Direct 対応のリポジトリを作成します (インストールには NVidia ドライバーがインストールされている必要があります)
-i 作成するリポジトリに関する情報を表示します。
--help はヘルプテキスト全体を生成します
例:
ethcreaterepo
ethcreaterepo -G
ethcreaterepo –i

スクリプトが正常に実行されると、インストール用のパッケージが一覧表示されます。以下の例は、RHEL の出力を示しています。

Repo Intel2-FS は正常に作成されました。
ソフトウェアをインストールするには、次のコンポーネント・メタパッケージインテル イーサネット使用してください。
ethmeta_eth_tools: Eth ツール向けインテル イーサネットメタパッケージ
ethmeta_fastfabric: FastFaインテル イーサネット向けメタパッケージ
ethmeta_mpisrc: MPI ソース向けインテル イーサネットメタパッケージ
ethmeta_openmpi_gcc_ofi: OpenMPI 向けインテル イーサネットメタパッケージ (ofi、gcc)
ethmeta_openmpi_gcc_ofi_dkms: OpenMPI (ofi,gcc) 向けインテル イーサネットメタパッケージ (DKMS バージョン)
ethmeta_openmpi_gcc_ofi_userspace: インテル イーサネット OpenMPI 用メタパッケージ (ofi、gcc) (ユーザースペースのみ)
ethmeta_psm3: PSM3 インテル イーサネットメタパッケージ
ethmeta_psm3_dkms: PSM3 インテル イーサネット メタパッケージ (DKMS バージョン)
ethmeta_psm3_userspace: psM3 インテル イーサネット メタパッケージ (ユーザースペースのみ)
取り付けを容易にするために、インテルは一般的なコンポーネントの組み合わせについて以下の内容を提供しています。
ethnode_mgmt: 管理ノードに役立ちます。すべてのコンポーネントを含みます。
ethnode_mgmt_userspace: コンテナーに役立ちます。ユーザースペース・バージョンのコンポーネントを使用している場合を除き、eth_mgmtと同じです。
ethnode_mgmt_dkms: DKMS バージョン ethnode_mgmt。DKMS がプリインストールされている必要があります。
ethnode_compute: コンピューティングおよびログインノードに役立ちます。管理を除くすべてのコンポーネントを含みます (fastfa)
ethnode_compute_userspace: コンテナーに役立ちます。ユーザースペース・バージョンのコンポーネントを使用している場合を除き、eth_computeと同じです。
ethnode_compute_dkms: DKMS バージョン ethnode_compute。DKMS がプリインストールされている必要があります。
ethnode_service: サービスノードに役立ちます。fastfa/mpi コンポーネントを除くすべてのコンポーネントを含みます。
ethnode_service_userspace: コンテナーに役立ちます。ユーザー・スペース・バージョンのコンポーネントを使用している場合を除き、eth_serviceと同じです。
ethnode_service_dkms: DKMS バージョン ethnode_service。DKMS がプリインストールされている必要があります。
インストールが完了した後で、ソフトウェアインテル イーサネット構成に iefsconfig を実行してください。

Linux* OS での IEFS リポジトリーの使用

IEFS パッケージ・リポジトリーに含まれる OS ディストリビューションを使用して、Red Hat* Enterprise Linux* (RHEL*) または SUSE* Linux* Enterprise Server (SLES*) にインテル® Ethernet Fabric Suiteソフトウェア・パッケージをインストールできます。設定する各インターフェイスの IPV4 IP アドレスと net スチバチスのリストがあります。ソフトウェア・パッケージをインストールする準備が整いました。

デフォルトの インテル® Ethernet Fabric Suite ソフトウェア構成をインストールするには、次の手順を実行します。

ステップタスク / プロンプトアクション
IEFS リポジトリーの設定
1ローカル・リポジトリーを作成します。コマンドプロンプトで、ethcreaterepo入力します。
2GPU サポートが必要なノード上にローカル・リポジトリーを作成します。
注: NVIDIA カードを使用せずにノードに GPU 対応パッケージをインストールすると、パフォーマンスが低下する可能性があります。

コマンドプロンプトで、ethcreaterepo -G と入力します。
注: 実行後、推奨されるインストール・コマンドが提供されます。

3各ノードに、インテル® EFS ソフトウェアをインストールします。
特定のインテル® EFS・コンポーネントのパッケージのリストについては、
パッケージに対するソフトウェア・コンポーネントのインテル® EFS を参照してください。
マッピング。
yum install RHEL で、または zypper install<> SLES の下側   は、推奨される alias pkg です (ノードタイプに基づく)。
メモ

または、プロビジョニング・スクリプトに install コマンド (ノードタイプに基づく) を挿入することもできます。

RDMA の設定
4コマンドプロンプトで   、iefsconfig を起動します。 iefsconfig と入力します
52) リコンフィグレーション Eth RDMAを選択します。2 と入力します
6RoCE RDMA トランスポート (ROCE_ON)を有効にしますか?[y]Enter キーを押します
7リソース制限セレクター (0 ~ 7) [5] Enterキーを押すか、ファブリック上で実行されるアプリケーションのサイズに応じて別の番号を入力します。
8各インターフェイスについて、MTU を設定し、モード優先フロー制御設定インターフェイス <>now?[y]
MTU 値 [9000]
フロー制御構成、推奨モード優先
フロー制御...
リンク・レベル・フロー・コントロールをオフにする[y]
ファームウェア DCB をオンにしますか?[y]
インターフェイスを設定するには「y」と入力します。
希望の MTU 値を入力します。
[Enter]キーを押してリンクレベルフロー制御をオフにします。
ファームウェアDCB をオンにするには Enter キーを押します。
9サーバーを再起動します再起動 そして プレス 入力.
メモ

再起動プロセスを中断しないでください。お使いのオペレーティング・システムに応じて、
再起動には数分かかる場合があります。

10インストールが正常に完了したことを確認します。 iefsconfig -V と 入力してEnterキーを押します
DKMS を使用したカーネルモジュールのインストール

システムにダイナミック・カーネル・モジュール・サポート (DKMS) がインストールされている場合、DKMS 対応のインテル® EFS・カーネル・モジュールをインストールできるため、カーネル・アップデートが行われると、ソフトウェアを再インストールする必要がなくなりましたインテル® Ethernet Fabric Suite。DKMS フレームワークは、カーネルのアップデート中にカーネルモジュールを自動的に再構築します。

大事な

新しいメジャー OS バージョンにアップデートすると、カーネルモジュールの再構築が機能しなくなる場合があります。この場合、対応するインテル EFSをダウンロードして再インストールする必要があります。

前提 条件

以下の手順を実行する前に、DKMS をインストールしてください。

メモ

DKMS は Linux* ディストリビューションでは利用できません。自分でダウンロードまたはインストールする必要があります。たとえば、次の場所からインストールできます。

TUI メニューを使用したインストールまたはCLI コマンドを使用したインストールで説明されている手順に従ってソフトウェアインテル® Ethernet Fabric Suiteインストールします。インストール・スクリプトが DKMS を検出すると、DKMS バージョンのパッケージがインストールされます。IEFS リポジトリーを使用してインストールするには、Linux* ディストリビューション・ソフトウェア・パッケージを使用したインストールに記載されている手順に従って、インストールする dkms バージョン・パッケージを選択します。