インテル® プログラマブル・アクセラレーション・カード (インテル® Arria® 10 GX FPGA搭載版) データシート

ID 683226
日付 12/04/2018
Public
ドキュメント目次

7.1.1. BMC電圧と熱処理

BMCは、電力、温度、または電圧が特定のしきい値に達すると、インテル® プログラマブル・アクセラレーション・カード (インテル® Arria® 10 GX FPGA搭載版) をパワーダウンし、サーバーを再起動します。この応答により、サーバーおよびインテル Arria 10 GX FPGAへの損傷を防ぎます。

しきい値の制限については、「 デバイス・ペリフェラル表」のセクションを参照してください。この表は、シャットダウン条件を指定する回復不能 (UNR) 値の上限を示しています。BMCは次の条件下で、ボードへの電力供給を切断します。
  • バックプレーンの電圧が14 Vに達する、または電流が6Aに達する (つまり最大84 Wの総電力)
  • FPGA接合部温度が100 °Cに達する
注:

上記のバックプレーンの電力制限であれば、インテル® プログラマブル・アクセラレーション・カード (インテル® Arria® 10 GX FPGA搭載版) を十分に保護することができます。ハードウェア・サーバー・コンポーネントにさらに控えめな制限が必要な場合は、ボード管理コントローラーのPLDMコマンドで説明されているように、PLDMコマンドを使用してしきい値を変更します 。

意図しないシャットダウンやデータの損失を防ぐには、次を実行します

  • インテル検証済みサーバーを使用します。
  • ワーストケースのワークロードに対して広範囲にわたる電力検証と消費分析を実行します。
  • 複数の異なるサーバー間および長期間ストレステストされた認定ソリューションを使用します。
  • pacdデーモンを有効にします。このシステムサービスは、センサーの測定値と定義されたしきい値をモニターし、しきい値を超えた場合はインテル・プログラマブル・アクセラレーション・カードへのアクセスを無効にします。pacdの詳細については、Open Programmable Acceleration EngineページのOPAE FPGA Toolsを参照してください。

BMCがボード障害を検出したかどうかは、ボードの2つのLEDから識別することができます。サーバーの背面に位置する通気口から、インテルPACカードのブラケットを見ると、4つの緑色のLEDが点灯していることが分かります。それらの後ろ (ボードの奥) には、緑色のLEDまたは赤色のLEDが点灯しています。BMCの動作中は緑色のLEDが点滅し、BMCの初期化中は点灯します。 BMCが障害状態を検出してボードの電源を切ると、 (緑色LEDの隣にある) 赤色のLEDが点灯します。FPGAが過熱している、またはボードから電力が過剰に引き出されている場合、ボード障害が発生する可能性があります。