インテル® サーバー・ボードの内部エラー (IERR) から回復する方法

ドキュメント

トラブルシューティング

000006043

2023/07/17

エラーの原因

IERR は、プロセッサーによって報告される致命的なエラーですが、一般的にプロセッサー・コア (メモリー、 PCIe など) の外部のデバイスによって引き起こされます。

  • 通常、プロセッサーの外でのイベントが原因で、プロセッサーの実行が停滞しています。
  • この問題は、多くの場合、追加情報として相互参照できる CATERR イベントを伴います。

解決方法:

以下の手順に従ってください。

  1. エラー訂正コード (ECC) イベントについては、システム・イベント・ログ (SEL) を確認してください。不具合のあるメモリーが IERR をトリガーする場合があります。
  2. SEL であらゆる PCIe イベントを確認します。PCIe デバイスの誤作動により、IERR がトリガーされる場合があります。
  3. サーバー用および最近追加したハードウェア・デバイス用に、オペレーティング・システム (OS) ドライバーが最新の状態であることを確認します。古い OS ドライバーが IERR をトリガーする場合があります。
  4. IERR をトリガーした可能性のあるハードウェア障害を示す可能性のあるマシン・チェック・アーキテクチャー (MCA) エントリーがないか、OS のログを確認してください。
  5. サーバーシステムの BIOS が最新になっていることを確認します。
  6. [Baseboard Management Controller] ウェブコンソール >構成>メモリー構成 > PPR タイプに移動し、PPR 設定をハードに設定します。
  7. ログに問題の原因となる特定のメモリーモジュールが存在することが確認された場合、メモリースティックを取り付け直し、サーバーを 24 時間監視します

関連トピック
サーバーがクラッシュしてこのエラーが表示される: プロセッサー CPU マシンのチェック
ファームウェアのアップデートおよびトラブルシューティングのヒント
インテル® サーバー・ボードのシステム・イベント・ログのトラブルシューティング・®ガイド