インテル® サーバー・ボードの内部エラー (IERR) から回復する方法
エラーの原因
IERR は、プロセッサーによって報告される致命的なエラーですが、一般的にプロセッサー・コア (メモリー、 PCIe など) の外部のデバイスによって引き起こされます。
- 通常、プロセッサーの外でのイベントが原因で、プロセッサーの実行が停滞しています。
- この問題は、多くの場合、追加情報として相互参照できる CATERR イベントを伴います。
解決方法:
以下の手順に従ってください。
- エラー訂正コード (ECC) イベントについては、システム・イベント・ログ (SEL) を確認してください。不具合のあるメモリーが IERR をトリガーする場合があります。
- SEL であらゆる PCIe イベントを確認します。PCIe デバイスの誤作動により、IERR がトリガーされる場合があります。
- サーバー用および最近追加したハードウェア・デバイス用に、オペレーティング・システム (OS) ドライバーが最新の状態であることを確認します。古い OS ドライバーが IERR をトリガーする場合があります。
- IERR をトリガーした可能性のあるハードウェア障害を示す可能性のあるマシン・チェック・アーキテクチャー (MCA) エントリーがないか、OS のログを確認してください。
- サーバーシステムの BIOS が最新になっていることを確認します。
- [Baseboard Management Controller] ウェブコンソール >構成>メモリー構成 > PPR タイプに移動し、PPR 設定をハードに設定します。
- ログに問題の原因となる特定のメモリーモジュールが存在することが確認された場合、メモリースティックを取り付け直し、サーバーを 24 時間監視します。
関連トピック |
サーバーがクラッシュしてこのエラーが表示される: プロセッサー CPU マシンのチェック |
ファームウェアのアップデートおよびトラブルシューティングのヒント |
インテル® サーバー・ボードのシステム・イベント・ログのトラブルシューティング・®ガイド |