メモリー ECC 修正エラーのガイドと、イベントがトリガーされる場合
システム・イベント・ログ (SEL) に記録された ECC 修正可能なエラー・イベントを処理する際の手順
ECC 修正エラーは、特定の期間内の特定のデュアル・インライン・メモリー・モジュール (DIMM) のスレッショルド・オーバーフローを表します。
- 致命的な問題 (パープル・スクリーン・オブ・デス (PSOD) または予期しない再起動)、および各 DIMM 位置で 24 時間以内に 10 イベント未満のアダプティブ・ダブル・デバイス・データ訂正 (ADDDC) エラーを含む修正可能な ECC エラーがしきい値の制限内にある場合、推奨されるのは、イベントをトリガーする各 DIMM 位置の ECC エラーの再発を監視することです。
- 致命的な問題 (パープル・スクリーン・オブ・デス (PSOD) または予期しない再起動)、および各 DIMM 位置で 24 時間以内に 10 以上のイベントであるアダプティブ・ダブル・デバイス・データ訂正 (ADDDC) エラーを含む修正可能な ECC エラーがある場合は、以下の手順に従って各 DIMM の位置を再装着することをお勧めします。
- システムの電源をオフにして、AC 電源ケーブルを取り外します。
- DIMM の位置を特定して取り付け直し、サーバー・プラットフォームのテクニカル・プロダクト・スペシフィケーション を参照して DIMM の位置を識別する
- 識別された DIMM の再シートの実行
- 挿入 AC 電源ケーブルとシステムの電源オン
- ECC エラーが再発した場合は、24 時間の注意が必要です。
- ECC エラーが再接続されたのと同じ DIMM 位置で引き続き発生する場合は、BMC ウェブコンソールから生成された SEL ログとデバッグログを生成してインテル・カスタマー・サポートに送信します。
ノート |
エラー訂正コード (ECC) エラーは自己修正しています。メモリーの信頼性可用性保守 (RAS) 構成によっては、統合メモリー・コントローラー (IMC) が影響を受ける DIMM をオフラインにすることがあります。 |
異なるインテル® サーバー・プラットフォームでは、それぞれのイベント定義に若干の違いがあります。ご利用のサーバー・プラットフォームの システム・イベント・ログのトラブルシューティング・ガイドを 参照してください。 | |
インテルは、システム BIOS を ダウンロード して、ご利用のサーバー・プラットフォームで利用可能な最新バージョンにアップデートすることを推奨します。 | |
システムが Nutanix* Enterprise Cloud Platform の認定インテル® Data Center Systemsである場合は、 Nutanix* ライフサイクル・マネージャー のページをご覧ください。ハードウェアとファームウェアの互換性のリストについては、 Nutanix* ハードウェアとファームウェアの互換性 ページを参照してください。 |