インテル® サーバー・ボード製品ファミリーで DIMM エラーと DIMM スロットの障害を特定する手順
インテル® サーバー・ボード S2600WF をベースにした複数のサーバーで複数の DIMM でエラーが報告された、修正可能な ECC エラーのしきい値に達しました。
複数の DIMM 交換後も ECC エラーが発生します。
複数の DIMM 交換後も ECC エラーが発生する場合、DIMM エラーとボード DIMM スロットの障害を特定するには、完全なテストが必要です。
メモリーを並べ替えて、マークされた DIMM が他のスロットにまだ ECC が存在しているかどうかを確認します。DIMM の損傷または軽い損傷を示します。
同じ DIMM スロットで ECC エラーが報告されているが、DIMM スロットに別の DIMM が取り付けられている場合は、ソケットに障害接続の原因となるデブリ / 埃がないことを確認します。デブリ / 埃がない場合は、ボード DIMM スロットの障害である可能性があり、S2600WF ボードを交換する必要があります。
そのシステムにわずかな障害または潜在的な障害がある DIMM がある場合は、以下の手順で検出されます。このプロセスは遅い可能性がありますが、特定の DIMM コンポーネントの潜在的な問題を特定できます。
テスト手順:
- すべての DIMM を取り外します。
- インテル® サーバー製品のテクニカル・プロダクト・スペシフィケーション にある DIMM 装着ガイドライン のセクションに従い、過去に ECC エラーが発生しなかった 1 個の DIMM のみをインストールします。
- 1pcs DIMM でシステムを起動し、しばらく実行します。ECC エラーがあるかどうかを確認します。
- 同じガイドラインに従って、過去に ECC エラーが発生しなかった 2 番目の DIMM をインストールします。
- 2pcs DIMM でシステムを起動し、しばらく実行します。 ECC エラーがあるかどうかを確認します。
- 同じガイドラインに従い、過去に ECC エラーが発生しなかった 3 つ目の DIMM をインストールします。
- 3pcs DIMM でシステムを起動し、しばらく実行します。ECC エラーがあるかどうかを確認します。
- 同じガイドラインに従って、過去に ECC エラーが発生しなかった第 4 DIMM をインストールします。
- 4pcs DIMM がインストールされたシステムを起動し、ECC エラーがあるかどうかを確認します。
- 同じ手順に従って、各 DIMM を 1 つ追加してシステムを起動します。ECC エラーがあるかどうかを確認します。
- すべての良好な DIMM が装着されるまでテストを実行します。
- ECC エラーを報告している DIMM をインストールしてシステムを起動するには、同じ手順に従ってください。ECC エラーがあるかどうかを確認します。
これで、元の DIMM スロットをすべて実装してテストする必要があります。ECC エラーが発生した元の DIMM スロットでも、データが入り、テストされます。