インテル® Optane™ メディアは、市販されているその他のメモリーと比べて、数多くの重要な優位性を持つほかにはないメモリー・テクノロジーです。大きな利点の 1 つが耐久性です。メモリーが摩耗し、高い信頼性で継続的な使用には適していないと診断されるまで、メモリーに書き込むことができる回数を耐久性と呼びます。インテル® Optane™ メディアは、はるかに多くの書き込みサイクルを耐用寿命内に実現しているため、NAND 型メモリーよりも高い耐久性を備えていると言えます。さらに、インテル® Optane™ メディアではインプレース・ライト・アップデートに対応しているため、NAND ベースのシステムで必要とされる、耐久性が犠牲になる余計な書き込みの回避が可能です (テクノロジー概要「インテル® Optane™ 技術: メモリまたはストレージ ? を参照してください)。この 2 つの理由から、インテル® Optane™ メディアを基盤とするインテル® Optane™ DC Solid-State Drive (SSD) は、NAND 型 SSD よりもはるかに優れた耐久性を特長としています。また、インテル® Optane™ メディアの高い耐久性により、システムの永続メモリーとして使用することも可能です。これは現在インテル® Optane™ DC パーシステント・メモリーとして提供されています。
このページでは、NAND 型 SSD と従来型メモリーの耐久性の問題と特性について説明し、インテル® Optane™ DC SSD またはインテル® Optane™ DC パーシステント・メモリー・モジュールで使用されているインテル® Optane™ メディアが、こういった問題をどのように解消し、非常に高い耐久性を実現しているかを解説します。
耐久性とは
簡単に言えば、システムがその耐用寿命内に許容し、確実に記憶できるデータ書き込みの累積回数が耐久性です。容量とは関係ありません。容量は、ストレージ内に同時に保存できる書き込みデータの総量です。再書き込み可能なストレージ・テクノロジーの耐久性は容量をはるかに上回ります。耐久性は、容量相当分を書き込むことができる回数の観点で示されることもあります。
例えば、耐久性は車のタイヤの損耗のようなものと考えてください。タイヤ 1 セットは所定の走行距離でのみ有用です。タイヤが摩耗しすぎると、安全に走行することができなくなります。タイヤの寿命は、タイヤの品質 (耐久性設計) と使用頻度 (1 日当たりの走行距離) に左右されます。使用頻度が低い場合は、中品質のタイヤでも数年持つかもしれませんが、使用頻度が高い場合は、タイヤの溝が 1 年ですり減ってしまうかもしれません。タイヤでいう「役に立つ溝」にあたる、これ以上書き込みに対応できなくなるまでに許容できるデータ書き込み回数が限られているという点で、不揮発性メモリーはタイヤと似ています。また、タイヤと同様に、メディア・テクノロジーが違えば寿命内の書き込み上限回数も異なります。
不揮発性メモリーは通常、大規模なサブシステムの一部としてコンピューティング・システムに組み込まれます。このサブシステムの多くが SSD です。SSD の耐久性は、ドライブの信頼性が失われるまでにドライブの全容量を上書きできる回数を示しています。基本的に、SSD の耐久性の限界を決定するのは、NAND 型 SSD を構成する不揮発性メモリーセルの限界です。SSD の設計に加え、NAND 型フラッシュメモリーの設計時に選択されるアーキテクチャーも、SSD の耐久性の限界に影響します。耐久性は通常、1 日当たりの平均ドライブ書き込み回数 (DWPD) または耐用期間内の書き込み総回数で表されます。SSD の容量を考慮に入れて、SSD の耐用期間にわたり (通常は 5 年)、この 2 つの指標は同等です。
ワークロードに必要な耐久性と、データセンターで求められる耐用寿命は、SSD をデータセンターに配置する際に検討すべき重要な要素です。結局のところ、耐久性によって SSD を使用できる年数が決まるため、高い信頼性が必要なデータセンターの運用コストについて考えた場合、耐久性は重要な要素となります。耐久性レベルを選択するには、運用担当者は予定しているワークロードに必要な書き込み負荷を理解し、その負荷に SSD が廃棄されるまでの予測耐用年数を掛け合わせる必要があります。予測される負荷に対応できないドライブを選択すると、SSD を交換することになるため、追加の費用が発生し、システムの稼動時間に影響を及ぼす可能性も避けられません。
NAND 型 SSD アーキテクチャーが耐久性に及ぼす影響
NAND 型 SSD の耐久性は、NAND メモリー自体がどのように機能するか理解しなければならないため、複雑なトピックです。NAND メモリーの場合、書き込み処理では 1 から 0 への書き換えのみ可能で、逆方向の書き換えはできません。書き込みを実行するには、フラッシュメモリーのセルに存在するデータをまず消去して、すべてのビットを 1 に設定しておく必要があります。NAND メディアの消去単位はさまざまですが、どの場合でも書き込み / 読み出しの最小単位と比べて大きくなります。消去ブロックのサイズは数メガバイトであるのに対し、書き込みページは数十キロバイト、読み出しサイズは 4 キロバイトが現時点では一般的です。消去処理により、多数の書き込みページを含むブロック全体が削除されます。これが SSD 運用を複雑にしています。
NAND 型 SSD は、この基礎構造に対処できるように特化して設計され、同時に十分なパフォーマンスと耐久性も提供します。システムからの読み出しでは該当ページにアクセスするだけです。SSD への書き込みは常に、すでに消去されたブロックに対して実行されます。SSD の複数の書き込みは、書き込み 1 ページ分を満たす十分な数の 4KB セクターがグループ化されるまでまとめられ、1 ページが満たされた時点でデータが書き込まれます。その後、SSD の間接テーブル (通常は DRAM に保持) が更新され、各セクターの位置を記録することで、以降のアクセスで目的のセクターを見つけることができるようになります。ブロック全体が書き込まれるまでこのプロセスが繰り返されます。
SSD レベルでは、セクターの 1 つでも新しいデータで書き換えるとなると、状況がさらに複雑化します。NAND メモリーでは、そのデータを単に更新することはできません。代わりに、すでに消去された別のブロックに書き込まれます。元のブロックには古いデータが保持されたままです。ところが消去ブロック内のほかのデータは引き続き有効という場合もあるため、そのブロックは消去できません。古いデータを保持しているページは、一時的に取り残された状態になり、有用なデータが保持されていなくても、書き換えることはできないからです。最終的に、このスペースは「ガベージ・コレクション」と呼ばれるプロセスで回収することになります。このプロセスでは、SSD 内部ロジックによって、残されている有効なデータページがすでに消去されたブロックにコピーされます。これで必要なデータはもう保持されていないため、元のブロックを消去し、書き込みの準備をすることができます。このようにして、無効なスペースが再利用できるようになります。
重要なのは書き込み。システムがその耐用寿命内に許容し、確実に記憶できるデータ書き込みの累積回数が耐久性です。では、なぜ読み出しではなく、書き込みだけが重要なのでしょうか。メディアからの読み出しは非破壊的であり、システム・アーキテクトにとってそれほど問題ではないからです。
前の段落で説明したプロセスにそって、SSD 内で書き込みが生成される場合を思い出してください。ここで生成される書き込みは SSD への入力時点のものではなく、別の書き込みです。この現象を示す用語がライト・アンプリフィケーション (WA) です。WA は、NAND メディアに書き込まれるデータの量を、SSD にシステムによって書き込まれるデータの量で割って算出される値です。耐久性は SSD レベルで示されるため、この書き込みはその数値には含まれません。ただし、メディアの耐久性は、超えてはならない基本的な信頼性の限界であるため、この書き込みも計算に入れる必要があります。
ホストからの書き込みワークロードの特性が WA にマイナスの影響を及ぼす可能性があることが分かると思います。主にランダム書き込み、特に 4KB 程度のサイズの小さい書き込みを必要とするワークロードは最悪のシナリオです。ランダム書き込みでは、複数の消去ブロックにまたがって 4KB の無効なデータチャンクが取り残され、ガベージ・コレクションの高いオーバーヘッドが発生する傾向があるからです。WA 値が 3 以上になるのは珍しいことではありません。WA 値が 3 の場合、基盤となる NAND メモリーの耐久性の 3 分の 1 しかシステムは利用できません。
ガベージ・コレクションを有効化するには、NAND 型 SSD ではデータをコピーできる、ユーザーには表示されないスペア領域を保持する必要があります。ドライブの全容量に対するユーザーに表示されるドライブ容量の割合を、オーバー・プロビジョニング (OP) 領域と呼び、OP 領域が大きいほど、SSD で有効なデータがほとんどないブロックが見つかる可能性が高くなり、WA のオーバーヘッドを緩和できます。OP 領域が大きくなれば、SSD のコストは増大します。そのため、耐久性が高く、書き込みパフォーマンスが高い SSD は OP 領域が大きくなり、結果的にコストが増大する傾向にあるのです。
そんなわけで耐久性は、基盤となる NAND メモリーの機能、SSD の OP 領域、消去するブロックを特定する SSD のアルゴリズムの効率、そしてもちろんワークロード自体によって決まります。そのため、NAND 型 SSD の耐久性は、わずか 10 分の 1 の 1 日当たりドライブ書き込み回数 (DWPD) を示す最小コストの SSD から、10 DWPD の最高クラス SSD までさまざまです。1 次のセクションで説明するように、はるかに高い耐久性を実現するインテル® Optane™ メディアにより、状況はもっと分かりやすくなります。
インテル® Optane™ メディアのほかとは違うアドバンテージ
インテル® Optane™ テクノロジーは、リリース以来、メモリー・テクノロジーとしては 20 数年ぶりの量産出荷となりました。インテル® Optane™ テクノロジーは、独自のメモリーメディアで構築され、耐久性が強化された新しい素材が採用されています。さらに、インテル® Optane™ メディアとそのテクノロジーを軸とする SSD またはプラットフォーム・メモリー・サブシステムは、高耐久性を念頭に置いて設計されています。インテル® Optane™ DC SSD / メモリーモジュールは、NAND 型 SSD よりもはるかに優れたパフォーマンスと耐久性を備えています。
インテル® Optane™ メディアは、耐久性に関して NAND メディアとは一線を画す、さまざまな優位点があります。1 つ目は、中でも最も重要とされるセル自体の優位性です。インテル® Optane™ メディアのセルは、極めて高い耐久性を実現するという目的に特化して設計された素材と動作方法で構築されました。インテル® Optane™ メディアを構成するのが、セレクターと記憶材料を備えたこの個々のセルの集まりです。各セルは、記憶素子のバルク特性に「1」または「0」を格納します。使用されるプロセスは、NAND メディアの電荷捕獲式プロセスと比べて数十サイクル以上の回復性があります。
NAND の障壁を打ち破るインテル® Optane™ テクノロジー
インテル® Optane™ テクノロジーの基盤となっているのは、DRAM と同様にバイトアドレス指定可能かつ NAND と同様に不揮発性であり、2 つの間にリード / ライトのレイテンシーがある、全く新しいメモリーメディアです。
インテル® Optane™ テクノロジーは、インテル® Optane™ メディアを、インテル® コントローラー、ソフトウェア、システム・インターコネクトと組み合わせたもので、メモリーとして導入することも、ストレージとして導入することもできます。
実際、この耐久性は非常に大きなアドバンテージで、NAND メディアとは異なり、インテル® Optane™ メディアにはシステムメモリーとして機能する十分な耐久性が備わっています。2 つ目の利点は、インテル® Optane™ メディアが、バイトアクセス可能で、インプレース・ライトに対応している点です。このメモリーは書き込み前に消去する必要がなく、読み出しと書き込みだけが実行されます。これにより、システム設計が大幅に簡素化され、次に説明するように、基盤となるメディア全体の耐久性がシステムレベルで確保できます。
NAND のオーバーヘッドを回避するインテル® Optane™ DC SSD
インテル® Optane™ DC SSD は、4KB 単位でデータを保持するため、既存オペレーティング・システムのストレージスタックで使用される最も一般的なデータ単位と適合します。メディアのインプレース・ライト機能により、NAND 型 SSD で説明した書き込み時の再配置プロセスは不要になり、ストレージの既存セクターに再書き込みが行われるときに、そのセクターがその場で更新されるだけです。これは大きな違いで、次のような意味があります。
- ガベージ・コレクションが不要
- ユーザーに表示されない追加の領域を割り当てる必要がない
- 追加の書き込みが生成されない
したがって、インテル® Optane™ DC SSD の場合、WA も 1 (なし)、OP も 1 (なし) になります。ガベージ・コレクション処理のバックグラウンド書き込みでメモリーの耐久性を占有してしまうことがなくなるため、SSD の耐久性が向上します。また、ガベージ・コレクションに起因する書き込みがなく、ホスト上のアクセスが妨害されることもないため、高いメディア・パフォーマンスがシステムに提供されます。
インテル® Optane™ DC SSD では、独自のウェアレベリング・アルゴリズムを実装し、インテル® Optane™ メディアの全セルに摩耗を均等に分散できる仕組みになっています。特定アドレスへの書き込みの繰り返しによって SSD の一部が早い段階で摩耗するのを防いでいるのがこの間接指定です。書き込みが 1 つの領域に偏ると、別の物理ロケーションにマッピングされます。SSD はこの処理を元のロケーションと新しいロケーションのデータを単純に交換することでシームレスに実行します。この場合も、ガベージ・コレクションは不要です。
このメモリーレベルと SSD アーキテクチャー・レベルのイノベーションにより、インテル® Optane™ メディアの完全な高耐久性機能がシステムに備わります。インテル® Optane™ DC SSD の 1 日当たりドライブ書き込み回数 (DWPD) は現時点で最大 60 です。2 これは、NAND 型 SSD の DWPD をはるかに上回っています。
耐用寿命を超える耐久性を重視
多くの場合、SSD の耐用年数は DWPD の想定平均回数を算出して測定されます。想定 DWPD を超えて使用すれば、SSD の耐用年数が短くなります。そのため、データセンターの実際のワークロードで通常発生する平均 DWPD で計算することが重要です。
例えばストレージキャッシュとして使用される場合、CPU に近く、拡張ストレージよりも容量が小さいため、書き込みを処理する頻度が高くなります。ほかの用途では、必要な書き込み操作がはるかに少なくなります。
ドライブが許容できる最大書き込み回数は、DWPD に SSD の容量を掛け合わせ、これにメーカー保証で指定されているドライブの寿命 (年単位) を掛けることによって算出されます。NAND 型 SSD とインテル® Optane™ DC SSD の両方にこの簡単な式を適用すると、この 2 つのメモリーメディアのアーキテクチャーの違いによる影響が明確に示されます。
- 3 DWPD 5 年保証の 0.5 TB NAND ドライブ: 5 年間で最大 3PB の総書き込み量に対応 (1TB = 1012 バイト、1PB = 1015 バイトで算出)
- 60 DWPD 5 年保証の 0.5 TB インテル® Optane™ DC SSD: 5 年間で最大 55PB の総書き込み量に対応2
2 つの SSD を比較すると、インテル® Optane™ メディアの非常に優れた耐久性が際立っています。耐用年数内でインテル® Optane™ DC SSD 1 台の想定書き込み容量に匹敵するには、NAND 型 SSD では 18 台相当が必要になります。
データセンター運用環境では、多くの場合、インテル® Optane™ DC SSD とインテル® NAND 型 SSD の両方を導入することで、パフォーマンスとコストの最適なバランスをとることができます。例えば、データの局所化配置が十分なワークロードを運用するデータセンターの場合、書き込み操作の 90% を少数のインテル® Optane™ DC SSD で、残りの 10% を NAND 型 SSD で対応するように構成するのが最適です。この構成により、システム内の SSD の総数が減るので、SSD のホストに必要なシステムの台数も少なくて済み、総保有コスト (TCO) をさらに削減できる可能性も高くなります。インテル® Optane™ DC SSD とインテル® NAND SSD を計画的に組み合わせることで、どちらについても保証期間内の DWPD を超えないようにしながら、コスト効率も向上させることができます。
耐久性のさらなる向上: インテル® Optane™ DC パーシステント・メモリー
当初から、インテル® Optane™ メディアは、ストレージシステム (SSD) とメモリーシステムの両方での使用を目的に考案されました。システムメモリーは CPU の読み込み処理でアクセスされ、システム入出力 (I/O) バスではなく、システム・メモリー・バスを介して命令を保存します。インテル® Optane™ メディアのバイトアドレス指定可能でインプレース・ライトに対応するという特性は、システムメモリーとしての使用に適していますが、耐久性も満たす必要があります。メモリーバスは、I/O バスよりもはるかに速い読み出し / 書き込み速度に対応します。書き込み速度が速いということは、SSD と比べて非常に高い耐久性要件が求められるということです。そのため、インテル® Optane™ DC パーシステント・メモリーには、5 年間にわたって有用性を維持するために、SSD よりもはるかに高い耐久性が必要となります。
インテル® Optane™ DC パーシステント・メモリーの耐久性は、早い段階での摩耗を心配することなく、耐用期間を通じてシステムがメモリーモジュールへの書き込みができるように明確に指定されています。耐久性仕様は、書き込み帯域幅が最大時のメモリーモジュールの最大電力定格で示されます。数値で示すと、インテル® Optane™ DC パーシステント・メモリーは、24 時間 365 日使い続けたとして耐用年数が 5 年、耐用年数内に書き込み可能なデータの総量は 350PB 以上です (256GB モジュールの場合)。これは、インテル® Optane™ DC SSD の耐用年数内 55PB の書き込み総量を大幅に上回っています。SSD と同様に、メモリーモジュールはこの寿命限界に向かう進行状況をカウントし、スマートコマンドの要求に応じてシステム管理ソフトウェアに書き込み回数を返します。このような高レベルの耐久性を備えていることで、この独自のテクノロジーはメモリーとして、今では永続的に使用することが可能になり、システムメモリーとストレージの階層構造に革命がもたらされています。
データセンターでインテル® Optane™ メディアが実現すること
インテル® Optane™ メディアにより、データセンターでは耐久性を高めると同時に、コスト削減とパフォーマンス向上が可能になります。また、耐久性は運用コストに直接影響するため、耐久性の向上が TCO の削減にも直接つながり、パフォーマンスが犠牲になることもありません。
SSD がその耐用年数内に許容できる書き込み回数、つまり耐久性は、システムの使用と、長期的にはシステムコストの重要な決定要因となります。メディアの進歩と SSD アーキテクチャーの最適化によって、インテル® Optane™ DC SSD は多くの NAND 型 SSD の 10 倍以上の耐久性を実現しています。1 2
インテル® Optane™ DC SSD は NAND 型 SSD 大多数の 10 倍を上回る耐久性を実現1 2
まとめると、インテル® Optane™ DC パーシステント・メモリーが実現するのは、インテル® Optane™ メディアのシステムメモリーとしての利用と、さらに高レベルのこれまでにないシステム耐久性です。3 システムレベルでは、これらの新たなレベルの耐久性により、コストを削減し、システム・パフォーマンスを向上させる新しい用途や新しい方法が実現されます。