16年前のSSDが1PB相当の書き込み後も動き続けたという実験は、古いMLC NANDのしぶとさを示す小話に見える。だが、この話の面白さは「SSDは公称値の25倍まで平気だった」という単純な結論ではない。SanDisk P4の仕様をたどると、TBWが何を示す数字なのか、そしてホストから見える書き込み量がNANDセルの実際の摩耗とどこまで対応するのかが、今回の実験の読みどころになる。

YouTubeチャンネルWolfyTechが行った興味深い実験の結果、16年前の64GB SSDに1PB相当のデータを書き込んだ後もドライブは正常に動作したという。動画のタイトルは「I forced a 16-Year-Old 64GB SSD to write 1 PETABYTE (And it didn't die)」で、対象はSanDisk P4 64GBとされている。そこでは、ドライブは60,000時間を超える通電時間と1,100回を超える電源投入を記録していた。

数字だけを見ると、結果はかなり派手だ。古い仕様表を当たると、SanDisk P4 64GBの耐久性は40TBWとされているため、1PB、つまり1,000TBの書き込みは公称TBWの25倍に当たる。SanDisk SSD P4の公開マニュアルでも、P4系列の64GBモデルはLong Term Data Enduranceとして40TBWが示されている。32GBモデルは20TBW、128GBモデルは80TBWで、容量に比例した耐久値の並びになっている。

AD

40TBWは故障予告ではなく、想定ワークロードに基づく耐久指標である

TBWは、SSDの寿命を語るときにしばしば「ここまで書いたら壊れる数字」のように受け取られる。実際にはメーカーが想定するワークロード、保証条件、統計的な信頼性をまとめるための指標であり、到達した瞬間にNANDが停止する境界線ではない。

SanDisk P4のマニュアルは、Long Term Data EnduranceをWindows OSの典型的なワークロードに基づいて計算し、TBWで表すと説明している。さらに、その値はユーザーのワークロードとアクセスパターンに直接左右される。40TBWという数字は「この量を超えたら必ず壊れる」ではなく、「この製品をどういう使い方で評価し、どこまでを耐久性の目安として提示するか」を表す数字である。

この前提に立つと、1PB到達後もSSDが読めたという結果は、TBWの意味を正しく理解する材料になる。TBW超過はリスクの増加を示すが、即時故障を命じる仕組みではない。NANDの不良ブロック管理、ウェアレベリング、エラー訂正、予備領域の使い方がうまく働けば、公称値を超えて動作が続くことはあり得る。

ただし、そこから「古いSSDなら公称値の25倍まで使える」と読んではいけない。SSDの故障はNANDセルの書き換え回数だけで決まらない。コントローラ、電源回路、ファームウェア、はんだ、温度、書き込みパターン、長期保管時のデータ保持が絡む。今回の1台が生き残ったことは興味深い実例だが、同じ型番や同じ世代のSSDすべてにその余裕があることを保証しない。

P4のnCacheは、ホスト書き込み量とNAND消耗をずらす

今回の実験で最も見落としやすいのは、SanDisk P4の書き込み構造だ。P4のマニュアルは、同製品がnCacheと呼ぶ不揮発性のSLC Flash write cacheを備えると説明している。現代のOSは小さなブロック、特に4KB単位でストレージにアクセスすることが多い。NANDフラッシュの物理的なブロック構造はそれよりはるかに大きい。

P4はこのずれを埋めるため、小さな書き込みをSLCキャッシュへ高速に集め、アイドル時により大きな単位でMLC NAND領域へまとめて移す。マニュアルは、このキャッシュサイズを500MB超としている。SLCとして扱う領域は書き込みに強く、細かいランダム書き込みをいったん受け止めることで、MLC領域への書き込み効率を上げられる。

この設計は、今回の「1PBを書いた」という数字の読み方を難しくする。OSやテストツールから見えるホスト書き込み量が1PBに達したとしても、それがNANDセル全体に1PB分のプログラム/消去サイクルとしてそのまま刻まれたとは限らない。キャッシュに収まりやすいパターン、同じ領域を繰り返すパターン、フラッシュ前に上書きされるパターンでは、実際にMLC領域へ移る量が変わる。

つまり、テストがキャッシュへの書き込みを繰り返す形になっていたようだ。コメント欄でも、1PBのホスト書き込みがNANDへ実際に届いていたのかという疑問が出ている。この疑問は揚げ足取りではない。SSD耐久性の評価では、ホスト書き込み、NAND書き込み、書き込み増幅率を分けないと、摩耗の評価を誤るからだ。

AD

古いMLC NANDの強さは本物でも、現代SSDへ直結しない

P4が2010年世代の製品であることも、この実験を読み解くうえで大きい。まず、対象ドライブは32nm MLC NANDを使っていたことが挙げられる。MLCは1セルに2ビットを格納する方式で、現在の一般的なTLCやQLCよりセルあたりの状態数が少ない。状態の判別余裕が大きいため、同じ世代・同じ設計なら、TLCやQLCより書き換え耐性を取りやすい。

古いMLCだから長期使用で常に有利とは限らない。古いSSDはコントローラ、ファームウェア、電源回路も古い。長時間通電していた個体なら熱や電源品質の影響も受けている。P4が60,000時間超の通電後に動いたという事実は印象的だが、それはNANDセルだけでなく製品全体がたまたま生き残った結果でもある。

現代のSSDは、高密度化によってTLCやQLCが主流になった一方、コントローラ、LDPCなどのエラー訂正、ウェアレベリング、SLCキャッシュ、温度制御、SMARTの可視化も進んでいる。古いMLCと現代のTLC/QLCを、セル種別だけで単純比較するのは危うい。見るべきなのは、容量、用途、TBW、保証年数、実際の書き込み量、温度、空き容量の組み合わせである。

読むべき数字はTBWだけではない

今回の実験は、SSD利用者にとって安心材料ではある。日常用途のPCで、数十TBから数百TBを書いたからといって、TBWを超えた瞬間にドライブが突然止まるわけではない。多くのユーザーにとって、NANDの書き換え上限より前に、容量不足、規格の陳腐化、別部品の故障、買い替えが先に来る。

バックアップ不要という話にはならない。TBWを超えて動く個体があることと、重要データを1台の古いSSDに任せてよいことは別である。SSDは、故障前に読み取り不能セクタやSMART警告を出す場合もあれば、コントローラ故障で一気に消える場合もある。NANDの摩耗だけを見て安全を判断すると、実際の故障要因を見落とす。

実務的には、TBWを「余命カウンター」ではなく「比較のための耐久指標」として読むのが正しい。動画編集、仮想マシン、監視カメラ、データベース、生成AI向けのローカルキャッシュのように書き込みが重い用途では、TBWと保証年数を見て余裕を取る。一般的なノートPC用途なら、SMARTのTotal Host Writes、Percentage Used、温度、代替ブロック関連の値を時々見るだけでも、交換時期やバックアップの判断がしやすくなる。

SanDisk P4の1PB実験が示したのは、TBWを超えたSSDが必ず壊れるわけではないという当たり前だが忘れられがちな事実である。同時に、P4のnCache構造は、見かけの書き込み量だけでNANDの実消耗を語れないことも示している。古いSSDが「根性で耐えた」という話にとどめず、TBW、キャッシュ、書き込み増幅、実ワークロードを分けて見ることで、SSDの耐久性はようやく読み解ける。