現代のプロセッサ開発において、AMDが築き上げた「3D V-Cacheテクノロジー」の功績は計り知れない。CPUダイの上に大容量のL3キャッシュを垂直に積層するこの技術は、特にゲーミング性能やデータセンターでの処理能力において劇的な向上をもたらし、Ryzen X3Dシリーズを市場の覇者へと押し上げた。しかし、米国特許商標庁(USPTO)が2026年1月に公開した新たな特許文書は、AMDの野心がL3キャッシュの容量拡大だけに留まらないことを示唆している。

今回明らかになった特許「Balanced Latency Stacked Cache(均衡遅延積層キャッシュ)」(特許番号 US20260003794A1)は、プロセッサの性能においてより核心的かつ繊細な領域である「L2キャッシュ」の3D積層化に挑むものだ。従来のL3積層が「容量」を追求したものであったのに対し、今回のL2積層技術は「レイテンシ(遅延)の極小化」と「電力効率の最適化」に主眼を置いている点が決定的に異なる。

本稿では、公開された特許資料および関連報道に基づき、AMDが考案したこの革新的なアーキテクチャがもたらす将来的なコンピューティングへの影響を見てみたい。

AD

従来の限界:なぜL2キャッシュの積層は困難だったのか

この技術の革新性を理解するためには、まずCPUのキャッシュ階層におけるL2キャッシュの特殊性を把握する必要がある。

L3とL2の決定的な違い

プロセッサのキャッシュメモリは、CPUコアに近い順にL1、L2、L3と階層化されている。

  • L3キャッシュ(Last Level Cache): 全コアで共有される巨大な倉庫。多少のアクセス遅延があっても大容量であることが正義とされる。既存の3D V-Cache技術がここに適用されたのは、配線が長くなっても容量増加のメリットが上回るからだ。
  • L2キャッシュ: 各コア専用、あるいは少数のコアで共有される「作業机」のような場所。L1に次いで高速であることが求められ、わずかな遅延(レイテンシ)の増加もCPU全体の命令実行パイプラインを停滞させる致命的なボトルネックとなる。

平面配置(Planar)のジレンマ

従来の平面(2D)的なチップ設計において、キャッシュ容量を増やそうとすれば、物理的な面積が広がる。面積が広がれば、データが端から端まで移動するための配線距離が長くなる。1MB2MBとL2キャッシュを肥大化させると、データの移動に要するクロックサイクル数(時間)が増加し、処理速度の足を引っ張るというジレンマが存在した。

従来の3D積層技術を単純にL2に適用しようとしても、別レイヤーへの移動に伴うオーバーヘッドが、高速性を損なうリスクがあったのである。

特許『Balanced Latency Stacked Cache』の核心:幾何学的中心への「エレベーター」設置

AMDが取得した特許 US20260003794A1 は、この物理的な制約を打破するために極めて論理的かつ幾何学的なアプローチを採用している。その核心は、「接続ビア(Connection Vias)を積層キャッシュシステムの中央に配置する」という設計思想にある。

1. 中央集中型インターコネクトによる「等距離」の実現

公開された特許図面および記述によると、AMDはシリコン貫通ビア(TSV: Through Silicon Vias)やボンドパッドビア(BPV)といった垂直通信チャネルを、チップの端ではなく「幾何学的な中心」に配置している。

従来の平面設計では、データがキャッシュの端にある入出力ポートから遠くのメモリセルまで移動するために、複数の「パイプステージ(配線の中継地点)」を経由する必要があった。しかし、通信路をチップの中央に垂直に貫通させることで、データはあたかも高層ビルの中心にある高速エレベーターを使うように、最短距離で目的の層へ到達できる。

2. 「バタフライ構造」による対称性の確保

この設計は「Balanced Latency(均衡遅延)」という特許名が示す通り、キャッシュダイの左右の領域(バンク)に対して、中央から完全に対称的なアクセス経路を提供する。これにより、キャッシュのどの位置にあるデータにアクセスしても、レイテンシが均一化(バランシング)される。
データアクセス時間が場所によってばらつくことは、プロセッサの制御において予測不能なストール(待機時間)を生む原因となるため、この「均一性」は極めて高いエンジニアリング的価値を持つ。

AD

驚異の性能指標:物理法則に挑む「12サイクル」の意味

特許文書には、この技術がもたらす具体的な性能向上の数値が記載されている。この数値こそが、本技術の真価を物語っている。

14サイクルから12サイクルへの短縮

AMDのシミュレーションによると、従来の平面設計における1MBのL2キャッシュへのアクセスには、典型的には14クロックサイクルを要していた。これに対し、本特許技術を用いた積層型1MB L2キャッシュでは、これを12クロックサイクルに短縮できるとされている。

「たった2サイクルの短縮か」と早合点してはならない。現代のCPUが5GHz(1秒間に50億回振動)以上で動作していることを考慮すれば、L2キャッシュのような頻繁にアクセスされる領域での約15%のレイテンシ削減は、IPC(クロックあたりの命令実行数)に直結する巨大なインパクトを持つ。

サイクル削減のメカニズム

なぜサイクルが減るのか。それは、平面上でデータを横移動させるために必要だった「中継用フリップフロップ(Pipeline Flops)」を排除できたからである。

  • 従来: コントローラ → パイプラインステージA → パイプラインステージB → メモリセル(往復でサイクル消費)
  • 新技術: コントローラ → 中央ビア(垂直移動) → メモリセル(横移動距離が半減)

この物理的な移動距離の短縮が、そのまま処理時間の短縮へと変換されているのである。

この技術がもたらす3つのパラダイムシフト

単に「速くなる」だけではない。AMDのこの特許は、半導体設計における「発熱」と「微細化の限界」という2つの壁を突破するための重要な鍵を含んでいる。

1. 消費電力と発熱の抑制(Power & Thermal Efficiency)

特許文書では、レイテンシの改善と並んで「省電力化」が強調されている。これは電気工学の基本原理に基づいている。
配線の長さは、そのまま寄生容量(Capacitance, \(C\))の増大を意味する。デジタル回路の消費電力(\(P\))の一部は、配線を充放電するために消費され、それは \(P \propto CV^2f\) の関係にある。
積層化によって配線長を物理的に短縮することで、容量 \(C\) が減少し、結果として無駄な電力消費が減る。さらに、駆動に必要な電力が減れば、必然的に発熱も抑制される。3D積層チップ最大の課題である「熱密度」の問題を、構造そのもので緩和しようとするスマートな解決策である。

2. 「Cache Control Circuitry (CCC)」の分離による歩留まり向上

本特許のもう一つの興味深い点は、キャッシュを制御する回路(CCC)やタグフィールド(Tag Field)を、メモリセルが載る積層ダイではなく、ベースダイ(基礎となる層)に配置している点である。

  • ベースダイ: 複雑なロジック回路(制御部)を担当。
  • 積層ダイ: 規則的なメモリ配列(データ部)を担当。
    このように機能を物理的に分離することで、それぞれの層を最適な製造プロセス(例:ロジックは最先端の2nm、メモリは密度の高い3nmなど)で製造することが可能になる。これは製造コストの最適化と歩留まりの向上に寄与するだろう。

3. ムーアの法則の延命

平面方向への微細化が限界に近づく中、トランジスタを増やす唯一の残された道は「上」である。L3に続きL2キャッシュまでもが垂直方向に逃げることで、CPUコアそのものの設計や、その他のアクセラレータ(AIユニットなど)のために、貴重な平面上のシリコン面積を空けることができる。これは、次世代のZenアーキテクチャにおいて、より多くのコアを搭載したり、AI処理能力を強化したりするための布石となる。

AD

実装への道のりと競合優位性

Zen 6、あるいはZen 7への搭載か

今回の情報は特許の公開(2026年1月)であり、即座に製品化されるわけではない。しかし、AMDはすでに「Ryzen 7 9850X3D」などで3D V-Cache(L3)の実績を積み重ねており、TSV技術やハイブリッドボンディングのノウハウは成熟している。
論理的に考えれば、この技術は次々世代のアーキテクチャ(仮称:Zen 6以降)での採用が有力視される。特に、L2キャッシュの容量要求が高まるAI推論処理や、ハイエンドゲーミング用途において、競合であるIntelに対する強力な差別化要因となるだろう。

競合他社に対する「構造的」優位

Intelも「Foveros」などのパッケージング技術を持っているが、キャッシュ階層の内部構造、特にL2レベルでの「遅延均衡化(Balanced Latency)」に特化した特許を押さえたことは、AMDにとって大きなアドバンテージとなる。単純な積層ではなく、「中央貫通・対称配置」というアーキテクチャレベルでの最適化は、模倣が困難な技術的障壁となるからだ。

2次元から3次元へ、演算の「密度」が変わる

AMDの新特許「Balanced Latency Stacked Cache」は、単なるスペックアップの手段ではない。それは、プロセッサ設計が2次元の制約から解き放たれ、真の意味で3次元的な構造へと進化する転換点を示している。

データへのアクセス距離を物理的に短縮し、レイテンシを削り取り、同時に電力効率を高めるこの技術は、来るべきAI時代において求められる「高密度かつ高効率なコンピューティング」への解答である。我々ユーザーは近い将来、クロック周波数の数字だけでは測れない、異次元の「レスポンス」を持つプロセッサを体験することになるだろう。


Sources