AIサーバーのメモリ不足は、DRAMを何枚足せるかだけの問題ではなくなりつつある。MarvellのCXL製品群「Structera」が示す方向は、サーバーが見えるメモリ容量をCPUソケットのDIMMスロットではなく、CXLデバイス側で増やす設計だ。なかでもStructera XとStructera Aが備えるインラインLZ4圧縮は、メモリ容量の不足を物理容量の問題としてだけ扱わず、CXLコントローラー上で圧縮後の実効容量として扱う線を強めている。
Marvellは2024年7月にStructera A、Structera X、Structera Sを発表し、2025年4月にはAMD EPYCおよび第5世代Intel Xeon Scalable CPUプラットフォームとの相互接続動作を公表した。2026年3月にはCXLネイティブのスイッチとしてStructera S 2504を打ち出している。これらをつなげて見ると、同社の狙いは一台のサーバーに外付けメモリを足すことにとどまらない。CXLで増やしたメモリを圧縮し、必要に応じてラック内で配り直すところまで、メモリ階層をCPU外のシリコンで扱おうとしている。
AI向けサーバーでCPU、GPU、ネットワークの投資が増える一方、メモリ容量がシステム設計の制約として残り続ける。大規模推論やデータ前処理では、演算器が空いていても、モデル、キャッシュ、特徴量、前処理済みデータを置くメモリが足りなければシステム全体の構成を変えざるを得ない。Structeraの提案は、メモリ不足をCPUの近くで抱え込むのではなく、CXLリンクの先に置いた専用デバイスで扱うというものだ。
圧縮をCPUから外すと、容量拡張の前提が変わる
Structera XとStructera Aの中心にあるのは、CXL 2.0 / PCIe 5.0接続のメモリコントローラーにLZ4の圧縮・展開エンジンを入れる設計である。LZ4は高速性を重視した可逆圧縮方式で、最大圧縮率を追うストレージ向け圧縮とは性格が違う。メモリアクセスの経路に入る処理では、圧縮率だけを上げても、展開待ちでCPUやアクセラレーターを止めてしまえば意味が薄い。MarvellがLZ4を前面に出しているのは、メモリ帯域の流れをできるだけ止めずに、同じ物理DRAMからより大きな論理容量を引き出すためである。
CXL圧縮メモリの研究でも、透明なハードウェア圧縮は採用条件の中心に置かれている。ソフトウェア圧縮はメモリ、ストレージ、ネットワークの消費を減らせる一方、CPUコアとメモリ帯域を使う。アプリケーションが圧縮対象を意識しなければならない設計では、導入先も限られる。CXL Type 3デバイス側で圧縮と展開を処理できれば、ホスト側のアプリケーションからは通常のメモリ拡張に近く見せながら、デバイス内部で容量を増やせる。
Structera A 2504は、4本のDDR5-6400メモリチャネル、最大200GB/s級のメモリ帯域、インラインLZ4圧縮・展開、XTS-AES 256ビットのインライン暗号化を備える。Structera X 2504も、CXLメモリ拡張にインラインLZ4圧縮・展開と暗号化を組み込む製品として位置づけられる。圧縮を入れるなら、性能だけでなく保護も同じ経路で考える必要がある。CXLメモリはCPUパッケージの外側に置かれ、サーバーボード上やケーブル越しに扱われるため、メモリ拡張と暗号化を別々の後付け機能として扱いにくい。Marvellが圧縮と暗号化を同じ製品説明の中で並べているのは、CXLメモリを一時的な増設部品ではなく、クラウドサーバーの標準的なメモリ階層へ入れるための条件をそろえる意図がある。
Structera Xは容量、Structera Aはメモリ近くの計算を担う
Structera Xは、メモリ拡張そのものに寄せた製品である。Marvellの製品ページでは、DDR5版で6TB超、DDR4版で4TB超の容量を扱える構成が示されている。DDR4対応モデルは既存DIMMの再利用を前面に出しており、最新DRAMを全量で買い直すのではなく、CXL越しに容量を足す選択肢を作る。AIサーバーで高価なアクセラレーターを増やしても、周辺のメモリ容量が追いつかなければ利用率は下がる。DDR4再利用は最速のメモリを増やす話ではなく、容量が足りない領域に別階層を足す話である。
DDR5版のStructera X 2504は、より帯域を求める用途を受け持つ。CXL 2.0 / PCIe 5.0 x16でホストにつながり、DDR5メモリをCXLデバイスの先に置く。CPUソケット直結のDIMMではないため、レイテンシはローカルDRAMと同じにはならない。一方で、CPU側のメモリチャネルを増やさずに容量を拡張できるため、ワーキングセットの一部をCXL側へ逃がせるアプリケーションでは、サーバー構成の自由度が増す。
Structera Aは、同じCXLメモリ基盤に16個のArm Neoverse V2コアを載せる。Marvellはこの製品をメモリアクセラレーターとして位置づけ、コアは最大3.2GHzで動作すると説明している。ここでのポイントは、CXLメモリがただの遠いDRAMではなく、データの近くで前処理や補助的な計算を行う場所にもなることだ。AIパイプラインでは、演算器へ渡す前のデータ整形、圧縮済みデータの扱い、メモリ内の移動が無視できない。CXL側に計算資源を置けば、ホストCPUへ戻すデータ量を減らせる場面が出てくる。
Structera AとXを分けて考えると、Marvellの製品群が狙う役割の違いが見える。Xは容量と帯域を足す製品であり、Aは容量拡張の近くに計算資源を置く製品である。両方に圧縮・展開エンジンを入れることで、CXLメモリを「遅いが大きい外部メモリ」としてだけではなく、容量、帯域、処理場所を組み替える部品として扱いやすくなる。
Structera Sは、増やしたメモリをラックで配るための部品になる
Structera Sは、同じ問題をラックの単位で扱う製品である。MarvellはStructera S 2504を、16本のx16ポートまたは32本のx8ポートに構成できるCXL 2.0準拠スイッチとして説明し、最大2TB/sのスイッチング容量を掲げている。CXL Type 2とType 3デバイスを扱い、ファブリック管理、メモリプーリング、動的な容量配分を支える。
圧縮とプーリングは別の機能だが、クラウドのメモリ問題ではつながっている。圧縮は一つのメモリデバイスが見かけ上扱える容量を増やす。プーリングは、あるサーバーで余った容量を別のサーバー構成へ回しやすくする。どちらも、物理DRAMをサーバーごとに固定する前提を弱める。AIクラスタでは、GPU数、CPU数、メモリ容量、ネットワーク帯域の均衡がワークロードごとに変わるため、固定配分のままでは過剰な余りと不足が同時に生じる。
ただし、Structera Sが加わっても、すべてのメモリを一つの巨大な共有プールに置けばよいわけではない。CXL越しのアクセスにはローカルDRAMとは異なる遅延があり、スイッチを介せば経路はさらに増える。実運用では、頻繁に触るデータはCPUやGPUに近いメモリへ置き、容量が必要なデータをCXL側へ置く階層設計が必要になる。Marvellの製品群は、その階層を作る部品をそろえつつある段階だ。
2025年4月の相互接続発表は、この点で意味を持つ。MarvellはStructeraのポートフォリオがAMD EPYCおよび第5世代Intel Xeon Scalableプラットフォームで動作したと説明している。CXL製品は標準規格に沿っていても、サーバーCPU、ファームウェア、OS、管理ソフトウェア、メモリ配置ポリシーがそろわなければ導入しにくい。圧縮やプーリングの仕様だけでなく、主要CPU環境での検証が進むかどうかが、クラウド事業者の採用判断を左右する。
採用を左右するのは、圧縮率だけではない
CXLメモリの価値は、圧縮率の数字だけでは測れない。高い圧縮率を出せるデータでも、展開の遅延が大きければ、頻繁にランダムアクセスする処理では足を引っ張る。逆に、圧縮率が控えめでも、ホストCPUを使わずに十分な帯域で処理でき、アプリケーションがほとんど変更なしに使えるなら、導入の見通しは立てやすい。Marvellが製品説明で全帯域のインライン処理、暗号化、セキュアブート、主要CPUとの相互接続を並べるのは、CXLメモリをベンチマーク上の容量増加ではなく、運用可能な部品として売り込むためである。
研究側の議論も同じ方向を向いている。CXLを使った圧縮メモリは、サーバーの総所有コストを下げる候補になり得るが、CXLデバイス、追加のDRAM、スイッチ、電力、ソフトウェア対応の費用を上回るだけの利点が必要になる。ハイパースケール環境では、4KBや1KBといった細かい単位の圧縮、低遅延の展開、ホストから見た透明性が要求される。Marvellがコントローラー内に圧縮を置く理由は、こうした条件をサーバーごとのソフトウェア最適化に任せないためだ。
一方で、公開情報だけではまだ見えない点も多い。実際の圧縮率はワークロードに強く依存する。生成AIの推論、検索、データベース、キャッシュ、ログ処理では、メモリ上のデータの繰り返し方が違う。CXLメモリをどの階層に置くか、圧縮対象をOSやランタイムがどう選ぶか、障害時にプールされたメモリをどう切り離すかも運用上の論点になる。Structeraの仕様は容量不足への明確な回答を示すが、導入企業が見るべきなのは、圧縮後の見かけ容量だけではなく、レイテンシ、CPU負荷、管理ソフトウェア、障害分離を含めたシステム全体の挙動である。
MarvellにとってStructeraの本当の勝負所は、CXLメモリを「追加できるDRAM」から「管理できるメモリ階層」へ進められるかにある。A/Xの圧縮エンジンは同じ物理DRAMから取り出せる容量を増やし、Sのスイッチはその容量をラック内で再配分する。AIサーバーのメモリ不足が続くほど、DRAMを買い足すだけではない選択肢への需要は高まる。次に問われるのは、主要CPUプラットフォーム上で、その設計がどのワークロードにどれだけ自然に入るかだ。