Metaが、退役サーバーから取り外したDDR4メモリを新世代サーバーへ接続する独自CXL ASIC「Vistara」を実運用に入れている。Blocks&Filesが引用したMetaのISCA 2026向け論文によると、Vistaraはすでに数百万台規模のインフラで稼働し、分離型の機械学習推論では必要サーバー数を最大25%削減したという。

この話で注目すべき点は、CXLという規格そのものより、サーバー更新で取り残されるメモリをまだ価値ある部品として使い続ける設計にある。論文では、Metaのサーバーフリートの約40%がメモリ増設の上限に達しているとされる。サーバー本体の運用期間が3〜5年なのに対し、メモリは7〜10年使えると論文は説明している。

AI推論、推薦システム、分析基盤、キャッシュ、CI/CDはいずれもメモリ容量に強く制約される。CPUや筐体を更新しても、まだ使えるDDR4 DIMMを捨てずに新しいDDR5世代のシステムへ足せるかどうかが、設備投資と稼働率を左右する。Vistaraは、この「余った古いメモリ」をCXL経由で運用可能な資源へ戻す試みだ。

AD

VistaraはDDR4をCXL経由でCPUから見えるメモリにする

Vistara ASICは、DDR4メモリをホストプロセッサへCXL 2.0/1.1準拠のPCIe Gen5 x16インターフェースで接続する。論文の記述によると、1個のASICに独立した72ビットDDR4チャネルが2本あり、最大3,200MT/s、64GB DIMMを使う場合はチップあたり最大256GBに対応する。ASIC内には2基のカスタムRISC-Vプロセッサも搭載される。

Metaが「MemServer」と呼ぶ構成では、AMD Turinプロセッサ(158コア/316スレッド)、768GBのDDR5、Vistara経由の256GB DDR4を組み合わせる。Vistaraカードは筐体後部の専用スロットに収まり、高密度メモリとCXLデバイスの発熱を処理するため冷却風を直接当てる設計になっている。

OSから見ると、Vistaraの先にあるDDR4はCPUを持たないNUMAノードとして現れる。ローカルのDDR5と同じ速度では動かないため、Metaの運用ではまずローカルメモリを使い、必要になったときにCXL接続のメモリへ回す。Vistaraは遅延を消す技術ではなく、速いメモリと遅いメモリを分け、どのページをどこに置くかを制御する設計で成り立っている。

先行研究が示していた「冷たいページ」の置き場

CPUとDDR5メモリ、CXL接続のDDR4メモリ

Metaは2022年の論文「Transparent Page Placement for CXL-Enabled Tiered-Memory」で、CXL接続メモリをローカルDRAMより遅い階層として扱い、アクセスの少ないページをそこへ逃がす仕組みを示していた。大規模なデータセンターワークロードでは、割り当て済みメモリの55〜80%が少なくとも2分間は「冷たい」状態にあると同研究は報告している。

頻繁にアクセスされるページはローカルDRAMに残し、しばらく触られていないページはCXL側へ移す。ローカルDRAMの速度が必要な処理を守りながら、全体の容量を増やせる。この研究はLinux 5.18に取り込まれたTPPの土台にもなり、標準的なLinuxの挙動と比べて最大18%の性能改善を評価で報告していた。

Vistaraは、この発想をより設備寄りの問題へ持ち込んだものと読める。新しいCXLメモリ装置を買い足すだけでは、古いDDR4の再利用にはつながらない。市販のCXL機器はDRAMとコントローラが一体になりやすく、DDR4対応や電力、コストの面でMetaの目的に合わなかったとされる。そこでMetaは、DDR4を直接CXLのメモリ階層へ橋渡しするASICを自社で開発した。

AD

効果は容量が不足するワークロードに集中する

Vistaraの対象は、メモリ容量が不足するとサーバー数やジョブ失敗に跳ね返るワークロードだ。Metaの論文では、推薦システムの埋め込みテーブルを使う分離型ML推論、SparkやHiveを含むビッグデータ処理、データベース、分散キャッシュ、CI/CDビルドシステムが挙げられている。テラバイトからペタバイト級のデータを扱う処理では1ジョブあたり数百GBのメモリが必要になる場合があり、メモリ不足は分析やMLパイプラインの停止に直結する。

報告された数字も、この範囲に限定して読む必要がある。分離型推論では必要サーバー数を最大25%削減し、メモリ不足によるジョブ失敗・再実行・リソース断片化に関わる負担を33%削減したとされる。あらゆるアプリケーションで25%のコスト削減が起きるという話ではない。容量不足で余分なサーバーを抱えていた処理では、CXL側のDDR4が逃げ場になり、CPUとローカルDRAMを過剰に積んだサーバーを用意する必要が下がる、という構造だ。

この点は、2026年の階層メモリ研究「Equilibria」が示す制約とも重なる。同研究は、CXLによるメモリ拡張を低コスト・低消費電力で容量を足す手段と位置づける一方、既存の階層化手法にはマルチテナント対応、公平性、観測性の面で限界があると指摘している。遅延、帯域、コンテナ間の公平性、他の処理からの干渉を管理できなければ、メモリを増やしても性能の予測可能性は崩れる。

CXLの汎用化より先に、Metaは運用範囲を絞った

CXL Consortiumは、CXLをCPU・デバイス・メモリをキャッシュコヒーレントに接続するオープン標準として位置づけている。将来的にはメモリ拡張やプーリングの基盤になり得るが、実運用では規格対応だけでは足りない。どのメモリを接続するか、どのワークロードに使うか、OSがページをどう動かすか、筐体の熱をどう逃がすかまで決める必要がある。

VistaraがCXL関連の取り組みとして際立つのは、「メモリ分離」という広い構想ではなく、自社フリートの具体的な資産問題に合わせ込んだ点だ。DDR4を捨てずに使う、DDR5世代のサーバーへ足す、遅いメモリとしてOSに見せる、容量不足に苦しむワークロードへ割り当てる。この順番があるから、CXLの弱点である遅延と帯域を完全に解消しなくても、投資効果が出る範囲が見えてくる。

Vistaraは現時点でMetaの内部向けシステムであり、外部企業がそのまま調達できる製品ではない。独自ASIC、専用スロット、冷却設計、Linux CXLドライバの調整、ページ配置の運用知識が一体になっている。CXLが標準規格であっても、大規模運用の細部は各社のインフラ設計に強く依存する。

AIと分析基盤がメモリ容量を食い続けるなか、Vistaraが示すのは、メモリを「買って足す」だけではない選択肢だ。使えるDDR4をどこまで延命し、どの処理に割り当てるかは、データセンターのコストだけでなく、サーバー更新サイクルの設計判断そのものに関わってくる。