Qualcommのデータセンター戦略は、AI推論用アクセラレータの追加発表から、CPU、メモリ近傍計算、ネットワーク、ソフトウェアまでを束ねるラック単位の提案へ広がった。Qualcomm Technologiesは2026年6月24日のInvestor Dayで、データセンター向け新ポートフォリオ「Qualcomm Dragonfly」を発表した[1]。対象にはDragonfly C1000 CPU、High Bandwidth Compute、Dragonfly AI300推論アクセラレータ、接続製品、カスタムシリコンが含まれる。

今回見るべきなのは、個々のチップ名よりも、Dragonflyがカバーする範囲の広がりだ。2025年10月に発表されたAI200とAI250は、ラックスケールのAI推論を主役にした製品だった。今回のDragonflyでは、AIラックを動かすCPU、データ移動を減らすメモリ構造、ラック内外の接続、モデルを載せるソフトウェアまでが同じロードマップに入った。Qualcommは、AIエージェントが常時推論し、長い文脈を扱い、トークン生成量を増やす時代には、ピーク演算性能よりもトークン当たりの電力とコストが採用判断を左右すると見ている。

AD

Meta向けC1000でCPU事業の足場を作る

DragonflyC1000CPU.webp

今回の発表で最も分かりやすい商用上の前進は、Metaとの複数世代にわたるデータセンターCPU協業である。[2]Qualcommによると、Dragonfly C1000[3]はMetaの次世代サーバーフリートで使われる計画で、2028年後半から生産に入る。C1000の商用提供時期も2028年とされており、DragonflyのCPU側は実質的にこの時期を最初の大きな節目に置いている。

C1000は、Qualcomm Oryon CPUコアを用いた250コア超のチップレット設計を掲げる。Qualcommは、5GHz超の動作周波数、PCIe Gen 7で2TB/s超の接続帯域、CXL対応、空冷と液冷の両対応、OCP ORv3準拠ラックを挙げ、既存サーバーCPU競合の公開仕様に基づく比較で2倍超の性能電力比を見込むとしている。用途はAIエージェントのオーケストレーション、汎用サーバー処理、AIアクセラレータを支えるヘッドノードであり、GPUやNPUそのものとは違う場所を狙う。

ここが、Qualcommにとって難しくも意味のある領域だ。AIアクセラレータは推論性能で目立ちやすいが、大規模データセンターではCPUがジョブの配分、ネットワーク、ストレージ、アクセラレータ利用率に関わる。Metaのような事業者がCPUを複数世代で採用する計画を公表したことは、Qualcommが自社の低消費電力設計をサーバーCPUへ持ち込むという説明に、少なくとも1社の大口導入シナリオが付いたことを意味する。ただし、量産開始は2028年後半であり、現時点で示されたのは製品評価の入口ではなく、将来の導入計画である。

AI200からAI300へ、焦点はメモリ帯域と推論コストに移る

アクセラレータ側の出発点はAI200である。AI200は1カード当たり768GBのLPDDRメモリを搭載し、56カード構成のORv3ラックで43TBのメモリ容量、0.414PB/sの実効メモリ帯域、140kWのラックTDPを示す。Qualcommは、最大10兆パラメータ級のモデルと128Kトークンまでの文脈長に対応する設計だとしている。大規模言語モデルの推論では、モデルをどれだけ大きなメモリ空間に置けるか、生成時にどれだけ速くメモリからデータを引き出せるかが、応答速度とコストに直結する。

AI250はこの制約に対し、High Bandwidth Computeと呼ぶ近接メモリ計算を入れる。Qualcommの説明では、HBCはメモリダイと計算ダイをパッケージ内で結び付け、演算密度が低くメモリ移動が支配的な処理でデータをSoC側へ何度も運ばずに済ませる。AI250はHBC Gen 1により1カード当たり133TB/s、ラック当たり7.455PB/sの実効メモリ帯域を掲げる。AI200比で18倍で、ラックメモリ容量は同じ43TB、ラックTDPは140kWとされる。対応文脈長も最大1Mトークンへ広がる。

AI300.webp

AI300はさらにHBC Gen 2を使う第3世代のラックレベルAI推論プラットフォームと位置付けられる。Qualcommは、AI300でAI200比54倍の実効メモリ帯域を狙い、AI250比ではラック当たりの実効帯域とメモリ容量をそれぞれ3倍にすると説明している。AI300の製品ページでは、単一ホップのall-to-allラック内スケールアップ、カードごとの拡張スケールアウト、検証済みのポッド構成、C1000との組み合わせが示されている。商用サンプリングは2028年の予定だ。

この流れが示すのは、QualcommがAI推論を「演算器を増やす競争」だけでは見ていないことだ。生成AIの推論では、入力文脈の読み込み、注意機構、デコード、ツール呼び出し、複数エージェントの並列実行が重なる。エージェント型AIでは、短い一問一答よりも処理が長く、文脈も大きくなりやすい。Qualcommはそこに対して、メモリ容量、実効帯域、データ移動の電力をまとめて減らす設計を出している。裏返せば、独立したベンチマーク、価格、実際のモデル運用でこの説明を証明できるかが、AI250以降の採用判断を左右する。

AD

接続、カスタムシリコン、ソフトウェアを同時にそろえる理由

Dragonflyのもう一つの特徴は、チップだけで完結させていない点にある。AI300はスケールアップにUALinkとESUNを使い、スケールアウトには銅線と光接続を使うと説明されている。Qualcommの接続ポートフォリオは、ダイ間接続、銅線、光、キャンパス規模の接続までを含み、800Gと1.6Tの光、AOC、AEC用途、最大20kmのキャンパスリーチを対象にしている。AIラックは単体性能だけでなく、ラック間、建屋間、ストレージとの距離で性能を失いやすく、接続技術は周辺部品ではなく推論基盤の一部になる。

ソフトウェア側でも、Qualcommは同じ日に複数の手を打った。Modularの買収合意は、CPU、GPU、NPU、カスタムASICをまたぐAIネイティブなソフトウェアスタックを取り込む狙いで、取引完了は2026年後半の予定だ。Qualcommは、Modularの技術によって、異なるアクセラレータごとに書き換えずにモデルを動かす基盤を強化できるとしている。Dragonflyを複数世代の基盤として売るには、ハードウェアの性能に加え、異種混在を前提にした開発者体験を早く整える必要がある。

Hugging Faceとの関係拡大も、この文脈で見ると意味がはっきりする。Qualcommは、Hugging Faceの内部および開発者ワークロードをDragonflyデータセンターソリューションへ載せる計画を示し、1,600万人規模の開発者コミュニティ、300万超のオープンモデル、デバイスからデータセンターまでをまたぐAgentによるモデル導入を前面に出した。開発者がモデル実験から本番展開へ進むとき、ハードウェアの省電力だけでは足りない。モデル変換、最適化、配備、監視、障害対応までの道筋が短くならなければ、データセンター向け新アーキテクチャは採用されにくい。

Qualcommの狙いはスマートフォン依存の緩和にもある

このデータセンター発表は、Qualcommの事業構造の変化ともつながっている。同社は2026会計年度第2四半期に106億ドルの売上高を計上し、QCTの自動車とIoTの合計売上高は前年同期比20%増だった。同じ発表でCristiano Amon CEOは、AIエージェントの台頭が同社の各プラットフォームのロードマップを作り替えていると述べ、主要ハイパースケーラー向けのカスタムシリコン案件が2026年内の初回出荷に向けて進んでいるとも説明していた。

Dragonflyは、スマートフォン向けSoCで培った低電力設計をサーバーへ持ち込むだけの話ではない。Qualcommは自動車、IoT、データセンターを成長領域として掲げており、Dragonflyはその中でAIインフラを担う新しい柱として置かれた。Dragonfly C1000、AI300、HBC、Modular、Hugging Faceの発表を同じ日に並べたのは、単品のチップ売りではなく、顧客が複数世代で採用できる基盤を作るというメッセージである。

ただし、Qualcommが短期間にデータセンター市場で大きな存在感を得られるかはまだ分からない。C1000は2028年、AI300も2028年の商用サンプリングで、AI250とHBC Gen 1も2027年半ばのサンプリングが次の確認点になる。公称の性能電力比やメモリ帯域の優位性は、実機、価格、供給量、ソフトウェアの完成度、顧客側の運用実績で検証される必要がある。

今回のDragonflyはQualcommのデータセンター参入を一段進めた。AI200/AI250で示した推論ラックの延長に、Meta向けCPU、HBCの世代ロードマップ、AI300、接続、カスタムシリコン、開発者向けソフトウェアを並べたからだ。2028年にMeta向けCPUの生産とAI300の商用サンプリングが予定どおり進むなら、Qualcommはモバイル由来の低消費電力設計を、AIデータセンターの運用コストという別の言葉で売る会社になる。その前に問われるのは、ロードマップの広さではなく、ラック単位でどれだけ早く顧客の推論コストを下げられるかである。