AI半導体市場の絶対王者NVIDIAと、その牙城を崩そうと苦闘する巨人Intel。この相容れないはずの両社が、互いの製品を組み合わせた「ハイブリッドAIサーバー」を発表した。Intelが、販売不振が伝えられる自社のAIアクセラレーター「Gaudi 3」を、NVIDIAの最新鋭GPU「Blackwell B200」と統合するラックシステムを公開したのだ。これは、AI市場におけるIntelの生き残り戦略として「敵の懐に飛び込む」苦肉の策なのか。それとも、AIのワークロードが複雑化する未来のコンピューティングの姿を示す、先見性のある一手なのだろうか。

AD

AI業界を揺るがす「異例の協業」その全体像

この発表の舞台となったのは、データセンター技術の標準化を推進するOCP Global Summitだ。ここでIntelが提示したのは、自社のGaudi 3を搭載したラックスケールシステムと、NVIDIAのBlackwell B200 GPUを連携させるという驚きの構想であった。

このハイブリッドシステムの核心は、AIの「推論(Inference)」プロセスにおける役割分担にある。推論とは、学習済みAIモデルを使って、新しいデータに対する予測や判断を行う処理のことだ。この推論プロセスは、大きく二つのフェーズに分けられる。

  1. Prefill(プレフィル): ユーザーからの質問(プロンプト)など、最初のまとまったデータを一括で処理するフェーズ。文脈全体を理解するために、大規模な並列計算能力が求められる。
  2. Decode(デコード): Prefillの結果を受けて、単語やトークンを一つずつ逐次的に生成していくフェーズ。ChatGPTが文章を少しずつ生成していく様子をイメージすると分かりやすい。この処理は、計算の規模は小さいが、メモリとのデータ転送速度(メモリ帯域幅)が性能を大きく左右する。

今回の協業では、Prefill処理をNVIDIA B200 GPUが、そしてDecode処理をIntel Gaudi 3が担当する。これは、それぞれのチップのアーキテクチャ特性を活かした、理にかなった分担と言える。NVIDIAのGPUは、その圧倒的な演算能力で大規模な行列演算を得意としており、Prefillのような処理に最適だ。一方、IntelのGaudi 3は、メモリ帯域幅の広さと、チップに統合されたイーサネット・ネットワーク機能によるスケールアウト(多数のチップを連携させること)に強みを持つとされており、Decode処理に向いている。

Intelの主張によれば、このハイブリッド構成は、B200 GPUのみで全ての処理を行うベースラインシステムと比較して、小規模で高密度なAIモデルにおいて、TCO(Total Cost of Ownership:総所有コスト)あたりの性能が1.7倍向上するという。これは、高価なB200を最も得意な処理に集中させ、比較的安価なGaudi 3で残りの処理を補うことで、システム全体の費用対効果を高めるという考え方に基づいている。

なぜIntelはこの戦略を選んだのか? 在庫、性能、そして生き残り戦略

この一見すると奇策にも思える協業の裏には、Intelが抱える深刻な課題と、それを打破しようとする極めて現実的な戦略が存在する。

山積する「Gaudi 3」の在庫問題

半導体アナリスト集団であるSemiAnalysisは、この動きの背景に、Intelが「売ることのできないGaudi 3チップで満たされた巨大な倉庫在庫」を抱えているという厳しい現実があると指摘している。Gaudi 3は、性能面では一定の評価を得ているものの、その普及を阻む最大の壁がソフトウェアにある。

NVIDIAがCUDAという磐石の開発プラットフォームを15年以上にわたって築き上げ、事実上の業界標準となっているのに対し、IntelのGaudi用ソフトウェアスタックは未成熟で、しかもクローズドソース(ソースコードが公開されていない)である。開発者や企業は、使い慣れたCUDAから未知数のGaudiプラットフォームへ移行することに強い抵抗を感じる。結果として、Intelはパートナー企業にGaudi 3を売り込むのに苦戦し、大量の在庫を抱える事態に陥っていると分析されているのだ。

この状況下で、IntelにとってGaudi 3を単体で販売する道は極めて険しい。そこで、既に市場を支配しているNVIDIAのエコシステムに「相乗り」し、自社のハードウェアを「NVIDIAシステムを補完するパーツ」として売り込むという戦略が浮上したのである。

「TCOあたり1.7倍」という性能向上の狙い

Intelが主張する「TCOあたり1.7倍の性能向上」という数字は、単なる技術的優位性を示すだけでなく、顧客に対する強力な経済的メッセージでもある。

AIサーバーの導入と運用には莫大なコストがかかり、特にNVIDIAのハイエンドGPUは非常に高価だ。もし、比較的安価なGaudi 3を追加することで、システム全体の費用対効果が大幅に向上するのであれば、顧客にとっては魅力的な選択肢となり得る。Intelは、Gaudi 3を「NVIDIAの代替品」としてではなく、「NVIDIAシステムの価値を最大化するブースター」として位置づけることで、新たな市場を開拓しようとしているのだ。

ただし、この性能向上は「小規模高密度モデル」という特定の条件下での話であり、あらゆるAIワークロードで同様の効果が得られるわけではない点には注意が必要だ。

「敵の懐」に飛び込む戦略的意味

「勝てないなら、仲間になれ」という言葉が、この戦略を的確に表している。Intelは、正面からNVIDIAに挑むのではなく、NVIDIAが構築した広大な経済圏の中で、自社の製品が生き残るためのニッチな立ち位置を見つけ出そうとしている。

これは、かつてPC市場でAMDが、Intel互換CPUを製造することで市場での足がかりを築いた戦略にも通じるものがある。支配的プラットフォームのルールを受け入れ、その中で自社の価値を提供することで、まずは市場での存在感を確保する。Intelの今回の動きは、プライドを捨ててでもAI市場での生き残りを図ろうとする、プラグマティックな判断の結果と言えるだろう。

AD

技術的詳細:ラックシステムはどう再設計されたか

このハイブリッド構成を実現するために、IntelはGaudi 3のシステムレベル設計を大幅に見直している。

スケールアップの飛躍的向上:Broadcom Tomahawk 5スイッチの役割

従来のGaudi 3システムは、8基のチップを一つの単位(スケールアップドメイン)として接続していた。しかし、今回発表された新設計では、データセンター向けスイッチで高いシェアを誇るBroadcom社の「Tomahawk 5」(51.2T)スイッチを採用。これにより、一つのスケールアップドメイン内で接続できるチップ数を64基へと一気に8倍に引き上げた。さらに、ラックをまたいでケーブル接続することで、128基以上の大規模な構成も可能になるという。この拡張性は、大規模AIモデルの運用において極めて重要となる。

連携の鍵を握るNVIDIA ConnectX-7

最も注目すべき変更点は、ネットワークインターフェースカード(NIC)だ。従来のGaudi 3は、チップに統合された独自のRDMA対応イーサネットNICを使用してチップ間を接続していた。しかし、NVIDIAのB200と通信するためには、この独自仕様では連携できない。

そこでIntelは、NVIDIA製の高性能NICである「ConnectX-7 400GbE」をシステムに採用した。これにより、Gaudi 3はNVIDIAのネットワークプロトコルでB200と直接対話することが可能になる。競合他社のAIチップを自社システムに組み込むために、その競合他社のネットワーク製品を採用するという、まさに「敵の技術で敵と繋がる」決断である。

コンピュートトレイの構成

このシステムの基本単位であるコンピュートトレイには、Intel Xeon CPU 2基、Gaudi 3 AIチップ 4基、NVIDIA ConnectX-7 NIC 4基、そしてNVIDIA BlueField-3 DPU 1基が搭載されている。1つのラックにこのトレイが16台収容され、合計で64基のGaudi 3が搭載される計算だ。DPU(Data Processing Unit)が搭載されている点も興味深く、ネットワーク処理やセキュリティ処理をCPUからオフロードし、システム全体の効率を高める狙いがあるとみられる。

NVIDIAにとってのメリットと「200IQ」の取引術

この協業は、一見するとIntelに利するように見えるが、NVIDIAにとっても決して悪い話ではない。むしろ、プラットフォーマーとしてのNVIDIAの支配力をさらに強化する側面を持っている。

SemiAnalysisがこの提携を「200IQ Jensen Art of the Deal partnership(ジェンスン・フアンCEOによる、IQ200の取引術が生んだパートナーシップ)」と評したように、NVIDIAは巧みに自社のエコシステムを拡大している。

ネットワーキングエコシステムの支配力強化

最大のメリットは、NVIDIAのネットワーキング技術が「業界標準」であることを改めて印象付けたことだ。Intelですら、自社のAIチップを市場に投入するためには、NVIDIAのConnectX NICを使わざるを得ない。これは、たとえ競合するAIチップが登場したとしても、その周辺(インターコネクト)はNVIDIAの技術で固めるという、強力なプラットフォーム戦略の成功を示している。GPUだけでなく、NIC、スイッチ、DPU、そしてソフトウェア(CUDA)といったAIインフラ全体を包含するNVIDIAの垂直統合モデルは、Intelのような競合他社を自社のエコシステム内に取り込みつつある。

B200の価値を最大化する補完関係

また、このハイブリッド構成は、顧客に対してNVIDIA製品の価値を最大化する提案にも繋がりうる。B200のような超高性能GPUは、全ての処理を任せるには高価すぎると感じる顧客もいるだろう。そこで、B200が最も得意とするPrefill処理にその能力を集中させ、比較的コストの低いDecode処理をGaudi 3にオフロードするという選択肢を提示する。これにより、顧客は自身の予算とワークロードに最適化されたシステムを構築でき、結果としてNVIDIA製品の導入が促進される可能性もある。

AD

残された最大の課題:未成熟なソフトウェアと「最後のGaudi」

しかし、この楽観的なシナリオの前に、Intelは依然として巨大な壁に直面している。それは、根本的な課題であるソフトウェアの問題だ。

誰も使いたがらない? クローズドソースの壁

今回の発表は、あくまでハードウェアとシステムレベルの統合に関するものであり、Gaudi 3のソフトウェアスタックが抱える問題には何ら手を付けていない。Gaudi 3向けのPyTorch(主要なAI開発フレームワーク)は依然としてクローズドソースであり、オープンソースコミュニティへの貢献(アップストリーム)も行われていない。開発者にとって、これはブラックボックスであり、自由にカスタマイズしたり、問題を解決したりすることが難しい。このソフトウェアの壁が存在する限り、どれだけハードウェア的に優れたシステムを構築しても、開発者が積極的に採用する動機付けは弱いままだろう。

「End of Life」アーキテクチャへの投資ジレンマ

さらに深刻なのは、Gaudiアーキテクチャ自体が「End of Life(生産終了)」、つまりGaudi 3が最後の製品であるという事実だ。Intelは今後、AIアクセラレーターの主軸をGPUアーキテクチャ(コードネーム:Falcon Shores)に移行する計画とされている。

この状況は、Intelにとっても、顧客にとっても、難しいジレンマを生む。Intelは、間もなく消えゆくアーキテクチャのソフトウェア開発に、これ以上どれだけのリソースを投入すべきか。一方、顧客は、将来性のないプラットフォームに多額の投資を行うことを躊躇するだろう。このハイブリッドAIサーバーが、短期的な在庫処分のための「打ち上げ花火」で終わってしまうリスクは否定できない。

AIインフラの未来を示す布石となるか

IntelとNVIDIAによるこの前代未聞の協業は、多面的な評価を可能にする複雑な一手である。

短期的には、IntelがAI市場での生き残りをかけて打った「苦肉の策」という側面が強い。山積する在庫を収益化し、NVIDIAの広大なエコシステムの中でかろうじて存在感を維持するための、現実的な選択と言えるだろう。

一方で、NVIDIAにとっては、自社のネットワーキング技術を軸としたプラットフォーム支配をさらに盤石にする、計算高い戦略的勝利である。競合他社の製品さえも自らのエコシステムの一部として機能させ、AIインフラにおけるNVIDIAの不可欠性を改めて世界に示した。

しかし、より長期的な視点で見れば、この動きはAIインフラの未来が「ヘテロジニアス・コンピューティング(異種混合計算)」へと向かう大きな潮流の表れと捉えることもできる。AIのワークロードがますます多様化・複雑化する中で、単一の万能チップですべてをこなすのではなく、それぞれの処理に最適化された複数の異なるチップを組み合わせて、システム全体の効率を最大化するという考え方だ。

今回の「B200 for Prefill, Gaudi 3 for Decode」という役割分担は、その具体的な一例を示したに過ぎないのかもしれない。この協業が一時的な延命策に終わるのか、それともAIインフラの新たな設計思想の幕開けとなるのか。その答えは、Intelがソフトウェアという最大の課題を克服し、この「最後のGaudi」に持続的な価値を与えられるかどうかにかかっている。AI業界の巨人たちが織りなすこの戦略的なゲームから、今後も目が離せない。


Sources