NVIDIAが次世代AI用GPUであるBlackwellシリーズの製造過程で発生した問題を修正し、2024年第4四半期に数十億ドル規模の出荷を予定していることが明らかになった。この発表は、同社の2024年度第3四半期決算発表の場で行われ、大きな注目を集めている。
NVIDIAのBlackwell GPUが直面した製造上の課題
NVIDIAのColette Kress CFOは、決算発表の場で「Blackwell GPUのマスクに変更を加え、生産歩留まりを改善した」と述べ、製造過程での問題を認めた。この問題は、Blackwell GPUの設計に関連するもので、特に複数のダイを組み合わせる高度なパッケージング技術に起因すると見られている。
NVIDIAのCEOであるJensen Huang氏は、問題の詳細については明らかにしなかったものの、「マスクの変更は完了した。機能的な変更は必要なかった」と説明し、問題が解決したことを強調した。さらに、「現在、さまざまなシステム構成でBlackwell – Grace Blackwellの機能サンプルをサンプリングしている」と付け加え、開発が予定通り進んでいることを示唆した。
この製造上の課題は、TSMCの最先端パッケージング技術であるCoWoS-Lを使用したB100およびB200 GPUに関連していると報じられていた。CoWoS-Lは、チップレットをRDLインターポーザーでLSI(局所シリコン相互接続)ブリッジを介して接続し、約10TB/sの転送速度を実現するものだ。しかし、GPUチップレット、LSIブリッジ、RDLインターポーザー、マザーボード基板間の熱膨張係数(CTE)の不一致により、反りやシステム障害が発生していたとされる。
NVIDIAは、これらの問題を解決するためにGPUシリコンの最上位メタル層とバンプを再設計したと報じられているが、同社は詳細を明らかにせず、単に新しいマスクを作成したと述べるにとどまっている。この対応により、Blackwell GPUの生産歩留まりが改善され、量産に向けた準備が整ったことが示唆されている。
Blackwell GPUの第4四半期出荷計画と業界への影響
NVIDIAは、Blackwell GPUの生産を2024年第4四半期から開始し、2026会計年度にかけて拡大していく予定だ。Kress CFOは、「2024年第4四半期には、数十億ドル規模のBlackwell収益を見込んでいる」と述べ、同社の強気な姿勢を示した。
具体的な出荷数量は明らかにされていないが、業界筋によると、データセンター向けBlackwellモジュールの価格は約70,000ドルと推定されている。ただし、この価格は大量購入や需要によって変動する可能性がある。NVIDIAが第4四半期に「数十億ドル規模のBlackwell収益」を見込んでいることから、相当数のチップが出荷されると予想される。
Blackwell GPUは、前世代のHopper GPUと比較して2倍以上のVRAMと2.5〜5倍の性能向上を実現すると発表されている。特に注目されているのが、Grace-Blackwellスーパーチップ(GB200)で、2つのBlackwell GPUと72コアのGrace CPUを組み合わせた2,700Wの高性能チップだ。NVIDIAは、36個のGB200を搭載した120kWのNVL72ラックシステムで、推論性能が30倍向上すると主張している。
この性能向上により、Blackwellは大規模言語モデル(LLM)の処理能力を大幅に引き上げる可能性がある。現行のHGX/DGX H100プラットフォームでは、数千億パラメータを超えるモデルの処理に苦戦していたが、Blackwellベースのシステムではその10倍以上のサイズのモデルをサポートできると期待されている。
業界アナリストは、NVIDIAの今回の対応を肯定的に評価している。Gartnerのアナリスト、Gaurav Gupta氏はThe Registerに対し、「通常、このような問題は早期に解決されるべきだが、NVIDIAには2つの利点がある」と指摘する。1つは、AMDやIntelなどの競合他社が最近進展を見せているものの、NVIDIAにはまだ大きな競争優位性があること。もう1つは、マスクの変更によって長期的にはかなりのコスト削減につながる可能性があることだ。
Gupta氏は、「新しいマスクが生産歩留まりを向上させれば、遅延による損失を簡単に回収できるだろう。チップ製造では高い歩留まりを達成することが重要で、それにより廃棄されるチップが少なくなり、生産がより効率的で信頼性が高くなる。また、サイクルタイムの改善にもつながる」と述べている。
NVIDIAのBlackwell GPUの成功は、AI産業全体に大きな影響を与える可能性がある。高性能なAIチップの供給が増えることで、より高度なAIモデルの開発や、AIの応用範囲の拡大が期待される。一方で、競合他社もAI市場でのシェア獲得を目指して開発を加速させており、今後のAIチップ市場の競争が一層激化することは間違いない。
NVIDIAは、Blackwellの製造問題を迅速に解決し、予定通りの出荷を維持することで、AI市場でのリーダーシップを強化しようとしている。今後の実際の出荷状況と性能評価が、業界内外から注目されることになるだろう。
Sources
コメント