NVIDIAの次世代AIインフラ「Vera Rubin」システムの製造コストが急騰、メモリ価格の高騰が要因に
NVIDIAの次世代AIラック「VR200 NVL72」の製造原価は、メモリコストの435%上昇などにより約780万ドルに達すると推定されている。この高額なインフラ投資は、AI開発におけるハードルを高め、クラウド事業者のビジネスモデルやAIコンピューティングリソースの価格設定に大きな影響を与える見通しだ。
別名: Maia 100
Microsoftが2023年に発表した、大規模言語モデルのトレーニングと推論に最適化された独自のAIチップ。Armアーキテクチャを採用し、Azureデータセンター内での効率的なAI処理を実現するために設計された。
NVIDIAの次世代AIラック「VR200 NVL72」の製造原価は、メモリコストの435%上昇などにより約780万ドルに達すると推定されている。この高額なインフラ投資は、AI開発におけるハードルを高め、クラウド事業者のビジネスモデルやAIコンピューティングリソースの価格設定に大きな影響を与える見通しだ。
Metaはエージェント型AIの処理に特化し、GPUではなくArmベースのCPU「Graviton5」をAWSから数千万コア、最低3年間調達する大型契約を締結した。これは、エージェント型AIが求める低レイテンシと高いスレッド並列性がCPUの得意とする領域であり、電力効率とコスト面で優位性があるため、AIインフラの最適解がワークロードによって分岐しつつあることを示している。
SpaceXはIPOに向けたS-1登録書で、将来の大規模設備投資の一部として自社GPU製造を挙げ、チップ供給の不安定さを投資家へのリスクとして開示した。これはNVIDIA依存からの脱却というより、StarlinkやxAI、宇宙データセンター構想など、Musk氏傘下の複数事業における計算資源の安定確保を目的とした垂直統合オプションである。Intel 14Aプロセスを用いたTerafab構想と連携し、AIアクセラレータの内製化を目指すものの、その実現には大きな技術的・経済的リスクが伴う。
GoogleはBroadcomとの長期契約を継続しつつ、推論向けAIチップの最適化を進めている。Marvellとの協議は、推論専用TPUとメモリ処理ユニットの2チップ構成により、演算とメモリ階層の分業で推論性能とコスト効率を改善する狙いがある。これは、推論のボトルネックが演算性能だけでなくメモリ帯域やデータ移動にあるという認識に基づき、推論向け半導体競争が単なる演算性能から総合的な効率へと移行していることを示唆している。
Intelの半導体受託製造部門であるIntel Foundryが、巨大IT企業Microsoftの次世代AIアクセラレータ「Maia 2」の製造契約を獲得したことが報じられた。この取引は、Intelの最先端プロセス「18 […]
Microsoftが社運を賭ける自社製AIチップ開発が、深刻な壁にぶつかっている。次世代チップ「Braga」の量産は当初計画の2025年から2026年へと大幅に延期され、さらに性能面でもNVIDIAの現行モデルに及ばない […]
NVIDIAのAIデータセンター向けGPUは「麻薬よりも入手困難」と、どこかの電気自動車やロケット開発企業のCEOが言っていたが、飛ぶように売れ、中には転売も起きるなど、世界中のテクノロジー企業による争奪戦が繰り広げられ […]
AIブームを牽引するMicrosoftは、来る需要に対応する為、データセンターへの投資を拡大しており、来年度早々には容量を3倍に増やす計画である事が、Business Insiderが入手したリーク文書から明らかになった […]