AnthropicのCEO、Dario Amodei氏が、中国のAIスタートアップDeepSeekの開発コストを巡る議論に詳細な分析を提供し、業界に衝撃を与えた600万ドルで最先端AIの開発を実現したという“物語”の背後にある実態について言及した。彼の分析は、AIモデル開発の経済性と技術革新の本質的な理解に新たな視点を投げかけるものだ。
DeepSeek開発費用の全体像:表面的なコストと隠れたインフラ投資
AnthropicのCEO Dario Amodei氏は、DeepSeekの開発コストを巡る議論について、表面的な数字だけでは実態を正確に理解できないと指摘している。彼によれば、広く報道された「600万ドルでの開発」という説明は、AIモデル開発の複雑な経済構造を大きく単純化したものだという。
Amodei氏は、比較対象として自社のClaude 3.5 Sonnetの開発コストを「数千万ドル程度」と具体的に言及。これは一般に信じられているような「数十億ドル」という規模ではないと強調する。さらに重要な点として、Claude 3.5 Sonnetは9-12ヶ月前に開発されたにもかかわらず、現在でも多くの内部および外部評価においてDeepSeekのモデルを上回る性能を示しているという。
DeepSeekは、”米国のAI企業が何十億ドルもかけたことを600万ドルで行う”わけではありません。Anthropicのことしか言えないが、Claude 3.5 Sonnetは訓練に数千万ドルかかった中規模モデルです(正確な数字は言わない)。また、3.5 Sonnetは、(一部の噂に反して)より大きく、より高価なモデルに関与するような方法で訓練されたわけではありません。
Amodei氏は、DeepSeekの技術的成果を完全に否定しているわけではない。特に、DeepSeek-V3モデルについては、「Key-Value cache」の管理や「mixture of experts」手法の革新的な改善を評価し、“これこそが真のイノベーションだ”と評価している。ただし、話題を呼んだR1モデルについては、既存のアプローチを踏襲したものだとして、技術的革新という観点からはV3ほど注目に値しないと分析している。
DeepSeek-V3こそが、実は真のイノベーションであり、1 か月前に人々が注目するべきものでした (私たちは確かに注目しました)。事前トレーニング済みのモデルとして、トレーニングにかかるコストを大幅に削減しながら、いくつかの重要なタスクで最先端の米国モデルのパフォーマンスに近いようです。
隠されたインフラストラクチャコスト
インフラストラクチャの観点からみると、さらに興味深い実態が浮かび上がる。DeepSeekは約50,000台のHopper世代チップを保有していると報告されており、この規模は注目に値する。これらのチップは主にH100、H800、H20の3種類で構成されており、その総額は約10億ドルに達すると推定される。この投資規模は、主要な米国AI企業の計算インフラと比較しても、わずか2-3倍の差に収まる範囲だとAmodei氏は分析している。
DeepSeekが5万個のHopper世代チップを保有していたことは報道されています。この5万個のHopperチップのコストは10億ドル程度です。したがって、DeepSeekの企業としての総費用(個々のモデルを訓練するための費用とは異なる)は、米国のAI研究所と大差はないのです。
特に注目すべきは、これらのチップの入手経路だ。Amodei氏によれば、DeepSeekのチップ構成は、すでに輸出規制で禁止されているH100、規制前に入手されたと思われるH800、そして現在も輸出が許可されているH20という複雑な組み合わせになっている。この構成は、中国企業が直面している輸出規制の影響と、それを回避するための多様な戦略を示唆している。
「個別のモデルトレーニングコストと、企業全体の研究開発費用は明確に区別して考える必要があります」とAmodei氏は強調する。600万ドルという数字は特定のモデルの単一トレーニング実行コストを指しており、これは企業全体のR&D投資のごく一部に過ぎない。実際の開発プロセスでは、多くの試行錯誤や並行した研究開発が行われ、それらすべてが最終的なモデルの性能に貢献している。
さらにAmodei氏は、DeepSeek-V3の開発コストを時系列的な文脈で評価することの重要性を説く。AI開発のコストは年間で約4倍のペースで低減しているため、9-12ヶ月前に開発されたモデルと比較する場合、3-4倍のコスト効率化は自然な進化の範囲内だという。この観点からすると、DeepSeekの達成は、技術の進歩による通常の効率化の範囲内に収まると分析している。
「現在のAI開発では、効率化による節約分は即座により高性能なモデルの開発に再投資されます。なぜなら、より知的なモデルの経済的価値が非常に高いからです」とAmodeiは指摘する。彼の予測では、2026-2027年頃には、ほとんどの人間よりも賢いAIの開発に数百万個のチップと数百億ドル規模の投資が必要になるとしている。
地政学的影響と今後の展望
Amodei氏は、DeepSeekの成果が米国のAI産業にとって直接的な脅威とはならないと考えている一方で、中国のAI開発能力の向上を示す重要な指標として捉えている。特に、輸出規制の実効性と必要性について、彼は強い関心を示している。
「最終的には、民主主義国家のAI企業は中国のモデルよりも優れたモデルを持つ必要があります。しかし、必要以上に中国共産党に技術的優位性を与える必要はありません」というAmodeiの発言は、技術開発と国家安全保障の複雑な関係を示唆している。
Source
- Dario Amodei: On DeepSeek and Export Controls
コメント