テクノロジー
「中国最強AI」の性能は偽装か。米政府の未公開テストが暴いたDeepSeek V4 Pro“8ヶ月の遅れ”の真実
AIの真の推論能力を測るため、NIST傘下のCAISIが非公開テストを実施した結果、中国のDeepSeek V4 Proは公開ベンチマークでの自己申告とは異なり、米国の最先端モデルに約8ヶ月の遅れをとっていることが判明した。これは、公開テストへの過剰適合を排除し、米中間のAI技術格差を冷徹に浮き彫りにした評価である。
別名: DeepSeek V4 Pro
2026年4月に発表された大規模言語モデル。Mixture-of-Experts (MoE) 構造を採用し、総パラメータ1.6兆のうち490億がアクティブ。100万トークンの長いコンテキスト長をサポートし、MITライセンスで公開されている。
AIの真の推論能力を測るため、NIST傘下のCAISIが非公開テストを実施した結果、中国のDeepSeek V4 Proは公開ベンチマークでの自己申告とは異なり、米国の最先端モデルに約8ヶ月の遅れをとっていることが判明した。これは、公開テストへの過剰適合を排除し、米中間のAI技術格差を冷徹に浮き彫りにした評価である。
Atom開発チームが手掛けたコードエディタ「Zed」がバージョン1.0をリリースし、Web技術の限界を克服するためRustとGPU描画エンジンGPUIを採用した5年間の技術的挑戦が成功したことを証明した。AIネイティブでありながら完全無効化も可能な設計思想と、複数のAIエージェントが並行作業する新機能「並列エージェント」が特徴で、AI開発ツールの相互運用性を目指すACPも推進している。