Claudeの「品質低下」問題の調査結果を発表:原因はモデル劣化ではなく製品層の3つの変更
Anthropicは、Claudeの品質低下が基盤モデルの劣化ではなく、Claude Codeなど3つの製品層における変更が重なったためだと説明した。具体的には、Claude Codeの推論努力量デフォルト変更、長時間アイドル後のセッションで思考履歴を誤って消すキャッシュバグ、応答を短くするシステムプロンプト変更が原因である。これらの修正は段階的に行われ、全サブスクライバーの使用制限もリセットされた。
Anthropicは、Claudeの品質低下が基盤モデルの劣化ではなく、Claude Codeなど3つの製品層における変更が重なったためだと説明した。具体的には、Claude Codeの推論努力量デフォルト変更、長時間アイドル後のセッションで思考履歴を誤って消すキャッシュバグ、応答を短くするシステムプロンプト変更が原因である。これらの修正は段階的に行われ、全サブスクライバーの使用制限もリセットされた。
半導体設計の全工程を自律的に行うAIエージェント「Design Conductor(DC)」が開発された。DCは219語の仕様書からRISC-V CPUの論理回路を組み上げ、徹底的な検証とデバッグを経て、わずか12時間で製造用レイアウトファイルを出力することに成功した。これは、これまで人間が手動で行っていた複雑なプロセスをAIがエンドツーエンドで完遂する画期的な成果であり、ハードウェア設計の歴史における重要なマイルストーンとなる。
OpenAIは次世代モデル「GPT-5.5」を発表し、ChatGPTとCodexで先行提供を開始した。本モデルは長時間のエージェント作業の実用化に焦点を当て、コーディングや知識労働、科学研究での能力向上を強調している。API提供は後日予定されており、標準API単価はGPT-5.4から倍増するが、トークン効率の改善により費用対効果の新たな評価軸が提示された。
Bolt Graphicsは高性能GPU「Zeus」のテストチップのテープアウトに到達したが、量産時期は初期告知の2026年後半から2027年第4四半期へと後ろ倒しになった。このテープアウトは設計の前進を示すものの、実性能や量産を保証するものではなく、今後の実測値や事業化の進展が注目される。
Agentic AIの台頭により、データセンターにおけるCPU需要が急増し、コンシューマー向けCPUの価格が大幅に上昇している。DRAM価格は下落したものの、IntelやAMDの主力CPUが最大20%値上がりし、自作PCのコストは高止まりしている。この状況は、サーバー市場での需要逼迫と最先端プロセスを巡る生産枠競争が原因で、2027年まで続く可能性がある。
自然言語でデータベースを操作するText-to-SQLがLLMの登場で再注目されているが、その本質はSQL生成よりも質問の意味を正しく定義する「意味の翻訳層」にある。現状のText-to-SQLモデルは、複雑な質問の曖昧さや社内固有の用語への対応が課題であり、全自動化よりもユーザーとの対話を通じて質問を明確化するインターフェース設計が重要だと指摘されている。
TSMCはA13プロセス技術を発表したが、これはA14の後継ではなく、A14をベースにした縮小版と位置付けられている。A13はA14との完全後方互換を保ちつつ6%の面積削減を実現し、顧客の設計移行負担を抑えることを重視した派生ノードである。この発表は、A12やN2U、先進パッケージ技術と合わせて、TSMCが先端ロジックと先進パッケージの全体的な更新周期を提示していることを示している。
Metaは、AIエージェントの訓練データ整備のため、米国従業員の業務用PCでマウス移動やクリック、キーストローク、画面スナップショットを収集する。これは、AIを「答えるAI」から「操作するAI」へ進化させるため、完成品ではなく作業途中の「迷い」を高価なデータとして活用する狙いがある。他社が顧客データと学習データを分離する中、Metaは従業員の行動データをAI訓練に直接利用する点で一線を画しており、プライバシーや労務管理上の課題が指摘されている。
OpenAIは、企業におけるAI活用を組織全体のプロセス自動化へと転換させる「Workspace Agents」のResearch Preview版を公開した。これは、チームの共有コンテキストを理解し、複数のシステムを横断して自律的にタスクを完了する高度な実行能力を持ち、従来のAIが抱えていたツール間の断絶やチームコンテキストの欠落といった課題を解決する。
Moonshot AIのKimi K2.6は長時間動作するエージェントとして注目されるが、その運用堅牢性に関する詳細な情報が不足している。企業が求めるのは、モデルの性能指標だけでなく、監督方法や復旧手順といった具体的な運用開示であり、今後の課題となっている。
Google Cloudは、企業が数百から数千の自律型AIエージェントを管理・運用する課題に対応するため、新たなエンタープライズ向け開発プラットフォーム「Gemini Enterprise Agent Platform」を発表した。本プラットフォームは、開発環境の刷新、長時間実行と永続的コンテキストを支える実行基盤の強化、そして厳格なガバナンスとインフラストラクチャの統合により、エージェントの急増という課題に包括的に対応する。
Googleは、AIエージェントの台頭によるインフラ要求の変化に対応するため、第8世代TPUで学習特化の「TPU 8t」と推論特化の「TPU 8i」という2つの独立したチップを導入した。これにより、フロンティアモデルの学習時間短縮と低遅延推論を実現し、用途特化によるパフォーマンスと電力効率の最大化を追求している。