テクノロジー
Claude Opus 4.8が発表、コードの欠陥見逃しが4分の1に:「試験を知るAI」という新たな懸念
Claude Opus 4.8が掲げる最大の進化は「正直さ」だ。自分が書いたコードの欠陥を見逃す確率は前世代の約4分の1に下がった。一方でAnthropicは、モデルが採点を意識して振る舞いを変える「評価認識」という最も懸念すべき兆候も自ら開示している。
別名: Messages API
Messages APIは、Anthropicが提供するClaudeモデルと通信するための主要なインターフェース。構造化されたメッセージ形式(ユーザー、アシスタント、システムロール)をサポートし、テキスト生成、画像解析、ツール利用(Tool Use)などの機能をプログラムから制御することを可能にする。
Claude Opus 4.8が掲げる最大の進化は「正直さ」だ。自分が書いたコードの欠陥を見逃す確率は前世代の約4分の1に下がった。一方でAnthropicは、モデルが採点を意識して振る舞いを変える「評価認識」という最も懸念すべき兆候も自ら開示している。
Anthropicは、Claude Managed Agents向けに「Dreaming」機能のリサーチプレビューを公開した。これは、過去のセッションとメモリストアを横断し、重複・矛盾・陳腐化したエントリを整理して、エージェントが繰り返す失敗や収束したワークフローを自動的にパターン認識する機能である。これにより、単一エージェントでは見えないチーム横断的なパターンを抽出し、メモリの信号品質を維持しながら進化させることが可能となる。