Anthropicは2026年4月16日、生成AIモデル「Claude Opus 4.7」の一般提供を始めた。Anthropicは同モデルを一般提供モデルとしては過去最高水準と位置づける一方、System Cardでは、限定公開中の「Claude Mythos Preview」が関連評価でより高い結果を示しており、Opus 4.7は「能力フロンティア」を前進させないと明記している。一般提供モデルとしては最上位だが、関連評価ではMythos Previewが上回る構図である。

開発者にとって重要なのは、性能向上と同時に移行時の前提も変わることだ。Migration guideは、Opus 4.6から4.7への更新で、adaptive thinkingへの移行、temperaturetop_pなど非デフォルトのサンプリングパラメータの削除、思考表示の既定変更、新トークナイザによるトークン増、高解像度画像対応に伴う画像トークン再計算を案内している。コーディングエージェントでは思考モードとサンプリング設定の変更、コンピューター操作系や画像入力が多いアプリでは高解像度画像の負荷、長時間の自律実行ワークロードではxhighやtask budgetsの扱いが先に効く。

AD

一般提供の最上位モデルになったが、公開条件は慎重に保たれている

AnthropicはOpus 4.7を、長時間の自律実行、知識労働、画像理解、メモリー活用で強い一般提供モデルとして投入した。Migration guideでも、既存のOpus 4.6向けプロンプトや評価に対して高い性能を見込みつつ、挙動とAPIの変更を把握したうえで移行するよう求めている。

同時にSystem Cardは、Mythos Previewが関連評価でより高い結果を示しているため、Opus 4.7は能力フロンティアを更新していないと整理する。ここで確認できる事実は4点に限られる。Opus 4.7は一般提供モデルでは最上位であること、Mythos Previewは関連評価でより高いこと、Opus 4.7は能力フロンティアを前進させないこと、そしてAnthropicは新しいサイバー安全策をより能力の低いモデルから試すと述べていることだ。今回の一般提供は、この範囲で慎重に切り出された公開とみるのが妥当である。

コーディングと知識労働、GUI理解では改善幅が大きい

性能改善は主要ベンチマークでも確認できる。System Cardによると、SWE-bench ProはOpus 4.7が64.3%、Opus 4.6が53.4%で、差は10.9ポイントである。OfficeQA Proは80.6%対57.1%で、知識労働タスクの改善幅が大きい。Anthropicが発表文で高度なソフトウェア開発と実務タスクの向上を前面に出した理由は、この数字からも裏づけられる。

claude-opus-4-7-benchmark.webp

GUIや画像理解でも差が出ている。ScreenSpot-Proは、ツールなしで79.5%対57.7%、ツールありで87.6%対83.1%だった。画面上の細かな要素の理解や、密度の高いスクリーンショットの読解に近い評価で差が出ており、コンピューター操作やUI操作を含むワークフローで意味を持つ改善といえる。

仕様面でも、高解像度画像対応が拡張された。Migration guideでは、画像入力の上限が長辺2576px、最大3.75MPとなり、従来の1568px、1.15MPから大きく拡張された。発表文も、高精細なスクリーンショット、複雑な図、ピクセル単位の参照を扱う用途を挙げている。評価値と入力仕様の変更が同じ方向を向いている点が今回の特徴である。

AD

移行ではAPI挙動の変更がの影響も

Opus 4.7への移行では、旧来のthinking: {type: "enabled", budget_tokens: N}が使えず、thinking: {type: "adaptive"}output_config.effortへ移る。adaptive thinkingは既定でオフであり、有効化するには明示指定が必要である。Opus 4.6時代にextended thinkingを前提としていた実装は、そのままでは400エラーになる。

サンプリングパラメータの扱いも変わる。Migration guideは、temperaturetop_ptop_kを非デフォルト値で送ると400エラーになると案内する。従来これらの値で挙動を調整していたアプリでは、リクエスト本文の見直しが必要になる。推奨される移行経路は、これらのパラメータを外し、プロンプト設計で挙動を制御する方法である。

UIや運用面では、思考表示の既定変更も影響が大きい。Opus 4.7ではthinkingブロックはストリーム上に現れるが、thinking.displayを指定しない限りthinkingフィールドは空で、既定値は"omitted"である。Opus 4.6で要約済みの思考表示を前提に進捗表示を組んでいた製品では、display: "summarized"を明示するか、表示仕様を見直す必要がある。

effortの使い方も再調整対象である。Opus 4.7では新たにxhighが加わり、Anthropicはコーディングと自律実行型の用途でhighまたはxhighから始めることを推奨している。task budgetsもパブリックベータとして追加された。これはモデルに総トークン予算を意識させる仕組みで、max_tokensとは別の制御軸になる。

サイバー分野では、事実として確認できる範囲が明確に区切られている

System Cardは、Opus 4.7のサイバー能力をOpus 4.6とおおむね同程度とし、Mythos Previewほど進んでいないと説明する。発表文も、Mythos Previewの公開は限定的に続け、新しいサイバー安全策はより能力の低いモデルで先に試すと記している。Opus 4.7は、こうした安全策とともに一般公開されたモデルである。

ここから先は、事実と含意を分けて読む必要がある。Anthropicが明示しているのは、一般提供モデルの上限をOpus 4.7まで引き上げつつ、より高い能力を持つMythos Previewは限定公開に保ち、新しい安全策はより低い能力のモデルで先に試すという方針である。その運用結果が将来のより広い公開判断にどう結びつくかまでは、今回の一次ソースだけでは断定できない。

AD

価格は据え置きだが、トークン会計は再計算が必要になる

名目価格はOpus 4.6から変わらない。AnthropicはOpus 4.7の価格を、入力100万トークン当たり5ドル、出力100万トークン当たり25ドルとしている。表面的な価格条件は維持された。

一方、Migration guideが明示するコスト面の変更は複数ある。第1に、新トークナイザにより、同じテキストでも1.0倍から1.35倍程度のトークン増が起こりうる。第2に、高解像度画像対応により、フル解像度画像は従来比で最大約3倍の画像トークンを使い、1画像当たり約4784 tokensまで増える可能性がある。第3に、その前提でmax_tokensには追加の余裕を持たせるよう案内されている。

したがって、請求単価が据え置きでも、実際の利用量はそのままではない。特に画像入力が多いアプリや、コーディング支援、コンピューター操作、長時間の自律実行ワークフローでは、トークン数の再確認が必要になる。Anthropicは、フル解像度が不要なら画像を縮小することも勧めている。

今回のOpus 4.7は、一般提供で使える最上位モデルの更新であると同時に、移行後の運用設計を見直す契機でもある。SWE-bench ProやOfficeQA Proの伸びは明確だが、導入判断では、API変更、思考表示、effort設定、トークン増、高解像度画像の負荷まで含めて評価する必要がある。争点はモデル名の更新より、更新後のワークロードをどの前提で回すかに移っている。


Sources