Opus 4.7は単価据え置きでも安くない：新トークナイザーがClaude Codeの実効コストを押し上げる

Y Kobayashi2026年4月20日

約 12 分

この記事のポイント

AnthropicのClaude Opus 4.7は単価据え置き。
新トークナイザーで消費トークンが増え、実質コスト増。
英語・コード中心のワークロードで影響大。

Opus 4.7は単価据え置きでも安くない：新トークナイザーがClaude Codeの実効コストを押し上げる

Anthropicは2026年4月にClaude Opus 4.7を一般提供し、料金表ではOpus 4.6と同じ入力100万トークン当たり5ドル、出力100万トークン当たり25ドル、5分キャッシュ書き込み6.25ドル、キャッシュヒット0.50ドルを維持した。表面上は価格改定はない。しかし、同社が移行ガイドで明記しているように、Opus 4.7は新しいトークナイザーを導入しており、同じ固定テキストでもOpus 4.6よりおおむね1.0倍から1.35倍、条件によってはそれ以上のトークンを消費する可能性がある。ここが、料金表を見ただけでは読み取りにくい変化だ。

The Decoderが4月19日に取り上げたのは、まさにそのズレである。表示単価は同じでも、1リクエスト当たりのトークン消費が増えれば、同じプロンプトや同じセッションを回したときの請求額、あるいはレート制限の消費速度は変わる。とくにClaude Codeのように、長い対話履歴とキャッシュ済みプレフィックスを何度も読み直すワークロードでは、その差が開発体験と運用費の両方に効いてくる。

重要なのは、これを単純な「値上げ」と断定しないことだ。Anthropicは単価を変えていないし、Opus 4.7側ではより厳密な指示追従や高解像度画像対応、Adaptive thinkingまわりの仕様整理など、いくつかの改善も入れている。論点は、価格表が据え置きであることと、実効コストが増えうることが矛盾しない、という点にある。開発チームが見るべきなのは、料金ページの数字そのものより、同じ入力を投げたときのトークン数とキャッシュ構造がどう変わるかだ。

料金は同じでも、消費トークンは増える

AnthropicのPricingページでは、Claude Opus 4.7とClaude Opus 4.6は同じ価格帯に並んでいる。入力はどちらも5ドル/MTok、出力は25ドル/MTok、5分キャッシュ書き込みは6.25ドル/MTok、キャッシュヒットは0.50ドル/MTokだ。一見すると、4.6から4.7への移行は純粋な性能向上のアップデートに見える。

ただし同じページには、Opus 4.7は旧モデルと異なるトークナイザーを使い、同じ固定テキストでも最大35%多くのトークンを使う可能性があると書かれている。移行ガイドでも同趣旨の注意書きがあり、/v1/messages/count_tokens の結果はOpus 4.6とOpus 4.7で異なるため、max_tokens やコンパクションの閾値を見直すよう勧めている。つまり、単価は固定でも、分母となるトークン数が増えるので、同じ業務フローの総コストがそのまま維持されるとは限らない。

この変化を具体的な数字に落とし込んだのが、Claude Code CampのAbhishek Ray氏による実測だ。氏はAnthropic公式の POST /v1/messages/count_tokens を使い、同じ内容を claude-opus-4-6 と claude-opus-4-7 に流してトークン差分を比較した。Claude Codeで実際に投げやすい7種類の内容を束ねた加重平均では1.325倍、5KBのCLAUDE.mdでは1.445倍、英語の技術文書では1.47倍だった。一方で日本語と中国語のサンプルはどちらも約1.01倍で、CJK系テキストはほぼ横ばいだったという。The Decoderはこの測定を踏まえ、英語とコード中心のワークロードほど4.7のコスト増を受けやすいと整理している。

ここで見落としやすいのは、請求だけでなくレート制限の消費にも同じ圧力がかかる点だ。Claude Maxや社内の利用枠管理では、ユーザーから見えるのはドル建て請求だけではない。一定時間内に何ターン回せるか、どれだけ大きい履歴を保持したまま作業を続けられるかも重要になる。同じセッションでトークン数が増えるなら、料金テーブルが同じでも運用上の「余裕」は狭くなる。

どのワークロードで負担が重くなるか

負担が大きくなるのは、単発の短文QAよりも、長い履歴を抱えたエージェント型の対話だ。Claude Code Campの記事は、80ターンのClaude Codeセッションを想定して試算している。前提は、2KトークンのCLAUDE.md、4Kトークンのツール定義、会話が進むごとに蓄積する履歴、毎ターン500トークン前後の新規入力、1500トークン前後の出力、そして5分TTL内で95%程度のキャッシュヒットだ。この構成では、Opus 4.6の総費用は約6.65ドルなのに対し、Opus 4.7では約7.86ドルから8.76ドルに増え、セッション単位で20〜30%程度の上振れになる。

この試算のポイントは、プレフィックスの大半がキャッシュヒットであっても、そこで読むトークン総量そのものが増えていることだ。4.7ではCLAUDE.mdが1.445倍、ツール定義のようなJSON Schemaが1.12倍、英語とコード主体の履歴が1.325倍という前提で、平均キャッシュ済みプレフィックスは約86Kから約115Kトークンに膨らむ。キャッシュヒット単価は安いが、読む量が増えればトータルは積み上がる。さらに、モデル切り替え直後のコールドスタート、CLAUDE.md更新後のキャッシュ再生成、ツール定義変更、履歴コンパクションの再書き込みのように、キャッシュ書き込みが発生する局面では差分がより目立つ。

逆に、日本語中心の短い社内チャットやCJKドキュメント要約では、この影響は相対的に小さい可能性がある。Ray氏の実測では、日本語と中国語は約1.01倍にとどまった。ここから言えるのは、Opus 4.7のコスト影響を一律には語れないということだ。英語の仕様書、コード差分、シェル出力、スタックトレース、長いCLAUDE.mdを常時抱える開発チームと、日本語中心の問い合わせ処理では、増分の出方がかなり違うようだ。

その意味で、開発組織が先にやるべきことは、移行前に自分たちの代表的なプロンプト束を count_tokens で比較することだ。Anthropic自身が移行ガイドで、クライアント側のトークン見積もり、max_tokens、コンパクション条件の再検証を勧めているのは、4.7の負担がアプリの中身に強く依存するからだ。料金ページだけ見て「同価格だからコスト影響なし」と判断すると、実運用に入ったあとでセッション長やレート制限に想定外のズレが出る。

Anthropicは何を改善の対価として差し出しているのか

では、増えたトークン消費の代わりに何が良くなったのか。Anthropicの移行ガイドは、Opus 4.7がOpus 4.6より「より文字通りに」指示に従う傾向を持ち、とくに低いeffort設定で暗黙の一般化をしにくくなったと説明している。サンプリング系パラメータの扱いも厳格化され、temperature、top_p、top_k を非デフォルトで使うと400エラーになる。thinking も旧来の enabled + budget_tokens からAdaptive thinkingへ移り、表示設定を明示しないとthinking内容は省略される。4.7は単なる高性能版ではなく、挙動をより明示的な契約に寄せたモデルだと見るべきだろう。

ただし、トークン増加と指示追従向上の因果をそのまま結びつけるのは早計だ。Ray氏はIFEvalの20サンプルを使った比較で、Opus 4.7はstrict prompt-levelで17/20から18/20へ、strict instruction-levelで25/29から26/29へ改善したと報告している。差分はそれぞれ+5ポイント、+4ポイントで、方向としては改善だが、サンプル数は小さく、トークナイザー、学習済み重み、ポストトレーニングのどれが効いたかは切り分けられていない。となれば、4.7の利得は「わずかに良い指示追従」であり、実効コスト増との交換関係をどう評価するかは用途次第だと言える。

この「用途次第」が重要だ。正確なフォーマット制約、厳密な構造化出力、長いエージェント作業での破綻率低下が事業KPIに直結するなら、20〜30%のセッション増分は許容範囲かもしれない。逆に、既存の4.6運用がすでに十分安定しており、主眼が大量処理やレート制限内での回転数にあるなら、4.7移行は性能向上よりも先に予算と制限再設計の話になる。Anthropicが同じ料金表を維持したまま4.7を投入したことで、この判断は「モデル単価の比較」ではなく、「自社ワークロードでの実効単価の比較」に変わった。

移行判断で先に見直すべき項目

実務上の優先順位は明確だ。第一に、代表的なプロンプト、CLAUDE.md、ツール定義、履歴断片、出力フォーマット指示を count_tokens で4.6と4.7に通し、どの部分がどれだけ膨らむかを把握すること。第二に、max_tokens と履歴コンパクション閾値を再設定し、コンテキスト不足や途中切れのリスクを潰すこと。第三に、レート制限とキャッシュ書き込みのコールドパスを観測し、モデル切り替え直後、キャッシュ無効化後、設定更新後のコストジャンプを運用に織り込むこと。第四に、4.7でエラーになる旧パラメータ群やthinking表示の差を検査し、単なるモデル名差し替えで終わらせないことだ。

特にClaude Code系の運用では、英語の設計文書、差分、ログ、シェル出力がセッションの大半を占めることが多い。その場合、Anthropicが示す「最大35%増」は上限に近い警告ではなく、かなり現実的な想定値になる。Ray氏の測定でも、英語とコードの加重平均は1.345倍で、CLAUDE.mdや技術文書はさらに上振れていた。Tokenomicsのコミュニティ比較では483件の投稿を集計して37.4%増という値も出ているが、これは補助的な参考値にとどめるべきだろう。まず信頼すべきなのは、Anthropic公式の移行ガイドと、自分たちのワークロードで取った実測だ。

結局のところ、Opus 4.7を巡る論点は「同価格なのに高いのか」という広告文句の批判ではない。より正確には、「単価は同じだが、英語・コード中心の実務では同じ仕事をさせるためのトークン量が増えるので、セッション費用と利用枠消費は上がりうる」という運用設計の問題である。Anthropicは4.7を、より厳密で、より明示的で、より長期のエージェント作業に向いたモデルとして出してきた。その改善を取りにいくなら、移行判断の入口は料金ページではなく、自社プロンプトのトークン計測とキャッシュ構造の棚卸しになる。

実務チームにとっての結論は単純だ。Opus 4.7は「単価据え置きだから気軽に上げてよい」モデルではない。一方で「実質値上げだから避けるべきだ」と切って捨てるのも雑すぎる。必要なのは、英語・コード比率、キャッシュ依存度、厳密な指示追従の価値、レート制限の余裕という4つの軸で、自社ワークロードの損得を測り直すことだ。その比較を済ませたチームだけが、4.7の改善をコスト上昇と切り分けて判断できるだろう。

Sources