AIサブスクリプションをめぐる問題の本質は、月額$20や$200という表示価格そのものではなく、その料金でどれだけの推論リソースを賄えるかという点に移りつつある。SemiAnalysisは2026年6月10日、OpenAIとAnthropicの各サブスクリプションを実際に購入し、長時間のコーディングタスクを走らせて週間上限を使い切る検証を実施したことを明らかにした。「月額$200のプランはAPI換算で月約$2,000分のトークンに相当する」という通説に対し、この検証はさらに大きなギャップを示す結果となった。

SemiAnalysisの試算によれば、月額$200のClaude Max 20xをフル活用した場合、実質的に月約$8,000分のトークン利用に相当する。同じく月額$200のChatGPT Pro 20xは、約$14,000分に達するという。ユーザーから見ればどちらも固定料金の上位プランだが、提供側から見ると、APIなら従量課金となる大量の推論をヘビーユーザーが消費する構造になっている。

この検証が突いたのは、AI企業が固定料金で提供してきた「使いやすさ」と、モデル実行にかかる原価とのずれだ。チャットAIが主流だった時期は、上限付きサブスクリプションはユーザー獲得に有効だった。しかし、長時間のコーディングや調査をエージェントが自律的に進めるようになると、1人のユーザーが消費するトークン量は一気に膨らむ。企業ユーザーにとっても、AIの利活用は「とにかくたくさん使う」から「どの作業にどのモデルを充てるか」へと変わり始めている。

AD

$200プランは、利用率が少し上がるだけで採算を圧迫する

SemiAnalysisの試算では、AnthropicはClaude ProとClaude Max 5xの利用率が20%前後で損益分岐点に達し、OpenAIはChatGPT PlusとChatGPT Pro 5xで利用率が11.4%を超えると赤字に転じる。上位プランになるとさらに厳しく、Anthropicは利用率10%で粗利がゼロになり、OpenAIは5.7%を超えた時点で赤字になるとされる。

問題の核心は、全ユーザーが上限まで使うかどうかではない。サブスクリプションというビジネスモデルは、ライトユーザーとヘビーユーザーが混在することを前提に成り立っている。だが、AIエージェントやコーディング支援を業務に深く組み込むユーザーが増えるほど、重度利用者の比率は上昇し、平均利用量は採算ラインへと近づいていく。上位プランが「熱心なユーザー向け」であればあるほど、このリスクは大きくなる。

SemiAnalysisはあわせて、既存モデルの提供コストが下がれば、Opus 4.8クラスのモデルを月額$20で提供しても採算が見えてくると指摘している。これは固定料金モデルが終わるという話ではない。むしろ、軽量化したモデルや一世代前の高性能モデルはサブスクリプションに収まりやすく、最新のフロンティアモデルほどAPIや高額プランへ移行しやすいという、サービスの分化が進むことを示している。

公式API価格を見ると、モデル選択の重みがはっきりする

OpenAIのAPI価格表では、GPT-5.5が100万入力トークンあたり$5.00、100万出力トークンあたり$30.00に設定されている。一方、GPT-5.4 miniは入力$0.75、出力$4.50だ。OpenAIはAPI利用がChatGPTのサブスクリプションとは別課金であることも明記しており、同じOpenAIのモデルでも、対話サブスクと従量課金APIは別の経済原理で動いている。

Anthropicも同様だ。Claudeの料金ページでは、Proが月額$20、Maxが月額$100からのプランとして示されており、MaxではProの5倍または20倍の利用量を選べる。API価格は、Claude Opus 4.8・4.7・4.6が100万入力トークンあたり$5・出力$25、Claude Sonnet 4.6が入力$3・出力$15、Claude Haiku 4.5が入力$1・出力$5となっている。

この価格差は、AIサービスの設計に直接影響する。長文コンテキストの処理、コード生成、検証、再試行を繰り返すようなタスクでは、出力トークンの単価が総コストを大きく左右する。すべてを最上位モデルで処理すれば品質は上がりやすいが、費用もあっという間に膨らむ。一方、分類・要約・候補生成・定型的な検索・初期案の作成といった工程を安価なモデルへ振り分ければ、同じ予算で対応できるタスク量は大きく変わってくる。

AD

エージェント化が、固定料金の弱点を際立たせた

チャットボット的な使い方では、ユーザーが文章を入力し、モデルが回答する。この範囲であれば、月額サブスクリプションは比較的シンプルに成立する。しかしエージェント型AIでは、1つの依頼が計画・検索・コード生成・実行・失敗検出・修正・再検証へと分解される。ユーザーから見れば「この機能を直して」という1タスクでも、内部では大量のモデル呼び出しが発生する。

SemiAnalysisが長時間のコーディングタスクで週間上限を使い切ったという事実は、この変化をよく示している。固定料金の価値は、ユーザーがどれだけ継続的にモデルを使い倒せるかによって高まる。しかし提供側の負担も同じ方向に増えるため、エージェント利用が広がるほど、サブスクリプションにおける「上限」と「使い放題感」の設計は難しくなる一方だ。

企業側も同じ壁にぶつかる。AIを多く使うほど成果が上がるなら、予算の正当化は比較的しやすい。しかし、トークン消費が顧客向け機能の強化・開発スピード・品質改善に結びつかなければ、コストだけが先行して膨らむ。AI導入の評価軸は、トークン単価や月額料金から、1件のタスクを完了するまでの総コストへとシフトしている。

安価なモデルへの振り分けが、コスト競争の中心になる

decision layer toward frontier models, cheaper open models, and in-house task models.webp

Wall Street Journalは、企業やスタートアップが高騰するAIコストを抑えるため、AlibabaやDeepSeekなど中国系を含む安価なモデル、オープンソースモデル、自社モデルを組み合わせる動きが広がっていると報じている。エージェントが作業内容に応じてモデルを切り替え、複雑なタスクだけOpenAIやAnthropicの高性能モデルへ回す方式により、一部のAI支援業務ではコストを最大95%削減できるという。

この動きに価格面の裏付けを与えているのが、安価なモデルのAPI単価だ。DeepSeekの公式価格表によると、DeepSeek-V4-Flashは100万トークンあたりキャッシュミス入力$0.14・出力$0.28、DeepSeek-V4-Proでも入力$0.435・出力$0.87となっている。どちらも1Mコンテキストに対応しており、OpenAIやAnthropicの上位モデルと比べると、少なくとも公開API単価では大きな差がある。

ただし、安価なモデルが高性能モデルを全面的に置き換えられるわけではない。難しい推論、長い文脈、コードの繊細な修正、セキュリティ判断といった場面では、安いモデルに任せた結果として生じる手戻りが、コスト削減分を上回ることがある。モデルルーティングの本質は、最高性能のモデルを捨てることではなく、十分な品質を満たす中で最もコストの低いモデルをタスクごとに選ぶことにある。

AD

次の焦点は、プランの透明性とモデル品質の線引きだ

OpenAIのChatGPT Proは公式ページで、5倍または20倍の利用量、最大規模のCodexタスク、最大規模のDeep Researchとエージェントモードを訴求している。AnthropicのClaude MaxもProの5倍または20倍の利用量を選べる構成だ。こうした表現は、AIサブスクリプションが完全な使い放題サービスではなく、コストの高い推論リソースをどこまで月額料金に含めるかという設計であることを如実に示している。

今後の焦点は、どのモデルや機能がサブスクリプションの範囲内に残り、どの処理がAPI・上位プラン・軽量モデル・自動ルーティングへ振り分けられるかにある。ユーザーから見れば同じAIアシスタントであっても、裏側ではタスクごとにモデルが切り替わる設計が増えるかもしれない。その場合、提供側には利用制限とモデル割り当てに関する透明性がより強く求められるだろう。

SemiAnalysisの検証が示したのは、AIの価格競争が月額料金の値下げだけでは進まないということだ。固定料金の上位プランはユーザーに支出の予測可能性をもたらす一方、ヘビーユーザーの利用率が上がるほど提供側の採算を圧迫する。企業にとっての最適解も、最強モデルを全工程に投入することではなく、タスクの重要度と失敗コストに応じてモデルを使い分けることになる。AIサービスの競争軸は、モデル性能そのものから、性能とコストをいかに組み合わせるかへと移っている。