AI開発競争の焦点は、最も賢いモデルを作れるかだけでなく、そのモデルをユーザーが払える価格で動かせるかに移りつつある。AMI Labs創業者のYann LeCun氏はCNBCのインタビューで、OpenAIやAnthropicのようなAIラボはコストを下げるか価格を上げなければ、バブルが大きく弾ける局面に直面すると警告した。
LeCun氏が問題にしているのは、最先端モデルを使ったサービスの推論コストが、利用者の支払い意欲に追いついていないという点だ。AIサービスの価格は上がる一方、運用コストの低下は十分に速くなく、投資家の資金が多くの利用を実質的に支えていると同氏は述べた。
この警告には、LeCun氏自身の立場も影を落とす。同氏はMetaの元AI研究責任者であり、現在は大規模言語モデルとは別の軸として「世界モデル」を掲げるAMI Labsを率いる。LLM中心の競争に疑問を投げかけるほど、自社の研究路線に注目が集まりやすい。それでも、公式価格や外部ベンチマークの測定軸を見ると、発言の中核にある単価問題は無視しにくい。
LeCun氏の警告は、AIの性能競争を利用単価の問題へ引き戻す
CNBCによると、LeCun氏はOpenAIやAnthropicのようなラボについて、価格を上げるかコストを削る必要があると語った。背景には、企業のAI支出が想定より大きくなっている足元の変化がある。OpenAIのSam Altman CEOも社内ライブ配信で、企業顧客がAI支出を問題にし始めていると述べ、AIコストを大きな課題と呼んだとCNBCは伝えている。
この話は、値上げ観測だけで終わらない。高性能モデルは、対話、コード生成、長文分析、検索、ツール実行をまとめて処理するようになり、ユーザーからは一つの依頼に見える作業でも、裏側では多数のモデル呼び出しと長いコンテキストが発生する。エージェント型AIでは、計画、実行、失敗時の修正、検証までをモデルが繰り返すため、会話型チャットの延長として料金を設計しにくくなる。
LeCun氏は同じインタビューで、xAIについても厳しい見方を示した。創業チームの離脱や人材採用の難しさを理由に、同社がOpenAIやAnthropicと最先端領域で競えるとは考えていないという。xAIがデータセンター容量を他社に貸している点も、巨額インフラの費用回収を迫られている兆候として挙げた。AIラボの優劣はモデル性能だけでなく、人材、インフラ、稼働率、資金調達をまとめた運用能力で決まる、という見立てだ。
公式価格表にも、最上位モデルの重さが表れている
OpenAIのAPI価格表では、GPT-5.5は100万入力トークンあたり5.00ドル、100万出力トークンあたり30.00ドルに設定されている。GPT-5.4は入力2.50ドル、出力15.00ドル、GPT-5.4 miniは入力0.75ドル、出力4.50ドルだ。同じOpenAIのモデル群でも、最上位と小型モデルでは出力単価が大きく開く。
AnthropicのClaude APIでも、モデル選択はそのまま費用差になる。Claude Fable 5とClaude Mythos 5は100万入力トークンあたり10ドル、出力50ドル。Opus 4.8、4.7、4.6は入力5ドル、出力25ドル。Sonnet 4.6は入力3ドル、出力15ドル。Haiku 4.5は入力1ドル、出力5ドルだ。AnthropicはOpus 4.7以降の新しいトークナイザーについて、同じ固定テキストでも最大35%多くトークンを使う場合があるとも説明している。
価格ページに並ぶのは単価だけではない。OpenAIはBatch APIで入力と出力を50%下げられる仕組みや、遅く不安定な場合がある代わりに安く処理するFlex processing、企業向けのScale TierやReserved Capacityを用意している。Anthropicもキャッシュ、リージョン別の割増、US限定推論の1.1倍課金、Opus向けの高速モードなどを細かく分けている。最先端モデルをただ広く使わせるのではなく、処理速度、地域、優先度、再利用可能なコンテキストごとに料金を調整する段階に入っている。
この細分化は、LeCun氏の警告を裏づける決算情報ではない。OpenAIやAnthropicの実際の原価や損益は、公開価格表だけでは分からない。ただ、開発者と企業が直面する請求の形は読み取れる。AIを本格的に業務へ組み込むほど、どのモデルを、どの優先度で、どれだけキャッシュを効かせて使うかが、導入コストの中心になる。
エージェント時代は、トークン単価よりタスク単価が問われる
100万トークンあたりの単価だけでは実際の費用を測れない。複雑なタスクでは、モデルが何回考え、何回ツールを呼び、どれだけ文脈を読み直し、どれだけ修正を重ねるかで総額が変わる。安いモデルでも長く迷えば高くなり、高いモデルでも少ない手順で終えれば総額を抑えられる。
Artificial Analysisは、モデルの知能指数や出力速度に加え、「Cost per Task」を測定軸として示している。この指標は、入力、キャッシュ、推論、出力の価格を評価タスクごとに計算し、重みづけして平均するものだ。同社のIntelligence Index v4.1には、GDPval-AA v2やTerminal-Bench v2.1のようなエージェント性の強い評価も含まれる。モデル比較は「賢いか速いか」だけでなく、「一つの仕事を終えるのにいくらかかるか」へ広がっている。
企業が知りたいのも同じ数字だ。コード修正、社内調査、営業資料の作成、顧客対応の自動化では、1回の応答価格より、最終成果物に到達するまでの総費用が問題になる。AIが補助から自律的な作業単位へ近づくほど、請求書は会話回数ではなく作業量に連動する。
そのため、現実的な対策は一律の値下げだけではない。高難度の推論や重要なコード修正には上位モデルを使い、分類、要約、下書き、検索結果の整形、定型的な検証には安いモデルを使う。よく使うプロンプトや長い文脈はキャッシュし、急がない処理はバッチや低優先度に回す。AIプロダクトの設計は、画面上の機能だけでなく、裏側のモデルルーティングと容量管理を含むものになる。
世界モデルは代替案だが、まだ推論コスト問題の答えではない
LeCun氏がLLM中心の競争に批判的なのは以前からだ。CNBCのインタビューでも、汎用的で信頼できるエージェントシステムは世界モデルを土台にしなければ実現しにくいと述べた。世界モデルは、テキストの次を予測するだけでなく、物体、因果、行動、環境の変化を内部表現として扱い、将来の状態を予測する方向の研究だ。
この主張を支える研究も進んでいる。2026年3月に公開されたLeWorldModelの論文は、JEPA型の世界モデルを生のピクセルからエンドツーエンドで安定して訓練する方法を示した。約1500万パラメータのモデルで、二つの損失項だけを使い、2Dと3Dの制御タスクで競争力を保ちながら、基盤モデル型の世界モデルより最大48倍速く計画できたと報告している。JEPAは、目に見えるすべての細部を再構成するのではなく、将来状態を予測するために必要な低次元の潜在表現を学ぶ点に特徴がある。
ただし、この研究結果をそのままOpenAIやAnthropicの商用エージェントの代替と読むのは早い。論文の成果は制御タスクと世界モデル研究の文脈にある。企業が現在使っているAIエージェントは、自然言語、コード、外部ツール、社内データ、セキュリティ判断をまたいで動く。世界モデルが推論コストや信頼性を改善できるとしても、LLMが担う広い言語作業をすぐ置き換える段階にはない。
AMI Labsの立場も冷静に見る必要がある。WIREDは2026年3月、LeCun氏が共同創業したAMIが世界モデル開発のために10億ドル超を調達し、評価額は35億ドルに達したと報じた。投資家がLLM以外のアーキテクチャにも大きく賭け始めたことは示すが、巨額調達そのものは技術の実用性を証明しない。LeCun氏のバブル警告は、LLM競争への批判であると同時に、自社が進める別路線の必要性を強める発言でもある。
次の焦点は値上げより、安く動かす設計にある
LeCun氏の警告が的中するかどうかは、AI企業がどれだけ早く推論単価を下げられるかにかかっている。公開価格表から見える対策は、キャッシュ、バッチ処理、低優先度処理、予約容量、モデルの使い分けに寄っている。だが、利用側の需要も同時に重くなっている。エージェントが長い作業を自律的にこなすほど、1ユーザーあたりの計算量は増える。
OpenAIやAnthropicが取り得る選択肢は複数ある。上位モデルのAPI価格を上げる、利用量や優先度に応じて処理を分ける、安価なモデルを既定にする、重い機能を企業向け契約や予約容量へ寄せる、キャッシュやバッチ処理を前提にした設計を強める。どれも利用者体験に影響するため、急な変更は反発を招く。見かけの料金より、どのタスクにどのモデルが使われるかの透明性が問われる理由はそこにある。
企業ユーザー側も、AIを導入するだけでは足りない。タスクごとの成果、失敗時の手戻り、検証コスト、セキュリティ確認、モデル切り替えによる品質差を合わせて見る必要がある。安いモデルに振り分けた結果、難しい判断で誤れば、削った推論費以上の損失が出る。逆に、すべてを最上位モデルへ送れば、導入効果が出る前に予算が尽きる。
LeCun氏の発言が突いたのは、株価や評価額の話ではなく、その下にある利用単価の問題だ。最先端モデルが十分に便利であっても、使うほど赤字が膨らむなら事業は続かない。次に見るべきなのは、どの企業が最も高性能なモデルを出すかだけではない。誰が高性能モデルを必要な場面だけに使い、普段の作業を安く、安定して回す仕組みを作れるかである。