AIへの投資熱が最高潮に達している一方、その費用管理は追いついていない。Uberは2026年のAIコーディング予算を4月の時点で使い果たしたとCTOが公表し、MicrosoftはClaude Codeのライセンスを開発者に付与した数ヶ月後に費用超過を理由に剥奪した。旅行予約サービスPricelineの担当者はCursorの契約更新費用が前年の4〜5倍に跳ね上がったとTechCrunchに証言している。

こうした事態が突発的に起きているわけではない。フィンテック大手Rampの内部データによれば、月間トークン支出の平均額は2025年1月以降13倍に増加し、ヘビーユーザー層では1四半期で50%超の上昇を記録している。

問題の根源はトークンという課金単位の不透明さにある。AIモデルが処理するテキストの断片を指す「トークン」は、入力と出力で単価が異なり、キャッシュ済みトークンはまた別の料率が適用され、さらに各プロバイダーによって計算方式も異なる。財務担当者がクラウドコストと同じ感覚で管理しようとしても、それは機能しない。

FinOps Foundation(クラウドコスト管理の標準化を手がける非営利組織)のエグゼクティブ・ディレクターJ.R. Stormentは、現状を2017〜2019年のクラウド草創期になぞらえる。「インファレンスコスト、モデルルーティング、キャッシュ、プロンプトエンジニアリングがそれぞれどう絡み合うかを整理する必要がある。当時の雲行きと似ている」と述べた。

AD

Tokenomics Foundationが狙うもの

Linux Foundationは2026年6月3日、Tokenomics Foundationの設立意向を正式に発表した。同財団の役割は、AIトークンエコノミー全体──生産・消費・収益化──にわたるオープン標準やベストプラクティスの策定だ。ベンチマーク開発も射程に入れており、FinOps Foundationと並ぶ組織として運営される。

運営構造は二層構成だ。Governing Boardが戦略的方向性を定め、予算を配分する。そのもとにTechnical Committeeが置かれ、具体的な仕様書やベンチマークの開発にあたる。加えて、クラウドプロバイダーがすでに採用しているオープン請求フォーマット「FOCUS(FinOps Open Cost and Usage Specification)」をAIトークン支出に対応するよう拡張する共同プロジェクトにも資金を投じる計画だ。

初期サポーターにはAccenture、Booking.com、Flexera、Google Cloud、IBM、JPMorganChase、KPMG、Microsoft、Oracle、Salesforce、SAP、ServiceNowが名を連ねる。ただし、Linux Foundation広報によれば、GoogleやMicrosoftが具体的にどの程度の財政支援を行うかはまだ評価・協議中だという。

財団が標榜するのは「バイヤーとサプライヤー双方を包含するビッグテント」だ。バイヤー側では、複数のモデルやクラウドにまたがるトークン経済をベンダー中立で比較・管理したい大企業を主なターゲットとする。サプライヤー側では、フロンティアモデルプロバイダー、新興NeoCloud事業者、そして「トークンファクトリー」と呼ばれるAIインフラ企業群(モデルホストや専用AIプラットフォームなど)へのアプローチを想定している。

過去の「クラウド標準化」との類比とその限界

FinOps FoundationがFOCUSを策定した際、AWSやAzureといったハイパースケーラーは当初策定プロセスに加わっていなかった。しかし、顧客企業がその標準を要求するようになると、全社が順次採用した。StormentはAIトークンでも「同じパターンを期待している」と述べ、「今日は部屋にいないが、顧客が標準を求めれば必ず参加する」と強調する。

ただし、この類比には重要な留保がある。クラウドのコスト構造は、CPUやストレージといった物理リソースに紐付いており、比較的直感的な単価設計が可能だった。トークン経済は異なる。同じGPTリクエストでも入力と出力では単価が異なり、システムプロンプトとユーザープロンプトが別扱いになるモデルもある。さらに「エージェント型コーディング(AIが自律的にタスクを分割・実行しながらコードを生成する手法)」のような自律的なAIワークフローは、単一の会話セッションで従来の何十倍ものトークンを消費するため、コスト予測が構造的に困難だ。

Salesforceのチーフアベイラビリティオフィサー、Nishant Gupta氏はこう指摘する。「トークン経済は、これまでこの規模で管理してきた何よりも根本的に抽象的で不透明だ。インプットとアウトプット、キャッシュ済みと未キャッシュ、コンピュートともストレージとも異なる料金体系。クラウドのために構築してきたオペレーショナルマッスルとは異なる筋肉が必要だ」。

AD

GitHub Copilotの方針転換が示す構造的な圧力

技術標準の議論が始まった背景には、GitHubが同週にCopilotの月額定額制をトークンベースの従量課金へ移行する方針を発表したという具体的な出来事がある。エージェント型のコーディングセッションが長時間化・高負荷化する中で、GitHubが膨張するインファレンスコストをフラットな料金に吸収し続けることが限界に達したためだ。

ユーザーコミュニティの反発は即座だった。一部のサブスクライバーは「バイト・アンド・スイッチ(客寄せ詐欺)」と批判し、試算した月次請求が一夜で10倍に跳ね上がったと報告した。Copilotに限らず、同様の構造変化はあらゆるAIサービスプロバイダーに迫っており、それが財団設立の背景にある社会的な力学でもある。

企業のエンジニアリングチームでも変化は顕在化している。あるスタートアップのCTOは「エンジニア一人が先月トークンに4万ドルを費やした。やめさせるべきか、それとも全員に見習わせるべきか、正直わからない」と語った。費用対効果を測る共通の尺度がない状況では、意思決定そのものが宙に浮く。

市場に形成されつつあるコスト管理エコシステム

財団設立に先立つ形で、民間でもトークンコスト可視化の動きが加速している。RampはAIプロバイダーからトークンレベルのデータを引き出し、財務チームが支出の発生源を追跡できるツールを4月に発表した。スタートアップや既存ベンダーも、コスト追跡、監査、制御機能を提供するツール群を競って市場投入している。

ただし、こうした個別ツールが機能するためには、標準化されたデータフォーマットと共通のメトリクス定義が前提条件となる。アドバイザリー企業のAlexander Embricosは変化をこう表現する。「6ヶ月前は『これは何ができるか?十分か?』という会話だった。今は『どんな可視性がある?どんな監査が可能か?トークン制御は?モデルはどれほど効率的か?』に変わった」。

Tokenomics Foundationが想定する指標には「cost per intelligence(知性あたりコスト)」「tokens per watt(ワットあたりトークン)」「token-factory efficiency(トークンファクトリー効率)」といった概念が含まれる。これらが業界共通語として定着すれば、AIの費用対効果を定量的に議論する基盤が生まれる。

AD

フロンティアモデルプロバイダーの不在という核心的問題

初期サポーターリストで目立つのは、存在する企業よりも不在の企業だ。AnthropicもOpenAIも名を連ねていない。企業のAI予算消費の直接的な原因となっているフロンティアモデルの価格設定権限を持つ両社の不参加は、標準化の実効性に構造的な疑問符を投じる。

UberのCTOが明かした「2026年のAI予算を4月に使い果たした」という事実の主因は、Claude Codeの急速なエンジニア採用によるトークン消費の爆発だとされている。Anthropicが設定する価格、提供するキャッシュポリシー、APIの設計仕様が標準化の射程に入らなければ、財団が策定する指標は形骸化しかねない。

Stormentが根拠とするクラウドの先例──ハイパースケーラーは後から標準を採用した──はある程度の説得力を持つ。しかし、クラウドはコモディティ化が進んでいたからこそ顧客の圧力が機能した。AIモデルには依然として強い差別化圧力があり、プロバイダーが自社の料金体系を外部標準に合わせるインセンティブは同等ではない可能性がある。両社にとってトークン単価そのものが競合他社との差別化の手段であり、外部標準によって価格透明性が高まることは直接の利益に反する構造がある。

Goldman Sachsの予測と2030年に向けた構図

Goldman Sachsの調査は、世界のトークン使用量が2026年から2030年にかけて24倍に増加し、月あたり120京(120 quadrillion)トークンに達すると予測する。業界アナリストは2027年までのAIインフラ投資総額が1兆ドルを超えると見込んでおり、インファレンス市場単体でも2025年の約1,060億ドルから2030年には2,550億ドルへ拡大するとされる。

このスケールの経済を前にしたとき、現在の状況は整合的でない。企業の財務チームは、数字の大きさを把握できる標準がなければ予算を組めず、投資判断を下せない。AIプロバイダー側も、標準なき市場では信頼を積み上げにくい。

Tokenomics Foundationが掲げる長期ゴールは、トークンを「クラウドと同等に管理可能なコストカテゴリー」に昇格させることだ。その実現には、2026年後半から本格化するであろう技術仕様の策定作業と、不参加の主要プロバイダーとの関係構築の両輪が必要になる。6月8〜10日のFinOps Xで公開される技術ロードマップが、その出発点となる。