xAI「Grok 4 Fast」発表。性能は下げずにコストは衝撃の“98%減”を実現

Y Kobayashi 2025年9月22日

約 11 分

xAIは、主力モデル「Grok 4」に匹敵する性能を維持しつつ、計算コストを劇的に削減した新モデル「Grok 4 Fast」を発表した。計算リソースを平均40%削減し、タスクあたりの価格を最大98%引き下げるという驚異的な効率化を実現しているという。

AI業界を揺るがす「コスト効率」という名の挑戦状

2025年9月19日（現地時間）、Elon Musk氏率いるxAIは、AI開発コミュニティに衝撃を与える新たな大規模言語モデル（LLM）「Grok 4 Fast」をリリースした。このモデルの核心は、「知能の民主化」とも言える、圧倒的なコストパフォーマンスの実現にある。

xAIの公式発表によれば、Grok 4 Fastは、フラッグシップモデルであるGrok 4と同等のタスク処理能力を持ちながら、必要とする計算リソース（同社が「thinking tokens」と呼ぶ中間的な思考プロセスに使われるトークン）を平均で40%削減することに成功した。この効率化は価格に直接反映され、同等の性能を達成するためのコストは、Grok 4と比較して最大98%も削減されるという。

これは、AIの利用コストが参入障壁となっていた多くの企業や開発者にとって、まさに福音と言えるだろう。これまで一部の巨大テック企業や潤沢な資金を持つスタートアップの独壇場であった高性能AIの領域が、より広く開かれる可能性を示唆している。

驚異的なコスト効率の正体：「知能密度」という新指標

Grok 4 Fastが達成したコスト削減の鍵は、xAIが「知能密度（Intelligence Density）」と呼ぶ概念にある。これは、最小限の計算コストで最大限の性能を引き出すという思想であり、大規模な強化学習（RL）によってモデルが最適化された結果だ。

「Thinking Tokens」40%削減の技術的意味

従来の多くのLLMは、複雑な推論タスクを解決するために、内部で多数の中間ステップ（思考の連鎖、Chain-of-Thought）を生成する。このプロセスは性能向上に寄与する一方、計算リソースと時間を大量に消費する原因となっていた。

Grok 4 Fastは、この中間ステップ、すなわち「thinking tokens」を大幅に削減するよう訓練されている。より少ない思考ステップで、あるいはより効率的な思考経路で、同等、あるいはそれ以上の結論に到達できる。これは、自動車のエンジンがより少ない燃料で同じ距離を走れるようになる燃費向上に似ている。

xAIが公開したグラフは、この「知能密度」を視覚的に示している。例えば、数学コンテストのベンチマーク「AIME 2025」において、Grok 4 FastはGrok 4やGrok 3 Miniよりも遥かに少ないthinking tokensで同等以上のスコアを達成しており、その効率性の高さを裏付けている。

市場における価格競争力の再定義

この効率化は、API価格に破壊的なインパクトをもたらす。Grok 4のAPI価格が入力3ドル/100万トークン、出力15ドル/100万トークンであるのに対し、Grok 4 Fastは入力0.20ドル、出力0.50ドル（128kトークン未満の場合）と、実に15倍以上も安価に設定されている。

LLMの価格比較サイト「llm-prices.com」を参照すると、Grok 4 FastはOpenAIの「GPT-5 mini」やGoogleの「Gemini 2.5 Flash」よりも低価格であり、トップクラスの性能を持つモデルとしては市場で最も安価な選択肢の一つとなる。

独立系調査機関であるArtificial Analysisのインテリジェンス・インデックスにおいても、Grok 4 Fastは価格対性能比で最先端（SOTA: State-of-the-Art）に位置付けられており、その卓越したコスト効率が客観的に証明されている。

性能はフラッグシップ級。ベンチマークが示す実力

Grok 4 Fastは、コスト削減のために性能を犠牲にした廉価版モデルではない。主要なベンチマークにおいて、Grok 4や競合の最先端モデルと互角以上に渡り合う実力を示している。

ベンチマーク (pass@1)	Grok 4 Fast	Grok 4	GPT-5 (High)
GPQA Diamond	85.7 %	87.5 %	85.7 %
AIME 2025 (no tools)	92.0 %	91.7 %	94.6 %
HMMT 2025 (no tools)	93.3 %	90.0 %	93.3 %
LiveCodeBench (Jan-May)	80.0 %	79.0 %	86.8 %

上記の表が示すように、大学院レベルの質疑応答能力を測る「GPQA Diamond」や、高度な数学的能力を要する「AIME 2025」「HMMT 2025」において、Grok 4 FastはGrok 4やGPT-5に肉薄、あるいは上回るスコアを記録している。特に、コーディング能力を評価する「LiveCodeBench」ではGrok 4を上回っており、特定のタスクにおいては最適化がより進んでいる可能性がうかがえる。

LMArenaで証明された実世界の対話能力

合成ベンチマークだけでなく、人間による評価をベースとした実世界の対話能力においても、Grok 4 Fastは高い評価を得ている。LLMの対戦プラットフォーム「LMArena」では、2つのカテゴリでその実力が示された。

Search Arena: Web検索を伴うタスクに特化したこのアリーナでは、grok-4-fast-search（コードネーム: menlo）がEloレーティング1163で1位を獲得。従来トップだったOpenAIのo3-searchを17ポイント上回り、Web検索と情報統合能力において現行最高峰であることを証明した。
Text Arena: 一般的なテキスト生成タスクを評価するこのアリーナでは、grok-4-fast（コードネーム: tahoe）が8位にランクイン。これはGrok 4と同等の順位であり、より巨大なモデルがひしめく中で、そのサイズやコストからは考えられないほどの高い評価を得ている。

注目すべきは、同程度のサイズやコストのモデルが18位以下に甘んじている点だ。これは、Grok 4 Fastの「知能密度」が、実際のユーザー体験においても明確な優位性として現れていることを示している。

技術的革新：単一モデルで実現する「思考」の切り替え

Grok 4 Fastのもう一つの重要な特徴は、そのアーキテクチャにある。従来、高速な応答が求められる単純なタスク用のモデルと、深い思考を必要とする複雑なタスク用のモデルは、別々に開発・運用されるのが一般的だった。

Grok 4 Fastは、この2つのモードを単一のモデルウェイトで実現する「統合アーキテクチャ」を採用している。

以前は、別々の推論モードには個別のモデルが必要でした。Grok 4 Fastは、reasoning（長い思考の連鎖）とnon-reasoning（迅速な応答）が同じモデルウェイトによって処理され、システムプロンプトを介して制御される統合アーキテクチャを導入します。

この統合により、システムはユーザーのプロンプトに応じて、瞬時に応答を返す「non-reasoning」モードと、じっくり時間をかけて思考する「reasoning」モードをシームレスに切り替えることができる。これにより、エンドツーエンドの遅延（レイテンシ）とトークンコストの両方が削減され、リアルタイム性が要求されるアプリケーションへの応用が容易になる。

開発者はxAIのAPIを通じて、この挙動をgrok-4-fast-reasoningとgrok-4-fast-non-reasoningという2つのモデルを使い分けることで、ユースケースに応じて速度と思考の深さをチューニングできる。

WebとXを自在に操る、優れた「エージェント」能力

Grok 4 Fastは、単なるテキスト生成マシンではない。Webブラウジングやコード実行といった外部ツールを自律的に使用する「エージェント」としての能力が、学習の初期段階からエンドツーエンドで組み込まれている。

Webブラウジング能力を評価する「BrowseComp」や、中国語の検索タスクを含む「X Bench Deepsearch」では、Grok 4を上回るスコアを記録。これは、最新情報へのアクセスと統合能力がさらに洗練されていることを示している。

xAIの公式ブログでは、まだリリースされていないゲーム「Path of Exile 2」の最大経験値について尋ねるデモが公開されている。 Grok 4 Fastは、複数の情報源（Wiki、ファンサイト、データベースサイト）を自律的に検索・閲覧し、各情報を比較検討した上で、最終的に「4,250,334,444」という正確な数値を導き出している。このプロセスは、単なる検索結果の要約ではなく、能動的な調査・分析であり、高度なエージェント能力の片鱗を見せている。

特に、X（旧Twitter）上の情報をリアルタイムで検索し、画像や動画を含むメディアを解釈して応答に反映させる能力は、xAIならではの強みと言えるだろう。

開発者とユーザーに開かれる新たな選択肢

Grok 4 Fastは、すでに複数のチャネルを通じて利用可能となっている。

Web・アプリ: 公式サイト grok.com およびiOS/Androidアプリで、無料ユーザーを含む全てのユーザーが利用できる。
xAI API: 開発者はAPI経由で利用可能。価格は以下の通り。

トークンタイプ	128kトークン未満	128kトークン以上
入力トークン	$0.20 / 100万	$0.40 / 100万
出力トークン	$0.50 / 100万	$1.00 / 100万
キャッシュ入力トークン	$0.05 / 100万	$0.05 / 100万

サードパーティ: 期間限定で、OpenRouterおよびVercel AI Gatewayを通じて無料で試用できる。

さらに、Grok 4 Fastは200万トークンという広大なコンテキストウィンドウをサポートしており、長大な文書の読解や、複雑なコードベースの分析、長期的な対話の記憶など、これまで困難だったタスクへの応用が期待される。

ただし、現時点では画像や動画の「生成」機能は搭載されていない。これは、テキストベースの推論と情報処理における価格対性能比を最大化するという、明確な設計思想の表れだろう。

xAIの戦略とAI業界への影響

今回のGrok 4 Fastの発表は、AI業界の勢力図を塗り替える可能性を秘めた、xAIの巧みな一手と分析できる。

OpenAIやGoogle、Anthropicといった競合他社が、より巨大で高性能なフラッグシップモデルの開発にしのぎを削る中、xAIは「コスト効率」という別の競争軸を提示した。これは、技術的な優位性だけでなく、市場における実用性と普及率を重視する戦略の表れではないだろうか。

高性能AIは、もはやその能力を競うだけの段階から、いかにして広く、安価に、そして持続可能に提供できるかという、新たなフェーズに突入した。Grok 4 Fastは、その流れを決定づけるモデルとなるかもしれない。このモデルの登場は、AIアプリケーション開発のコストを劇的に引き下げ、これまで資金的な制約で参入できなかった多くの開発者や企業に新たな道を開く。結果として、我々が想像もしなかったような革新的なサービスが生まれる土壌が育まれるだろう。

Elon Musk氏がxAIに注力しているという最近の報道もあったが、今回の発表はその成果の一端を示すものだ。筆者は、Grok 4 Fastが単なる高性能モデルの一つとして歴史に名を刻むのではなく、AIのコモディティ化を加速させ、社会実装を次のレベルへと押し上げるゲームチェンジャーになったと評価したい。今後のAI業界の動向は、この「Grok 4 Fast」という名の黒船から目が離せない。

Sources

xAI: Grok 4 Fast

この記事はいかがでしたか？

↑ トップへ戻る

xAI「Grok 4 Fast」発表。性能は下げずにコストは衝撃の“98%減”を実現

AI業界を揺るがす「コスト効率」という名の挑戦状

驚異的なコスト効率の正体：「知能密度」という新指標

「Thinking Tokens」40%削減の技術的意味

市場における価格競争力の再定義

性能はフラッグシップ級。ベンチマークが示す実力

LMArenaで証明された実世界の対話能力

技術的革新：単一モデルで実現する「思考」の切り替え

WebとXを自在に操る、優れた「エージェント」能力

開発者とユーザーに開かれる新たな選択肢

xAIの戦略とAI業界への影響

この記事はいかがでしたか？

光子を半分に切断すると何が起きる？物理学者が想像もしなかった奇妙な結末

フィンランドが海底ケーブル防衛を実証。錨引きずりを検知するセンサー網により”切断後の復旧”から”切断前の警報”へ

ベルギー発の全固体電池、液体電解質ゼロで465Wh/kgを達成

「奇跡の全固体電池」はリチウムイオン電池だった――Donut Lab疑惑、電気化学的証拠が決定打に

Microsoft AIトップ、AIが仕事を奪うとの前言を撤回：「AIが奪うのは仕事ではなくタスクである」

白金はもう要らない？東北大が開発した「鉄ベース触媒」が亜鉛空気電池の常識を覆す

Linux 7.1安定版リリース：新NTFSドライバの実装と次世代Intel・AMDハードウェア向け最適化

光子を半分に切断すると何が起きる？物理学者が想像もしなかった奇妙な結末

伝送容量を5倍に拡張する「3バンド・マルチコア光ファイバー」の商用化がもたらすAIインフラの構造的変革

接着不要で性能4倍。東北大学が光電融合「CPO」を劇的に加速させる「自己浄化する膜」を開発

AI業界を揺るがす「コスト効率」という名の挑戦状

驚異的なコスト効率の正体：「知能密度」という新指標

「Thinking Tokens」40%削減の技術的意味

市場における価格競争力の再定義

性能はフラッグシップ級。ベンチマークが示す実力

LMArenaで証明された実世界の対話能力

技術的革新：単一モデルで実現する「思考」の切り替え

WebとXを自在に操る、優れた「エージェント」能力

開発者とユーザーに開かれる新たな選択肢

xAIの戦略とAI業界への影響

この記事はいかがでしたか？

関連記事

NotebookLMの元開発者らが新アプリ「Huxe」をリリース：“あなただけのポッドキャスト”によるポストスクリーン時代のAIのあり方とは

ChatGPTを襲う「タツノオトシゴの謎」：絵文字1つが暴いた最先端AIの致命的欠陥

なぜアメリカ人はAIを恐れるのか？最新調査で判明した不信の根源と「知識の逆説」