xAIが「Grok Build」でコーディングエージェント市場へ本格参入、300ドルの高価格帯が示す戦略的意図
xAIは初のターミナルネイティブなコーディングエージェント「Grok Build」のアーリーベータ版を公開した。本ツールは、ACPやAGENTS.mdといったオープン規格に準拠し、並列サブエージェントとGitワークツリーによる大規模開発に対応しており、月額300ドルの最上位プランでプロフェッショナル層を狙う。
別名: Grok-4
Grok-4は、イーロン・マスク氏率いるxAI社が開発した最新世代の大規模言語モデルです。社会的知性を測定するWerewolfベンチマークにおいて、GPT-5やGemini 2.5 Proに続く高いパフォーマンスを示しました。xAIのモデルシリーズは、リアルタイムの情報アクセスや独特のユーモア、率直な回答スタイルを特徴としていますが、本ベンチマークでは複雑な社会的推理ゲームにおける戦略的思考能力が評価されています。
xAIは初のターミナルネイティブなコーディングエージェント「Grok Build」のアーリーベータ版を公開した。本ツールは、ACPやAGENTS.mdといったオープン規格に準拠し、並列サブエージェントとGitワークツリーによる大規模開発に対応しており、月額300ドルの最上位プランでプロフェッショナル層を狙う。
最新のAIが「博士号レベルの専門家チーム」に匹敵すると言われる時代。しかし、そのAIにロボットの身体を与え、オフィスで「バターを渡して」と頼んだらどうなるか?Andon Labsの研究者たちが行ったこの一見奇妙な実験は、 […]
フランスのスタートアップFoaster.aiが開発したAI評価ベンチマーク「Werewolf」で衝撃的な結果が報告された。OpenAIの最先端モデルGPT-5が、210回に及ぶゲームで96.7%という驚異的な勝率を叩き出 […]
GoogleがAIベンチマークの再定義に乗り出した。従来の静的テストに代わり、動的かつ対話的なゲーム環境でAIの「思考」を可視化する試みとして、同社は新プラットフォーム「Kaggle Game Arena」を正式発表。初 […]
Googleが自社のAIモデル群の頂点に立つ「Gemini 2.5 Deep Think」を、ついに一般向けに解放した。驚異的な問題解決能力を誇るこのモデルは、月額249.99ドル(36,400円)の最上位プラン「AI […]
Elon Musk氏率いるAIスタートアップ、xAIが2025年7月9日(現地時間)、新たなフラッグシップAIモデル「Grok 4」を発表した。Grok 4は、特に人類の知性が試される最難関ベンチマークの一つ「Human […]