OpenAI、AIコーディング支援「Codex」をChatGPT Plusへ拡大：開発者向け新機能とVoice Agent SDKも大幅強化

Y Kobayashi2025年6月4日更新: 2026年4月6日

約 11 分

OpenAIは2025年6月3日（現地時間）、開発者向けプラットフォームにおける重要なアップデートを発表した。AIによるソフトウェアエンジニアリング支援エージェント「Codex」の利用範囲をChatGPT Plusユーザーにも拡大するとともに、その機能を大幅に強化。さらに、音声エージェント開発を支援する「Agents SDK」についても、TypeScript対応や新機能の追加など、多岐にわたる改善を実施した。これらの動きは、AIを活用したアプリケーション開発のさらなる加速と、開発者エコシステムの活性化を目指すOpenAIの強い意志を示すものと言えるだろう。

AIコーディング支援「Codex」、進化を遂げてChatGPT Plusユーザーにも門戸を開く

OpenAIが提供するCodexは、自然言語による指示からコード生成、バグ修正、既存コードに関する質問応答などを行うAIソフトウェアエンジニアリングエージェントだ。2025年5月にChatGPT Enterpriseの加入者向けに初めて提供されたこの強力なツールが、今回のアップデートにより、ChatGPT Plusユーザーも利用可能となった。OpenAIによると、Plusユーザーは期間限定で寛大な利用制限の恩恵を受けられるものの、需要が集中する期間にはレート制限が適用される場合があるとしている。

更に今回、Codexは単に利用対象者が広がっただけではない。開発現場のニーズに応えるべく、数多くの機能強化が施されている。

注目すべきCodexの新機能群：インターネット接続から音声指示まで

今回のアップデートで最も注目される機能の一つが、Codexのインターネット接続機能だ。これにより、Codexは依存関係のインストール、外部リソースを必要とするテストの実行、パッケージのアップグレードといった、これまで手動で行う必要があった多くのタスクを自律的に処理できるようになる。この機能はデフォルトではオフになっており、ユーザーが特定の環境に対して明示的に有効化する必要がある。また、アクセス可能なドメインを制御することも可能で、セキュリティへの配慮も見られる。このインターネットアクセス機能は、ChatGPT Plus、Pro、Teamsユーザーに提供され、Enterpriseユーザーにも近日中に提供予定だ。

その他の主な機能強化点は以下の通りだ。

既存プルリクエストの更新: フォローアップタスクを実行する際に、Codexが既存のプルリクエストを更新できるようになった。これにより、開発ワークフローがよりスムーズになることが期待される。
音声によるタスク指示: テキスト入力だけでなく、音声でタスクを指示できるようになった。ハンズフリーでの操作や、より直感的なインタラクションが可能になるかもしれない。
バイナリファイルのサポート強化: パッチ適用時に全てのファイル操作がサポートされるようになった。プルリクエスト利用時は、現時点ではバイナリファイルの削除またはリネームのみがサポートされる。
セットアップスクリプトの改善: エラーメッセージがより分かりやすくなり、スクリプトの実行時間上限も従来の5分から10分に延長された。
タスク差分上限の増加: タスクの差分上限が1MBから5MBに引き上げられ、より大きな変更にも対応しやすくなった。
GitHub接続フローの洗練: GitHubとの連携がよりスムーズに行えるよう、接続フローが改善された。
iOSでのLive Activities再開: 通知に関する問題が解決され、iOS版CodexでLive Activities機能が再び利用可能になった。
SSO/ソーシャルログインユーザーの2FA必須要件撤廃: シングルサインオン（SSO）またはソーシャルログインを利用しているユーザーに対する二要素認証（2FA）の必須要件が撤廃され、利便性が向上した。

これらのアップデートは、Codexが単なるコード生成ツールから、より自律的で広範な開発タスクを支援する「エージェント」へと進化する過程にあると言えるだろう。

Codexは新世代「エージェント的コーディングツール」の一翼を担う

OpenAIのCodexは、昨今注目を集める「エージェント的コーディングツール（agentic coding tools）」と呼ばれる新しいカテゴリーの製品群の一つとして捉えることができる。GitHub Copilotのような従来のAIコーディングアシスタントが、非常に高度なオートコンプリートとして機能し、開発者がIDE内で直接AI生成コードを操作するのに対し、エージェント的コーディングツールは、より自律的な動作を目指している。

こうしたエージェント的コーディングツールには、既にDevin、SWE-Agent、OpenHandsといったツールがリリースされているが、これらと共に、Codexもこの新しい潮流の中に位置づけられる。これらのツールが目指すのは、開発者がコードの詳細に直接関与することなく、まるでエンジニアリングチームのマネージャーのように、AsanaやSlackといった業務システムを通じて課題を割り当て、解決された時点で報告を受ける、といったワークフローだ。

プリンストン大学の研究者であり、SWE-AgentチームのメンバーでもあるKilian Lieret氏は、「初期の段階では、人々は全てのキーストロークを打ってコードを書いていた。GitHub Copilotは真のオートコンプリートを提供した最初の製品であり、これが第二段階だ。開発者は依然としてループの中にいるが、時にはショートカットを利用できる」と説明し、エージェント的システムでは、「バグ報告を割り当てれば、ボットが完全に自律的にそれを修正しようとする、という管理レイヤーにまで引き上げる」ことを目標としていると述べている。

「指示して待つ」理想と現実のギャップ：信頼性の課題

この野心的な目標の実現は、現状ではまだ困難が伴う。2024年末に一般提供が開始されたDevinは、一部から厳しい評価も受けた。多くのAIツールと同様に、エラーや「ハルシネーション」（AIが事実に基づかない情報を生成すること）が頻発し、結局のところAIの監視や修正に、手作業でタスクを行うのと同程度の労力が必要になるという指摘だ。

OpenHandsをメンテナンスするAll Hands AIのCEO、Robert Brennan氏も、AIエージェントが書いたコードを自動承認することの危険性を指摘し、「現時点では、そして予見可能な将来においても、人間がコードレビューの段階で介入し、書かれたコードを確認する必要がある」と警鐘を鳴らす。同氏は、OpenHandsエージェントが訓練データのカットオフ後にリリースされたAPIについて尋ねられた際に、それらしいAPIの詳細を捏造した事例を挙げている。

ベンチマーク「SWE-Bench」での評価と今後の展望

エージェント的プログラミングの進捗を測る一つの指標として、「SWE-Bench」リーダーボードがある。これは、公開されているGitHubリポジトリの未解決課題をモデルに解かせるテストだ。OpenHandsは検証済みリーダーボードでトップに位置し、問題セットの65.8%を解決している。OpenAIは、Codexを支えるモデルの一つであるcodex-1がこれを上回る72.1%のスコアを達成したと主張しているが、このスコアにはいくつかの注意点があり、独立した検証は行われていない。

業界の多くの専門家が懸念するのは、高いベンチマークスコアが、必ずしも真に「ハンズオフ」なエージェント的コーディングを意味するわけではないという点だ。もしエージェントが4つの問題のうち3つしか解決できないのであれば、特に複雑なシステムに取り組む際には、依然として人間の開発者による大幅な監督が必要となるだろう。

しかし、多くのAIツールと同様に、基盤モデルの着実な改善が期待されており、最終的にはエージェント的コーディングシステムが信頼性の高い開発者ツールへと成長することが望まれる。そのためには、ハルシネーションやその他の信頼性に関する問題を管理する方法を見つけることが不可欠だ。Brennan氏は、「最終的に、どれだけ多くの信頼をエージェントに移行させ、彼らがあなたの仕事量からより多くを取り除いてくれるかが問題だ」と、この挑戦を「サウンドバリア効果」に例えている。

Voice Agent開発も加速：Agents SDKの機能強化

OpenAIはCodexだけでなく、音声AIエージェント開発を支援する「Agents SDK」についても大幅な機能強化を発表した。2025年3月にローンチされたこのSDKは、AIモデルやエージェントを内部システムと統合するためのツールを提供するものだ。

TypeScriptサポートと主要機能の拡充

今回のアップデートで、Agents SDKはTypeScriptをサポートするようになった。これに伴い、ハンドオフ（人間への処理の引き継ぎ）、ガードレール（安全性の確保）、トレーシング（処理追跡）、そしてエージェントがブラウザなどのサードパーティ製ソフトウェアツールを使用するための標準化された方法を提供するモデルコンテキストプロトコル（MCP）といった、エージェントの中核となる機能のサポートが含まれる。

さらに、ヒューマンインザループ承認機能が新たに追加された。これにより開発者は、ツールの実行を一時停止し、エージェントの状態をシリアライズして保存し、特定のAPIコールなどを承認または拒否した上で、エージェントの実行を再開させることが可能になる。これにより、より安全で制御されたエージェント運用が実現できるだろう。

高度化する音声対話機能

音声対話の品質向上も図られている。アップデートされたスピーチトゥスピーチモデルは、指示追従の信頼性、ツール呼び出しの一貫性、そして会話中の中断動作が改善された。また、開発者はセッションごとに音声の再生速度をカスタマイズできるようになった。これらの新モデルには、Realtime APIでは「gpt-4o-realtime-preview-2025-06-03」、Chat Completions APIでは「gpt-4o-audio-preview-2025-06-03」という名前でアクセス可能だ。

開発支援ツールの進化

開発プロセスを支援するツールとして、TracesダッシュボードがRealtime APIセッションをサポートするようになった。これにより、開発者は音声エージェントの実行（音声入出力、ツール呼び出し、中断など）を容易に視覚化し、デバッグや分析を行うことができるようになる。

OpenAIの戦略と開発者エコシステムへの影響

今回のCodexとAgents SDKの同時アップデートは、OpenAIが開発者向けプラットフォームの強化に引き続き注力していることを明確に示している。特にCodexをより広範な開発者層に提供し、その能力をエージェント的な方向に進化させようとしている点は、ソフトウェア開発の未来を占う上で非常に興味深い。

これらのツールが成熟し、信頼性を高めていけば、開発者の生産性を飛躍的に向上させる可能性がある。一方で、エージェント的AIの台頭は、ソフトウェア開発のあり方そのものや、開発者の役割にも変化をもたらすかもしれない。

GitHub CopilotやDevinといった競合ツールとの競争も激化する中で、OpenAIがどのように開発者コミュニティからのフィードバックを取り入れ、製品を磨き上げていくのか。そして、これらの進化がAIアプリケーション開発の新たな波をどのように形作っていくのだろうか。

これらのツールが単にコードを書く時間を短縮するだけでなく、より複雑で創造的な問題解決に開発者が集中できる環境を生み出すことを期待したい。そのためには、ツールの能力向上と同時に、その限界やリスクを理解し、人間とAIが協調して価値を最大化するフレームワークを構築していく必要があるだろう。AIによる自動化の波は、間違いなくソフトウェア開発の世界にも大きな変革をもたらそうとしている。その最前線にOpenAIがいることは確かだ。

Sources