OpenAIは3月12日、開発者や企業がAIエージェントを効率的に構築できる新しいツールセット「Responses API」と「Agents SDK」を発表した。これらのツールは、同社のAIモデルとフレームワークを活用して、Web検索やファイル操作、コンピュータ制御などの機能を持つ自律的なAIシステムの開発を大幅に簡素化するものであり、多様な業界での活用が期待される。
Responses API:AIエージェント開発の新基盤
OpenAIが発表した「Responses API」は、既存の「Chat Completions API」のシンプルさと「Assistants API」のツール使用機能を統合した新しいAPI基盤だ。同社によれば、Responses APIは2026年半ばにAssistants APIを置き換える予定であり、AIモデルの機能が進化するにつれてエージェント型アプリケーション開発のためのより柔軟な基盤を提供するという。
「モデル機能が進化し続けるにつれて、Responses APIは開発者がエージェント型アプリケーションを構築するためのより柔軟な基盤を提供すると確信しています」とOpenAIは公式発表で述べている。
Responses APIの最大の特徴は、単一のAPI呼び出しで複数のツールとモデルターンを活用して複雑なタスクを解決できる点だ。現時点では、以下の3つの主要なビルトインツールをサポートしている。
Web検索ツール:最新情報へのアクセスとファクトチェック
Web検索ツールは、ChatGPTの検索機能と同じモデル(GPT-4oおよびGPT-4o mini)を活用し、最新の情報へのアクセスと明確な引用を提供する。OpenAIによると、事実を問う短い質問の正確さを評価する「SimpleQA」ベンチマークにおいて、GPT-4o searchは90%、GPT-4o mini searchは88%のスコアを達成している。これは検索なしのGPT-4.5モデル(63%)を大幅に上回る結果だ。こうしたWeb検索機能の追加により、AIモデルの事実の正確性が劇的に向上することが期待出来る。
Web検索ツールを利用したレスポンスには、ニュース記事やブログ投稿などのソースへのリンクが含まれ、ユーザーが情報を検証できるようになっている。ただし、この改善された検索機能を持ってしても、AIの「ハルシネーション(事実と異なる情報の生成)」問題は完全には解決されておらず、GPT-4o searchでも約10%の確率で事実の誤りが生じるという課題が残されている。
このツールの価格設定は、GPT-4o searchが1000クエリあたり30ドル、GPT-4o mini searchが1000クエリあたり25ドルからとなっている。
ファイル検索ツール:社内データの高速検索
ファイル検索ツールは、大量のドキュメントから関連情報を簡単に取得するための機能を提供する。複数のファイルタイプのサポート、クエリ最適化、メタデータフィルタリング、カスタムリランキングなどの機能を備え、高速で正確な検索結果を実現する。
「ファイル検索ツールは、顧客サポートエージェントがFAQに簡単にアクセスしたり、法律アシスタントが過去の事例を素早く参照したり、コーディングエージェントが技術文書を照会したりするなど、様々な実用的なユースケースに対応します」とVentureBeatは説明している。
価格は1000クエリあたり2.50ドル、ファイルストレージは1GBあたり1日0.10ドル(最初の1GBは無料)に設定されている。
コンピュータ使用ツール:自動化の新たな可能性
「Computer Using Agent(CUA)」モデルを活用したコンピュータ使用ツールは、AIエージェントがコンピュータ上でタスクを実行するための機能を提供する。このツールは、OpenAIの「Operator」エージェントと同じモデルを基盤としており、マウスとキーボードのアクションを捕捉して開発者の環境内で実行可能なコマンドに変換する。
このモデルは、完全なコンピュータ使用タスクを対象としたOSWorldベンチマークで38.1%、WebArenaで58.1%、ウェブベースのインタラクションを対象としたWebVoyagerで87%という成功率を達成している。
「しかし、OpenAIはCUAモデルがまだオペレーティングシステム上でのタスク自動化に対して高い信頼性を持っておらず、意図しないミスを犯す可能性があることを認めています」とArs Technicaは指摘している。
現在、このツールは研究プレビューとして利用階層3-5の開発者向けに限定提供されており、価格は入力トークン100万あたり3ドル、出力トークン100万あたり12ドルとなっている。
エージェントの連携を強化するAgents SDK
Responses APIと並行して、OpenAIはオープンソースの「Agents SDK」も発表した。このSDKは、複数のエージェントワークフローのオーケストレーションを簡素化し、昨年リリースされた実験的なフレームワーク「Swarm」の後継として位置づけられている。
Agents SDKの主な改良点には以下のような特徴がある:
- エージェント:明確な指示とビルトインツールを持つ設定可能なLLM
- ハンドオフ:エージェント間での知的なコントロール転送
- ガードレール:入出力検証のための設定可能な安全チェック
- トレーシングと可観測性:パフォーマンスのデバッグと最適化のためのエージェント実行追跡の可視化
「Agents SDKは、開発者がエージェントが何をしているか—どのようなタスクを生成し、どのようなデータを収集し、どのようにレスポンスを生成しているかを正確に追跡できるようにします」とVentureBeatは伝えている。
このSDKはResponses APIとChat Completions APIの両方で動作するだけでなく、Chat Completions形式のAPIエンドポイントを提供している他のプロバイダーのモデルとも連携可能だ。現在はPythonコードベースへの統合が可能で、Node.jsサポートも近日中に提供される予定となっている。
AIエージェントの現状と展望
AIエージェント技術は現在も発展途上の段階にある。OpenAIのCEO、Sam Altman氏は1月に「2025年はAIエージェントが労働力に加わる年になる」と発言しており、同社はその約束を実現するための取り組みを進めている。
2024年頃から各所で耳にするようになったAIエージェントだが、まだ初期段階であり、今後急速に改善される可能性が高い。しかし、現時点では、AIエージェントはまだ労働を置き換えるには至っていない。
実際、中国のスタートアップ「Butterfly Effect」が開発した「Manus AI」エージェントプラットフォームが多くの約束を果たせなかったことが最近発覚するなど、AIエージェント分野では実際の機能と宣伝の間にギャップが存在する事例も報告されている。
OpenAIのプラットフォーム製品責任者であるOlivier Godement氏は、TechCrunchとのインタビューで「エージェントをデモするのは簡単だが、エージェントをスケールさせるのは非常に難しく、人々に頻繁に使ってもらうのはさらに難しい」と述べている。
同氏はまた、VentureBeatに対し「エージェントはAIの最も影響力のあるアプリケーションになる」との見解を示しており、これはAltman CEOの「2025年にAIエージェントが労働力に加わる」という発言と一致している。
OpenAIは今回のリリースを「AIエージェントを構築するための最初のビルディングブロック」と位置づけており、今後数週間から数ヶ月の間に、エージェント型アプリケーションの構築をさらに簡素化・加速するための追加ツールと機能をリリースする計画だとしている。
Source
- OpenAI: New tools for building agents