OpenAIは、ChatGPTの新機能として、高度なWeb調査を自動化するAIエージェント「Deep research」を発表した。専門家レベルの知識労働を効率化し、これまで数時間単位を要していた複雑な調査業務を、わずか数分で完了させる能力を備えるという。
「Deep research」とは?複雑な調査をAIが代行
OpenAIは、ChatGPTの新機能「Deep Research」を発表した。これは、複雑なWebブ調査を自律的に実行するAIエージェントであり、ユーザーが求める情報をインターネット上の膨大なソースから収集、分析、統合し、詳細なレポートを生成するものである。
Deep researchは、金融、科学、政策、エンジニアリングといった専門分野における知識労働者や、自動車、家電、家具など、入念な調査を要する製品の購入を検討する消費者にとって特に有用だ。従来のChatGPTがリアルタイムな対話や簡単な質問応答に適しているのに対し、Deep researchは、多岐にわたる情報を深く掘り下げ、詳細かつ検証可能な回答を必要とする場面でその力を発揮する。
出力されるレポートは、明確な引用と思考過程の要約を伴い、情報の信頼性と検証可能性を高める。これにより、ユーザーはレポートの内容を容易に参照し、事実確認を行うことが可能となる。特に、複数のWebサイトを横断的に調査しなければ見つけられないような、ニッチで非直感的な情報の発見に強みを発揮する。
「o3」モデルと強化学習が生み出す高度な調査能力
Deep researchは、OpenAIが開発中の「o3」モデルのWebブラウジングとデータ分析に最適化されたバージョンを基盤としているとのことだ。このモデルは、推論能力を活用し、テキスト、画像、PDFなど、インターネット上の多様な情報を検索、解釈、分析する。必要に応じて戦略を修正しながら情報を深掘りしていくことが可能だ。
開発にあたっては、OpenAIの初期の推論モデル「o1」と同様の強化学習手法が用いられた。これにより、Deep researchは、ブラウザとPythonツールを用いた実世界のタスクを通じて訓練され、自律的な情報収集と分析能力を獲得した。
OpenAIは、Deep researchの開発目的 を、知識合成能力をAGI(汎用人工知能)開発における重要なステップと位置づけている。AGIは、新たな科学的発見を生み出す能力を持つと考えられており、Deep researchはその実現に向けた重要な一歩となる。
「Deep research」の使い方と利用範囲
「Deep research」は、ChatGPTのメッセージコンポーザーで「Deep research」を選択し、質問を入力すれば可能することが可能だ。質問にコンテキストを追加するために、ファイルやスプレッドシートを添付することも出来る。
処理が開始されると、サイドバーに実行されたステップと使用されたソースの概要が表示される。調査の複雑さによるが、レポートの完成には5分から30分程度かかる場合がある。完了すると通知が届き、チャットインターフェース内でレポートを確認できる。
ただし、現在、「Deep research」は月額200ドル(約31,100円)のChatGPT Proユーザー向けに提供されており、月間100クエリまで利用可能だ。OpenAIによれば、今後、ChatGPT Plus、Team、Enterpriseプランにも順次拡大される予定とのことだ。ただし、現時点ではWeb版ChatGPTのみの提供であり、モバイルアプリやデスクトップアプリへの統合は後日となる。また、提供地域も限定されており、英国、スイス、欧州経済領域のユーザーへの提供時期は未定である。
出力形式はテキストレポートであるが、今後は画像、データ可視化、その他の分析出力も組み込まれる予定だ。さらに、将来的には、サブスクリプションベースのデータソースや社内リソースなど、より専門的なデータソースへの接続も計画されている。
「Deep research」の性能と限界
OpenAIは、Deep researchの性能を評価するために、「Humanity’s Last Exam」というAI評価ベンチマークを使用した。この評価において、Deep researchの基盤モデルである「o3」モデルは、26.6%の精度を達成した。これは、GPT-4o(3.3%)、Gemini Thinking(6.2%)、Grok-2(3.8%)などの他のモデルを大きく上回るスコアだ。
ただし、OpenAIはDeep researchにも限界があることを認めている。誤った推論や事実の捏造(ハルシネーション)、情報の信頼性評価の誤り、レポートのフォーマットエラーなどが起こる可能性がある。また、不確実な情報に対する自信過剰な回答や、根拠のない断定的な表現も課題として指摘されている。
OpenAIは、これらの課題に対処するため、出力レポートに引用と思考過程の要約を付与することで、ユーザーが情報を検証しやすくする対策を講じている。しかし、AIによる調査結果を鵜呑みにせず、ユーザー自身が批判的に分析し、ダブルチェックを行うことが重要である。
XenoSpectrum’s Take
OpenAIの「Deep research」は、AIが専門家レベルの調査業務を支援する新たな可能性を示す画期的な機能であると言える。これまで人間が行ってきた複雑なWeb調査をAIが肩代わりすることで、知識労働者はより創造的な業務に集中できるようになるであろう。特に、膨大な情報から必要な情報を効率的に収集し、分析する能力は、ビジネス、科学研究、政策立案など、様々な分野で大きなインパクトをもたらすことが期待される。
一方で、AIの出力には常に誤りや限界がつきものであることも忘れてはならない。「Deep research」も例外ではなく、情報の正確性、信頼性、倫理的な側面など、解決すべき課題は多く存在する。今後は、AIの精度向上と同時に、ユーザーがAIを適切に活用するためのリテラシー教育も重要になると考えられる。
名称が類似しているGoogleの「Gemini Deep Research」との競合、そしてAIによる調査レポートの普及が、情報収集と知識創造のあり方をどのように変えていくのか、今後の動向に注目が集まるところである。
Source
- OpenAI: Introducing deep research
コメント