GoogleのAIチャットボット「Gemini」の高度な自動リサーチ支援機能「Deep Research」が、グローバル展開の新たな段階に入った。同社は12月21日、これまで英語のみで提供していた同機能を40以上の言語で利用可能にすることを発表。100カ国以上のユーザーが自国語でAIによる詳細な調査機能を活用できるようになる。
拡張される言語サポート
Deep Researchの対応言語には、新たに日本語を含む、アラビア語、ベンガル語、中国語、デンマーク語、フランス語、ドイツ語、グジャラート語、ヒンディー語、インドネシア語、イタリア語、カンナダ語、韓国語、マラーヤーラム語、マラーティー語、ポーランド語、ポルトガル語、スワヒリ語、スペイン語、タミル語、テルグ語、タイ語、ウクライナ語、ウルドゥー語などが含まれる。この機能は、Google One AIプレミアムプラン加入者向けのGemini Advancedの一部として提供される。
Deep Researchの仕組みと特徴
Deep Researchは、Googleの最新AI言語モデルであるGemini 1.5 Proの高度な文脈理解能力を活用した画期的な研究支援システムだ。その核となる技術は「長いコンテキストウィンドウ」と呼ばれる、大量の情報を一度に処理し、関連性を理解する能力にある。この機能により、複雑なトピックに対しても包括的かつ構造化された調査が可能となっている。
実際の利用においては、ユーザーが研究したいトピックをプロンプトとして入力することから始まる。システムはこの入力を分析し、効率的な調査を行うための詳細な研究計画を自動的に策定する。注目すべきは、この計画がユーザーとの対話的なプロセスとして設計されている点だ。ユーザーは提案された研究計画を確認し、必要に応じて修正や調整を加えることができる。
研究計画が確定すると、システムはオープンWeb上で関連情報の探索を開始する。この過程はシンプルな検索とは異なり、複数の情報源から得られたデータを相互に検証しながら、段階的に理解を深めていく。Googleによれば、この探索プロセスには数分を要することもあるが、これは情報の網羅性と正確性を確保するための必要なステップとされている。
探索が完了すると、システムは収集した情報を統合し、構造化された複数ページのレポートを生成する。このレポートの特徴は、単なる情報の羅列ではなく、論理的な文章構造と明確な情報の階層化にある。さらに、生成されたレポートはGoogle Docsへのシームレスなエクスポートが可能で、後続の編集や共有が容易に行える仕様となっている。
このような高度な機能は、Google One AIプレミアムプラン加入者向けのGemini Advancedスイートの一部として提供される。多言語対応の拡大により、様々な言語圏のユーザーが自然な形でこの高度な研究支援機能を活用できるようになった。ただし、Google側も認めているように、非英語でのコンテンツ生成における精度は依然として改善の余地があり、継続的なアップデートが予定されている。
技術的な課題とその対策
GeminiアプリのエンジニアリングディレクターであるHyunJeong Choe氏は、非英語コンテンツにおける重要な技術的課題を指摘している。特に深刻なのは、各言語における信頼性の高い情報源の確保と、文法的に正確な要約の生成という二つの側面だ。これは特にヒンディー語などの非欧米言語において顕著な問題となっている。
この課題に対してGoogleは複数層の対策を実施している。まず基盤となるのが、各言語のネイティブソースからのデータ収集だ。これに加えて、Google検索エンジンのインフラストラクチャを活用した情報の検証プロセスを導入し、生成される情報の信頼性向上を図っている。
特筆すべきは、各言語におけるファクトチェックの仕組みだ。Choeによれば、モデルの展開前に必ずネイティブ言語でのファクトチェックを実施している。「事実性の確保は生成AIの一般的な研究課題ですが、私たちは事前学習モードで獲得した情報を適切に活用することに注力しています」とChoeは説明する。
品質管理の面では、Geminiアプリの国際市場プロダクトリードであるJules Walterが興味深い取り組みを明かしている。同社はモデルのトレーニング用データを生成する際、現地チームによる徹底的なレビューを実施している。これは単なる機械的なチェックではなく、文化的な文脈や言語的なニュアンスまでを考慮した包括的な品質管理プロセスとなっている。
しかし、この取り組みにも課題がないわけではない。最近の報道によれば、Geminiの応答を評価する契約社員に対して、専門知識の有無に関わらずすべてのプロンプトに対する評価を求める新たなガイドラインが示されたという。これに対してGoogleの広報担当者は、評価者はコンテンツだけでなく、スタイルやフォーマットなど多面的な要素を見ていると説明している。この動きは、急速なグローバル展開と品質管理の両立という難しい課題に対する同社の模索を示している。
Source
コメント