チャットボットの普及により、AI生成テキストが私たちの日常に深く浸透している。ニュースフィード、レポート、メールなど、あらゆる場所でAIが生成したテキストを目にする機会が増加している。AWSの調査によると、現在のWeb上の文章の約60%がAI生成である可能性が指摘されており、欧州連合法執行機関は2026年までにオンラインコンテンツの90%が人工的に生成される可能性があると警告している。
このような状況下で、Google DeepMindは革新的なアプローチとして、AI生成テキストに透かしを埋め込む技術「SynthID-Text」を開発し、学術誌『Nature』で発表した。さらに、この技術をオープンソースとして公開し、開発者やビジネス向けに無償で提供を開始している。
トークン分布を巧みに操作する新技術
生成AIによる出力に対する透かしとしては、昨年8月に発表されたSynthIDが記憶に新しい。これは、画像、音声、ビデオ、テキストが生成される際に目に見えない透かしを追加することで、AIが生成した出力を検出可能にするのに役立つ。 Googleによると、SynthIDのテキストバージョンは、人間ではなくソフトウェアによって検出可能な方法で、テキスト出力の確率をわずかに低くすることで機能するという:
LLMは一度に1つのトークンを生成します。 これらのトークンは、1つの文字、単語、フレーズの一部を表すことができます。 一貫性のある一連のテキストを作成するために、モデルは次に生成される可能性の高いトークンを予測します。 例えば、”私の好きな果物は __.” というフレーズがあるとする。 LLMは “マンゴー”、”ライチ”、”パパイヤ”、”ドリアン “といったトークンから文を完成させるかもしれず、各トークンには確率スコアが与えられる。 このプロセスは生成されたテキスト全体で繰り返されるため、1つのセンテンスに10以上の確率スコアが含まれることもあれば、1ページに数百の確率スコアが含まれることもあります。 モデルの単語選択と調整済み確率スコアの両方を組み合わせたスコアの最終パターンが透かしとみなされます。
SynthID-Textの革新的な点は、テキスト生成プロセスそのものに介入する手法にある。大規模言語モデル(LLM)がテキストを生成する際、モデルは各トークン(文字、単語、または文の一部)に対して確率スコアを割り当てる。SynthID-Textは、出力の品質や正確性を損なわないよう配慮しながら、これらの確率スコアを微調整することで、人間には気づかれない形で透かしを埋め込んでいく。
Google DeepMindのPushmeet Kohli副研究部長は、「SynthID-Textは、テキスト生成の品質、正確性、創造性、速度を損なうことなく機能する」と説明している。1つの文章には10個以上、1ページ全体では数百に及ぶ調整されたスコアが含まれ、これらのパターンが透かしとして機能するという。
Geminiへの統合と大規模テスト
GoogleはすでにこのシステムをGeminiチャットボットに統合しているとのことだ。性能検証のため、2,000万件のプロンプトを用いた大規模なテストを実施。半数をSynthID-Text経由で生成し、残り半数を標準的なGeminiで生成して比較した結果、ユーザーからの「親指を上げる」「親指を下げる」フィードバックにおいて、透かし入りの応答は標準的な応答と同等の満足度を得られることが確認された。
課題と今後の展望
しかし、SynthID-Textにも限界はある。短いテキストや、他言語からの翻訳、事実に基づく質問への回答などでは性能が低下する。例えば「フランスの首都は?」といった事実関連の質問や、「宮沢賢治の詩を朗読して」のような変動の余地が少ないプロンプトでは、トークン分布を調整する余地が限られる。
また、テキストが大幅に編集されたり、別のチャットボットで要約し直されたりした場合、透かしが失われる可能性がある。実用化に向けては、主要なAI企業による相互運用可能な透かし技術の採用や、オープンソースLLMへの対応など、さらなる課題が残されている。
論文
参考文献
- Google DeepMind: SynthID
コメント