先月、GoogleはSynthID Detectorを発表した。これはAI生成コンテンツを検出する新しいツールである。Googleは、テキスト、画像、動画、音声のAI生成コンテンツを識別できると主張している。
しかし、いくつかの注意点がある。その一つは、このツールが現在、ウェイティングリストを通じて「初期テスター」のみが利用できることである。
主な制約は、SynthIDが主にGoogleのAIサービスを使用して生成されたコンテンツに対してのみ機能することである。例えば、テキストの場合はGemini、動画の場合はVeo、画像の場合はImagen、音声の場合はLyriaなどである。
ChatGPTを使用して生成したコンテンツがフラグ付けされるかどうかを確認するためにGoogleのAI検出ツールを使用しようとしても、機能しない。
厳密に言えば、このツールはAI生成コンテンツの存在を検出したり、他の種類のコンテンツと区別したりすることはできない。代わりに、GoogleのAI製品(および他のいくつか)がSynthIDを使用して出力に埋め込む「ウォーターマーク」の存在を検出する。
ウォーターマークは、画像、動画、音声、テキストに埋め込まれた特別な機械読み取り可能な要素である。デジタルウォーターマークは、コンテンツの起源や著作者に関する情報がコンテンツと共に移動することを保証するために使用されてきた。これらは創作物における著作権の主張やメディアにおける誤情報の課題に対処するために使用されてきた。
SynthIDはAIモデルの出力にウォーターマークを埋め込む。ウォーターマークは読者や視聴者には見えないが、他のツールがSynthIDを搭載したAIモデルを使用して作成または編集されたコンテンツを識別するために使用できる。
SynthIDはこのような多くの取り組みの最新のものの一つである。しかし、それらはどの程度効果的なのだろうか?
統一されたAI検出システムは存在しない
Metaを含む複数のAI企業が、SynthIDと同様の独自のウォーターマークツールと検出器を開発している。しかし、これらは「モデル固有」のソリューションであり、汎用的なものではない。
これは、ユーザーがコンテンツを検証するために複数のツールを使い分けなければならないことを意味する。研究者が統一システムを求めており、Googleのような大手企業が自社のツールを他社に採用してもらおうとしているにもかかわらず、状況は断片化したままである。
並行して、メタデータ(メディアの起源、著作者、編集履歴に関する符号化された情報)に焦点を当てた取り組みがある。例えば、Content Credentials inspect toolは、ユーザーがコンテンツに添付された編集履歴を確認することでメディアを検証できる。
しかし、メタデータはコンテンツがソーシャルメディアにアップロードされたり、異なるファイル形式に変換されたりする際に簡単に削除される可能性がある。これは、誰かが意図的にコンテンツの起源と著作者を隠そうとした場合に特に問題となる。
視覚的な不整合や照明の異常などの法科学的手がかりに依存する検出器もある。これらのツールの一部は自動化されているが、多くは人間の判断と常識的な方法、例えばAI生成画像の指の数を数えることに依存している。これらの方法は、AIモデルの性能が向上するにつれて冗長になる可能性がある。

AI生成画像では、女性が6本指の手で手を振っている様子が示されている。現在のAI生成画像の時代における視覚的な「兆候」の一部である。(Credit: T J Thomson, CC BY-NC)
AI検出ツールはどの程度効果的か?
全体的に、AI検出ツールの効果は劇的に異なる可能性がある。一部は、チャットボットによって一から生成されたエッセイ全体など、コンテンツが完全にAI生成である場合により良く機能する。
AIが人間が作成したコンテンツを編集または変換するために使用された場合、状況はより曖昧になる。このような場合、AI検出器は大きく間違える可能性がある。AIを検出できなかったり、人間が作成したコンテンツをAI生成としてフラグ付けしたりする可能性がある。
AI検出ツールは、どのようにして判断に至ったかを説明することが少なく、これが混乱を増大させる。大学の評価における盗用検出に使用される場合、それらは「倫理的地雷原」と見なされ、英語を母国語としない話者に対して差別的であることが知られている。
AI検出ツールが役立つ場面
AI検出ツールには多様な使用事例がある。例えば、保険請求を考えてみよう。クライアントが共有する画像が主張している内容を実際に描写しているかどうかを知ることで、保険会社はどのように対応すべきかを知ることができる。
ジャーナリストやファクトチェッカーは、潜在的にニュース価値のある情報をさらに共有すべきかどうかを決定する際に、他のアプローチに加えてAI検出器を活用する可能性がある。
雇用主と求職者の双方が、採用プロセスの相手側の人物が本物なのか、それともAI偽装なのかを評価する必要性が高まっている。
出会い系アプリのユーザーは、オンラインで出会った人のプロフィールが本当の恋愛相手を表しているのか、それとも恋愛詐欺の前面に立つAIアバターなのかを知る必要がある。
緊急対応者が通報に対して支援を送るかどうかを決定する場合、通報者が人間なのかAIなのかを確実に知ることで、資源と生命を救うことができる。
これからどこへ向かうのか?
これらの例が示すように、真正性の課題は現在リアルタイムで発生しており、ウォーターマークのような静的ツールだけでは不十分である可能性が高い。音声と動画でリアルタイムに機能するAI検出器は、開発の急務である分野である。
どのようなシナリオであっても、真正性に関する判断を単一のツールに完全に委ねることはできないだろう。
このようなツールの限界を含めた動作方法を理解することが重要な第一歩である。これらを他の情報や自分の文脈的知識と三角測量することは、引き続き不可欠であろう。