Googleは、年次開発者会議「Google I/O 2025」において、AIによって生成されたコンテンツを識別するための新たな検証ポータル「SynthID Detector」を発表した。このツールは、GoogleのAIツールで作成された画像、音声、動画、テキストに埋め込まれた電子透かし「SynthID」を検出し、コンテンツの出自に関する透明性を高めることを目的としている。生成AI技術が急速に進化し、その応用範囲が広がる中で、コンテンツの真正性や文脈の検証は喫緊の課題であり、Googleのこの一手は業界内外から大きな注目を集めている。
加速するAIコンテンツ生成と「SynthID Detector」登場の背景
近年、生成AIの進化は目覚ましく、テキストから高品質な画像、音声、動画に至るまで、誰もが容易にコンテンツを創り出せる時代が到来した。調査によれば、ディープフェイク動画の数は2019年から2024年にかけて550%も急増したと推定されており、Facebookの米国におけるトップ20の閲覧投稿のうち4つが「明らかにAIによって作成された」ものであったという報告もある(The Timesによる)。こうした状況は、誤情報や偽情報の拡散、著作権侵害、なりすましといった様々な問題を引き起こす可能性を孕んでいる。
このような背景のもと、コンテンツが人間によって作られたものなのか、AIによって生成されたものなのかを区別する技術の重要性が増している。Googleは、2023年にAI生成画像に人間には知覚できない電子透かしを埋め込むツール「SynthID」を発表。その後、対象をテキストや動画にも拡大し、同社のAIモデルであるGemini、Imagen、Lyria、Veoなどで生成されたコンテンツに適用してきた。Googleによれば、これまでに100億を超えるコンテンツにSynthIDによるウォーターマークが付与されているという。今年初めには、Googleフォトの「編集マジック」にもこの技術が導入された。
今回発表された「SynthID Detector」は、このSynthIDの取り組みをさらに一歩進め、より広範なユーザーがAI生成コンテンツの識別を行えるようにするものである。
「SynthID Detector」とは何か? その機能と仕組み
SynthID Detectorは、ユーザーが画像、音声、動画、テキストなどのファイルをアップロードすると、そのメディアにSynthIDウォーターマークが含まれているかをスキャンするウェブベースのポータルだ。

Googleの公式ブログによれば、その仕組みは以下の通りだ。
- コンテンツのアップロード: GoogleのAIツールを使用して作成された画像、オーディオトラック、動画、またはテキストの一部をアップロードする。
- ウォーターマークのスキャン: ポータルはアップロードされたメディアをスキャンし、コンテンツ全体または特定の部分にSynthIDウォーターマークが含まれているかどうかを検出する。
- 結果の表示: スキャン結果が表示され、SynthIDウォーターマークが検出された場合は、コンテンツのどの部分がウォーターマークされている可能性が高いかが強調表示される。例えば、音声コンテンツの場合は特定のセグメントが、画像の場合はウォーターマークが存在する可能性のある領域が示されるという。
Googleは、SynthIDについて、コンテンツの品質を損なうことなく、フィルターの追加、色の変更、明るさの調整といった様々な変換を経ても検出可能な堅牢なウォーターマークであると主張している。
現時点では画像と音声の検出に対応しており、動画とテキストの検出機能は今後数週間以内に提供される予定だ。
利用方法と今後の展開
SynthID Detectorは、まず初期のテスター向けに提供が開始され、その後、より広範なユーザーに展開される予定だ。ジャーナリスト、メディア専門家、研究者は、ウェイトリストに登録することでアクセスを申請できる。
また、Googleは、SynthID Detectorの発表と同時に、SynthID技術を基盤としたエコシステムの拡大にも力を入れていることを強調した。これは、同社単独の取り組みに留まらず、業界全体でAI生成コンテンツの透明性を確保しようとする強い意志の表れと言える。
エコシステム拡大の具体的な取り組み:
- テキストウォーターマークのオープンソース化: Googleは、SynthIDのテキストウォーターマーク技術をオープンソース化している。これにより、他の開発者もこの技術を自身のモデルに組み込むことが可能になり、AI生成コンテンツの透明性向上に貢献できる。
- NVIDIAとの提携: NVIDIAの「NVIDIA Cosmos™」プレビューNIMマイクロサービスで生成される動画コンテンツに、SynthIDウォーターマークが適用されるよう提携した。これは、Google以外のAIモデルで生成されたコンテンツにもSynthIDが組み込まれることを意味し、ウォーターマークされたAIコンテンツの総量を大幅に増やす効果が期待できる。
- GetReal Securityとの提携: 世界有数のコンテンツ検証プラットフォームであるGetReal Securityとの提携も発表された。これにより、SynthIDでウォーターマークされたコンテンツの検出が、より広範なプラットフォームで可能になる見込みだ。
これらの取り組みは、AI生成コンテンツの信頼性を確保するための基盤を構築し、誤情報や偽情報の拡散を抑制するというGoogleの長期的なビジョンを示唆している。
期待される効果と残された課題
SynthID Detectorの登場は、AIによって生成されたコンテンツの透明性を高め、誤情報やディープフェイクとの戦いにおいて重要な一歩となる可能性を秘めている。特にジャーナリズムの現場では、情報の真偽を見極めるための強力なツールとなり得るだろう。
しかし、この技術が万能というわけではない。筆者(経験豊富なテクノロジージャーナリストであり、元Google検索エンジン開発者)の視点から見ると、いくつかの重要な限界と課題が横たわっているように思える。
第一に、SynthID Detectorが検出できるのは、あくまでSynthIDでウォーターマークが付与されたコンテンツに限られるという点だ。SynthIDツールキットを使用せずに生成された数千億ものAIコンテンツは、このポータルでは識別できない。Googleや他の主要AI企業7社は、2023年にBiden大統領との会合でウォーターマーキング技術の開発にコミットしたが、業界標準となる単一の検出システムの確立には至っていないのが現状である。MicrosoftやMeta、OpenAIなども独自のウォーターマーキング技術を開発・導入しており、相互運用性の確保が大きな課題と言えるだろう。
第二に、SynthID技術自体の完全性も問われる。Google自身も、特にテキストの場合、ウォーターマークが回避される可能性があることを認めている。悪意のある者がウォーターマークを除去したり、検出を困難にする技術を開発したりする「いたちごっこ」に陥る可能性は常に考慮しなければならない。
第三に、AI開発者側の協力体制も不可欠だ。OpenAIは、信頼性や特定ユーザーへのスティグマ化の懸念から、内部のテキストウォーターマーキングツールを公にはリリースしていない。全てのAIモデル開発者が積極的にウォーターマーキング技術を導入し、その検出に協力しなければ、実効性は限定的とならざるを得ない。
第四に、いわゆる「アドホックな」AIコンテンツ検出ツール、つまりウォーターマークに頼らずにコンテンツの特徴からAI生成かどうかを判定しようとする試みは、これまでのところ信頼性が低いことが証明されている。米憲法をAIが書いたと誤判定した事例や、OpenAI自身が自社のAI文章検出ツールの精度不足を理由に提供を中止した事例は記憶に新しい。この事実は、SynthIDのようなウォーターマーキング技術の重要性を裏付ける一方で、ウォーターマークが付与されていないコンテンツに対する無力さも浮き彫りにする。
GoogleがSynthIDのエコシステム構築を急ぐ背景には、AI生成コンテンツの信頼性確保という大義名分に加え、この分野での技術的リーダーシップを確立し、デファクトスタンダードを握りたいという戦略的な意図も透けて見える。これは、かつてGoogleが検索エンジンやAndroid OSで築き上げたエコシステム戦略とも通じるものがあるかもしれない。
信頼できるデジタルコンテンツの基盤構築に向けて
GoogleによるSynthID Detectorの発表は、AIが生成する情報の真偽がますます問われる現代において、歓迎すべき進展であることは間違いない。コンテンツの透明性を高め、悪意のある利用を防ぐための技術的アプローチとして、一定の役割を果たすことが期待される。
しかし、これがAI生成コンテンツにまつわる全ての課題を解決する決定打ではないことも明らかだ。技術的な限界、業界標準の不在、そして何よりも、AI技術の進化のスピードを考えると、SynthID Detectorや類似のツールは、より広範な対策の一部として位置づけられるべきだろう。
今後重要となるのは、ウォーターマーキング技術のさらなる高度化と普及、業界横断的な標準化への取り組み、そして法制度の整備であろう。同時に、私たちユーザー自身も、AIによって生成された情報に批判的に接し、多角的な視点から真偽を判断するメディアリテラシーを向上させていく必要がある。
AI時代のコンテンツ真正性の確保は、技術開発者、プラットフォーム提供者、メディア、そして個々のユーザーが一体となって取り組むべき、継続的な課題なのだ。
Sources