Adobeが“法的にも、倫理的にも健全である”として宣伝しているAI画像ジェネレーター「Firefly」が、トレーニングデータに、同じくAI画像ジェネレーター「Midjourney」や、その他の生成AIが作成した“合成データ”を用いていた可能性をBloombergが報じている。
Adobeは、Fireflyを売り出す際に、“自社が権利を所有するかパブリックドメインにあるコンテンツのみを使用してトレーニングしている”と主張し、このアプローチがMidjourneyのような競合他社との差別化につながると強調していた。これは、生成AIの著作権法上の問題や倫理的な問題を回避する上でも重要な要素であり、少なからずこれに安心してFireflyを使用していたユーザーもいたであろう事から、もし事実であれば由々しき事態だ。
Bloombergは、Adobeのディスカッショングループ「Discord」での発言を引用して、Adobeが競合他社であるMidjourneyのAI生成画像を使用してFireflyのAIをトレーニングしたと報じている。同紙によると、Midjourneyからのものを含め、AIが生成した画像はFireflyのトレーニングデータの約5%を占めているという。
Fireflyには、Adobeのストックデータベースを経由してAI生成データがトレーニングデータとして入りこんだようだ。これらのAI画像は以前からアップロードされ販売されていたという。
Adobeの広報担当者がBloombergに語ったところによると、AIが生成した画像を含め、Adobe Stockにアップロードされた画像はすべて、著作権で保護されたコンテンツ、商標、キャラクター、ロゴ、アーティスト名が含まれていないことを確認するための厳格なモデレーションプロセスを経ているという。だが、実際のところAI生成の画像はFireflyのトレーニングから特に除外されていなかったようだ。
AdobeのWebサイトには、Fireflyはライセンスされたデータや自由に利用できるデータのみをトレーニングの対象とすることで、クリエイティブ・コミュニティを尊重していると記載されている。
そして、Adobeは、自社のストックデータベースの素材のみを使用してFireflyのトレーニングを行ったと述べており、発言と行動の整合性は正しい。しかし、同社のストックデータベースから選択されたトレーニングデータの5パーセントが、現在、法的・倫理的背景が不明確なAI画像から得られているという事実を隠している点で、Adobeは完全には透明ではない。
このケースは、AIのトレーニング教材に間接的に組み込まれ、著作権ではなく使用権しかないAI生成コンテンツをめぐる倫理的・法的議論の複雑さを物語る事例だろう。
このような慣行の法的意味は、ほとんど未解決のままである。Midjourney自身も、そのジェネレーターがトレーニング教材をほぼそのままコピーしたような画像を生成することがあるという事実について批判を受けている。
またそもそも、AdobeがMidjourneyの画像をAIトレーニングに使用すること自体も、Midjourneyのサービスによって生成された画像をAIモデルのトレーニングに使用することを禁止している利用規約に違反していることもまた新たな問題となりそうだ。
Sources
コメント