ニューヨーク連邦地裁のColleen McMahon判事は、ニュースサイトRaw StoryとAlterNetがOpenAIに対して提起した著作権管理情報(CMI)に関する訴訟を棄却した。この判決は、AI企業による著作物の学習利用に関する重要な法的先例となる可能性がある。
訴訟の核心と判決の要点
本訴訟は2024年2月、Raw StoryとAlterNetが、OpenAIがChatGPTの学習データセット構築において数千点の記事を使用した際、著作権管理情報を違法に除去したとして提起したものである。原告らは、Digital Millennium Copyright Act(DMCA)で保護されている著者名や記事タイトルなどのCMIが除去されたことにより「具体的な損害」が発生し、さらにChatGPTが著作権で保護された内容を逐語的あるいはほぼ逐語的に再現するリスクがあると主張していた。
McMahon判事は判決において、複数の重要な法的見解を示した。第一に、原告らの記事に含まれる事実的情報そのものには著作権が及ばないことを指摘。第二に、ChatGPTのような大規模言語モデルが情報を処理する方法について、単なる複製ではなく、大量のデータから関連情報を合成して回答を生成するプロセスであることを認定した。
特筆すべきは、判事が過去にChatGPTが文章を逐語的にコピーした事例についても言及し、これが現行バージョンでは再現できない「まれなバグ」であるとするOpenAIの主張を支持した点である。この判断は、AI開発における技術的特性を法的判断に反映させた重要な先例となる。
判決の意義と今後への影響
この判決は、AIの開発における「公正使用(フェアユース)」の概念を支持する重要な先例となる可能性がある。OpenAIは声明で「公的に入手可能なデータを、フェアユースと関連原則によって保護された方法で使用している」と主張している。
ただし、McMahon判事は原告らに修正した訴状の提出を認めており、「なぜ修正が無意味でないかの説明」を付すことを条件としている。
この判決の影響は、現在進行中の他の著作権訴訟にも波及する可能性がある。特に、New York Times紙がOpenAIとMicrosoftに対して提起している「数百万件の記事を無断使用した」とする訴訟や、8つのニュース媒体による類似の訴訟にも影響を与えると予想される。
また、イギリスの出版社協会が指摘する「Books3データベースに含まれる12万件の海賊版書籍がAIモデルに取り込まれている」という問題など、グローバルな文脈での著作権議論にも影響を及ぼす可能性がありそうだ。
Xenospectrum’s Take
本判決は、AI開発における著作物利用に関する法的解釈の転換点となる可能性がある。特に重要なのは、判事がAIによる情報処理を「合成的プロセス」として認定した点である。これは、従来の著作権法における「変形的利用」の概念をAI時代に適応させる試みとして評価できる。
しかし、この判決は著作権管理情報の除去という特定の争点に関するものであり、AI開発における著作物利用全般の適法性を確定したものではない。今後も、以下の課題が残されている:
公正利用の範囲の明確化については、AI開発におけるデータ使用と創作者の権利保護のバランスをどのように図るかという根本的な問題が依然として存在する。また、AI生成コンテンツの品質向上に伴い、著作物の「実質的類似性」の判断基準も再検討が必要となるだろう。
イノベーションと権利保護の調和について、この判決を契機に、AI開発者と著作権者の間で新たな協力モデルが模索される可能性がある。特に、データ使用に関する透明性の確保や、適切な補償メカニズムの構築が重要な検討課題となるだろう。
Sources
コメント