The New York TimesとOpenAI、Microsoftの著作権訴訟で、争点の置き方が変わり始めた。NYTは2026年6月25日、ニューヨーク南部地区連邦地裁に第三修正訴状案の提出を認めるよう申し立てた。中心にあるのは、MicrosoftがOpenAIに提供したAzure上のスーパーコンピュータを、計算資源の提供にとどまらず、著作権侵害を促し、その実行に合わせて作られた仕組みとして位置づけ直す主張である。
この動きは、AI学習に使われたデータだけをめぐる争いではない。NYTは、OpenAIが記事を無断で学習に使ったという従来の主張に加え、Microsoftがその学習を可能にする基盤を設計・運用し、製品展開で利益を得たという構図を前面に出している。裁判所がこの修正を認めれば、生成AI訴訟の焦点は、モデル開発企業のスクレイピングや出力だけでなく、それを支えるクラウド基盤と商用展開の責任にも広がる。
Cox判決後、寄与侵害の入口が狭くなった
NYTが訴状を組み直そうとしている直接の理由は、2026年3月25日のCox Communications, Inc. v. Sony Music Entertainment判決にある。NYTの申立書によれば、同判決は寄与著作権侵害の基準を組み替え、サービス提供者の責任を認めるには、そのサービスが侵害に使われることを意図していたと示す必要がある。意図は、侵害を誘引したか、サービスが侵害に合わせて作られていたかによって示される。
このためNYTは、Microsoftに対する寄与侵害の主張を、従来の「重要な支援」から、Cox判決に沿う「誘引」と「侵害に特化したツール」の主張へ切り替えた。申立書では、OpenAIとMicrosoftはすでに問題の主張に関わる証拠を提出済みで、NYTは追加の証拠開示を求めないとしている。訴訟を長引かせるための新しい探索ではなく、既存の証拠を新しい法的基準に当てはめる手続きだ、という立て付けである。
同時にNYTは、別ルートの寄与侵害請求と商標希釈の請求を自主的に取り下げることも求めた。訴訟全体を広げるより、Microsoftのクラウド基盤とOpenAIの学習・出力を結ぶ主張に絞る動きだ。ただし、第三修正訴状はまだ「案」であり、裁判所が提出を認めたわけではない。
「専用設計」の公開事実に、NYTが侵害目的の主張を重ねた
MicrosoftがOpenAI向けに大規模な計算基盤を作ったこと自体は、新しく出てきた事実ではない。Microsoftは2020年5月、Azure上にOpenAI専用のスーパーコンピュータを構築したと発表している。このシステムはOpenAIと共同で作られ、同社のAIモデルを訓練するために設計されたものだと説明されていた。Microsoftは当時、28万5000以上のCPUコア、1万基のGPU、GPUサーバーごとに400Gbpsのネットワーク接続を備え、公開されているスーパーコンピュータの中で上位5位に入る規模だとしていた。
NYTの第三修正訴状案は、この公開済みの説明を出発点にしつつ、法的な意味づけを大きく変えている。訴状案は、MicrosoftがOpenAIのGPT-1以後のモデル訓練に使われたスーパーコンピューティングシステムをOpenAIと共同で設計し、その基盤を管理していたと主張する。そのうえで、基盤はOpenAIが自由に使う汎用のクラウドではなく、NYT作品を多く含むインターネット上のテキストを使い、最も高性能なLLMを訓練する目的で作られたと位置づけている。
ここで分けて読むべきなのは、Microsoft自身が認めている事実と、NYTが訴訟上で加えた主張である。Microsoftの2020年発表から確認できるのは、OpenAI専用に設計された大規模訓練基盤がAzure上にあり、OpenAIのモデル訓練を支えたという点だ。一方、NYTが新たに押し出しているのは、その基盤が著作権侵害を意図して作られ、Times Worksを不均衡に含むデータ選別と結びついていたという評価である。これは裁判所が認定した事実ではない。
学習データ、出力、検索統合が一つの主張に束ねられた
第三修正訴状案は、Microsoftの計算基盤だけを単独で問題にしているわけではない。NYTは、学習データの収集、モデルへの記憶、ChatGPTやBing Chat、Browse with Bingでの出力、さらにMicrosoft製品への組み込みを一つの連続した商用利用として描いている。訴状案では、GPT-2のWebTextデータセットでNYTimes.comがドメイン別で5位、33万3160件だったとされ、GPT-3以降の学習にもCommon Crawl、WebText、WebText2などを通じて多数のNYT作品が含まれたと主張している。
NYTが市場への損害として重視するのは、学習時のコピーだけではない。訴状案は、GPT-4がNYT記事の相当部分をほぼそのまま出力した例、ユーザーがペイウォールを迂回する意図を示したプロンプトに応じて記事本文を出した例、Bing ChatやBrowse with Bingが検索結果を合成する過程でNYT記事を長く引用または言い換えた例を挙げる。実在しないNYT記事や同紙が書いていない内容を同紙に帰属させた例も、ブランドと読者の信頼を傷つけるものとして扱っている。
この構成で目を引くのは、NYTが「モデルが記事を覚えた」ことと「検索や製品で記事へのアクセスを置き換えた」ことを同じ被害の流れに置いている点だ。NYTは、有料購読、ライセンス、広告、Wirecutterのアフィリエイト収益が、AI出力によって直接の訪問や購読へつながらなくなると主張する。生成AIが検索結果や回答画面で本文を要約し、リンクを踏む動機を弱めるなら、出版社側の損害は学習データ利用料だけで測れない、という考え方である。
MicrosoftとOpenAIの公開説明は、同じ事実を別の意味に置く
MicrosoftとOpenAIの過去の発表をたどると、NYTがなぜAzure基盤を争点に据えたのかが見えてくる。2019年の提携発表でMicrosoftはOpenAIに10億ドルを投資し、Azure上に大規模AIシステムを作るとした。2023年には複数年・数十億ドル規模の投資を発表し、AzureがOpenAIの研究、製品、APIの全ワークロードを支える独占クラウドプロバイダーになると説明した。OpenAIも同年、Microsoftと複数のAzureスーパーコンピューティングシステムを構築し、すべてのモデルの訓練に使っていると述べている。
この公開説明は、Microsoft側にとってはAIインフラ事業と製品展開の成功を示す材料である。2023年のMicrosoft発表は、Azure OpenAI Service、GitHub Copilot、DALL-E 2、ChatGPTを、OpenAIモデルとAzure基盤の成果として並べている。MicrosoftがOpenAIの専用計算基盤を作り、モデルを自社製品へ広げたことは、同社が隠してきた話ではない。むしろAIプラットフォーム戦略の中核として公表してきた。
NYTの訴状案は、その同じ公表事実を責任論の入口に変える。MicrosoftがGPUを貸す立場を超えて、OpenAIのモデル訓練に合わせて基盤を設計・運用し、得られたモデルをBing ChatやMicrosoft 365 Copilotなどへ組み込んだのなら、著作権侵害の成否はOpenAIだけの問題ではない、という主張である。Cox判決後の基準では、MicrosoftがOpenAI向け基盤をどの目的で設計したかを具体的に示せるかが問われる。
OpenAIは2024年1月に公開した「OpenAI and journalism」で、NYTの訴訟には根拠がないと反論していた。公開インターネット資料を使ったAI訓練はfair useであり、ニュースは訓練データ全体のごく一部だと説明した。記事本文の逆流出については、記憶の再現はまれな不具合で、意図的に再現を誘導する使い方は利用規約に反するとしている。今回の修正についても、OpenAIはfair useの立場を維持した。Microsoftは、問題の主張は約1年の証拠開示で調べられており、裏づけられていないと反論している。
次の争点は、AI基盤がどこまで「中立な道具」と見なされるかだ
今回の申立てが持つ意味は、AI著作権訴訟の射程をモデルを作った企業から、それを支えるインフラ企業へ広げる可能性にある。クラウド基盤は通常、顧客がさまざまな用途に使う中立的なサービスとして扱われる。しかしNYTは、MicrosoftのOpenAI向けシステムについて、汎用サービスではなく、OpenAIのLLM訓練に合わせて作られた専用基盤だと主張する。Cox判決後の枠組みでは、この「専用性」がMicrosoftの意図を示す材料になるかが争われる。
NYTが求める救済も広い。第三修正訴状案は、将来の侵害を止める差止めに加え、Times Worksを組み込んだGPTその他のLLMモデルと訓練セットの破棄を17 U.S.C. 503(b)に基づいて求めている。これは請求であって、裁判所が認めた結論ではない。それでも、出版社側がAIモデルそのものを成果物として問題にし、削除や再訓練に踏み込む救済を求めていることは、AI企業とクラウド企業にとって無視しにくいリスクである。
裁判所がNYTの第三修正訴状案を認めれば、MicrosoftのAzureスーパーコンピュータは、AIインフラの成功例ではなく、著作権侵害の意図や設計をめぐる証拠として検討される。退けられれば、Cox判決後の寄与侵害主張をAI訴訟へ持ち込む難しさが浮き彫りになる。この訴訟が問い続けているのは、生成AIの著作権問題を「何を学習したか」から「誰が、どの基盤を、何のために作ったか」へ押し広げられるかどうかだ。