2025年12月10日、インターネットの歴史において、極めて重要な転換点となる技術仕様が正式に公開された。「Really Simple Licensing (RSL) 1.0」である。これは、AI企業がWeb上のコンテンツを無償で収集(スクレイピング)し、自社のモデル学習や回答生成に利用してきた現状に対し、出版社やクリエイターが「待った」をかけ、正当な対価や利用条件を突きつけるための新たな世界標準規格だ。
これまで、AIクローラーに対する防衛策は、事実上「ブロックするか、黙認するか」の二択しかなかった。しかし、RSL 1.0の登場により、Webは「条件付き許可」と「ライセンス料の徴収」という、より高度で成熟した経済フェーズへと移行しようとしている。
RSL 1.0の本質:Robots.txtに「契約書」と「レジスター」を実装する
インターネットの黎明期から存在する「robots.txt」は、検索エンジンのクローラーに対して「ここは入っていい」「ここはダメ」という単純な交通整理を行うためのテキストファイルであった。しかし、生成AIの台頭は、この牧歌的な仕組みを過去のものにした。AIは単にインデックスを作成するだけでなく、コンテンツを「学習」し、それを再構成して出力することで、オリジナルのWebサイトへの流入機会を奪い始めているからだ。
RSL 1.0(Really Simple Licensing)は、このrobots.txtの概念を拡張し、機械可読な「ライセンス層」を追加するプロトコルである。
RSSの系譜を継ぐ「シンジケーション」としてのライセンス
RSLの設計思想には、かつてブログやニュース配信の標準となった「RSS(Really Simple Syndication)」のDNAが色濃く反映されている。実際、RSL Collectiveの共同創設者であり、技術運営委員会の議長を務めるEckart Walther氏は、RSS規格の共同作成者の一人だ。
彼らの洞察は鋭い。「RSSは本来、コンテンツの断片を検索エンジンなどに『ライセンス』するための仕組みだった」という再定義に基づき、RSLはAIに対しても同様の論理を適用する。つまり、コンテンツをAIに提供(シンジケート)する代わりに、対価や条件を要求するというアプローチだ。
技術的実装:3つの新しい制御タグ
RSL 1.0の仕様書によると、XMLベースの語彙を用いることで、出版社は以下のような詳細な制御が可能になる。従来の「Allow/Disallow」に加え、<permits>要素に新たなカテゴリが追加された。
- ai-input(AI学習用データとしての利用):
大規模言語モデル(LLM)のトレーニングデータとしてコンテンツを使用することを許可するか否かを定義する。 - ai-index(RAG/グラウンディング用インデックス):
ここが極めて重要だ。AIがユーザーの質問に答える際、最新情報を参照(グラウンディング)するためにコンテンツを検索・引用することを許可するかどうかを制御する。 - ai-all(包括的な許可):
上記すべてを含む、AIによるあらゆる利用を許可する設定。
この粒度の細かさが革命的である理由は、現在のGoogle検索の抱える矛盾を突いているからだ。現在、Googleは「AIによる概要(AI Overviews)」への表示を拒否しようとすると、従来の検索結果からも除外される可能性があるという「オール・オア・ナッシング」の強硬姿勢をとっている(現在、欧州委員会による独占禁止法調査の対象ともなっている)。RSL 1.0は、「従来の検索結果には表示したいが、AIの学習や生成回答には使われたくない」という出版社の切実なニーズに対する技術的な回答となる。
「強制力」の源泉:インフラ企業による鉄壁の包囲網
規格を作っても、AI企業がそれを無視すれば意味がない。しかし、RSL 1.0が単なる「お願いベース」の宣言と決定的に異なるのは、インターネットのトラフィックを物理的に制御するインフラ企業(CDN/エッジプロバイダー)がバックアップしている点にある。
Cloudflare、Akamai、Fastlyの参画
RSL Collectiveの発表によれば、Cloudflare、Akamai、Fastlyという、世界のWebトラフィックの大部分をさばく主要なCDNベンダーがRSL 1.0のサポートを表明している。これは何を意味するか。
- デジタル・バウンサー(用心棒): 出版社がRSLで「金銭的対価」を条件に設定した場合、これらのCDNがゲートキーパーとして機能する。
- HTTP 402 Payment Required: Cloudflareの製品担当副社長Will Allen氏が言及しているように、AIボットからのリクエストに対し、サーバーは「HTTP 402(支払いが必要)」というステータスコードと共に、RSLで定義されたライセンス条件を返すことが可能になる。
- 技術的な遮断: ライセンス契約を結んでいない、あるいは支払いを済ませていないAIボットのアクセスを、ネットワークのエッジ(末端)で物理的に遮断することができる。
これは、AI企業にとっては悪夢に近いシナリオだ。個々のWebサイトのrobots.txtを無視することは技術的に可能(倫理的・法的には問題だが)でも、CloudflareやAkamaiのレベルでアクセスを遮断されれば、学習データの収集は物理的に不可能となる。
ビジネスモデルの転換:Pay-per-CrawlとPay-per-Inference
RSL 1.0は、単なるブロック機能だけでなく、具体的な収益化モデルも提示している。
- Pay-per-Crawl(クロールごとの課金): AIボットがサイトを巡回し、データを収集する行為そのものに課金するモデル。
- Pay-per-Inference(推論ごとの課金): AIがユーザーへの回答を生成する際に、特定のコンテンツを参照・引用した場合に課金するモデル。
また、非営利団体やクリエイティブ・コモンズ(Creative Commons)との連携により、金銭的な支払いだけでなく、「寄付(Contribution)」を要求するオプションも用意された。これにより、Wikipediaのような「デジタルの共有地(コモンズ)」も、AIによるフリーライドから保護されつつ、持続可能な運営資金を確保する道が開ける。
業界の勢力図:1500以上の組織が結集
この規格の背後には、すでに巨大な支持基盤が存在する。
- メディア・出版社: Yahoo、Ziff Davis、O’Reilly Mediaに加え、The Associated Press(AP通信)、The Guardian、Vox Media、Reddit、USA Today、BuzzFeedなど、質の高いテキストデータを保有する主要プレイヤーが名を連ねている。
- プラットフォーム: Stack Overflowのような、AIのコーディング能力向上に不可欠な高品質なデータを持つプラットフォームも参加している。
- 決済レイヤー: Supertabなどの企業が、AIボットへの請求と支払いを処理する「料金所」としての機能を提供する。
これらの組織が保有するコンテンツは、現在のAIモデルのトレーニングデータの「質」を担保する核心部分である。これらが一斉にRSL 1.0を採用し、スクレイピングを有料化すれば、AI企業は「支払うか、品質を落とすか」の決断を迫られることになる。
AI企業へのインパクトと今後の展望
1. AI企業は「無視」を続けられるか?
当初、GoogleやOpenAI、MetaなどのAI企業は、この動きに対して沈黙を守っている(Ars Technicaの取材に対しても回答を避けている)。彼らはこれまで、「Web上の公開情報は自由に学習に使える」というフェアユースの解釈を盾にしてきた。
しかし、RSL 1.0という「機械可読な意思表示」と「インフラレベルでの遮断」が組み合わさった今、その論理を通すことは難しくなるだろう。RSL CollectiveのDoug Leeds氏が指摘するように、AIモデルは常に「新鮮なコンテンツ」を必要としている。古いデータだけで学習したAIは、急速に陳腐化し、ハルシネーション(誤った情報の生成)のリスクが高まる。AI企業が競争力を維持するためには、最新のニュースや知識へのアクセスが不可欠であり、RSLはそのアクセス権を「商品」に変えたのだ。
2. 検索とAIの境界線の再定義
RSL 1.0が提供する「ai-index」と「ai-input」の分離は、検索エンジンの未来にとって決定的な意味を持つ。Googleは現在、検索とAI生成を融合させようとしているが、出版社側は「検索(トラフィックを送ってくれる)」と「AI生成(トラフィックを奪う)」を明確に区別し始めている。
この規格が普及すれば、Googleは「検索結果には表示させるが、AI Overviewsの回答生成には使わせない」という出版社の要求を技術的に無視できなくなる可能性がある。特にEUなどの規制当局が、この規格を「パブリッシャーの権利行使の標準」として認めれば、法的な強制力すら帯びるかもしれない。
3. 「情報の地産地消」から「情報の正当な取引」へ
筆者は、RSL 1.0の登場を「Webの資本主義化の最終段階」と分析する。これまでWebは、広告モデルを前提とした「閲覧は無料」の世界だった。しかし、AIエージェントは広告を見ない。広告モデルが通用しないAI時代において、情報は「閲覧されるもの」から「処理される資源」へと価値を変えた。資源であれば、採掘権(ライセンス)が必要になるのは経済の必然である。
Webの秩序は保たれるか
RSL 1.0は、AIによる無秩序なデータ収奪に対する、Web側からの最も組織的かつ技術的に洗練された反撃である。これは単なる「ブロック機能」ではなく、AIと人間が共存するための「新しい契約」の提案だ。
もしAI企業がこの規格を受け入れ、適正な対価を支払うエコシステムが成立すれば、ジャーナリズムやコンテンツ制作は持続可能性を取り戻すかもしれない。逆に、これを無視して技術的ないたちごっこ(スクレイピング対ブロック)に突入すれば、Webは分断され、AIの性能も頭打ちになる「共倒れ」の未来が待っている。
「タダより高いものはない」という古くからの格言が、AI時代のインターネットにおいて、これほど重みを持って響く局面はないだろう。RSL 1.0の普及スピードと、それに対するGoogle等の巨人の次の一手が、2026年以降のデジタル社会の在り方を決定づけることになる。
Sources