2026年1月15日、インターネットインフラの大手Cloudflareは、英国を拠点とするAIデータマーケットプレイス企業「Human Native」の買収を発表した。

この動きは、生成AIの台頭によって崩壊の危機に瀕していた「Webの経済モデル」を根本から再構築しようとする、野心的な試みだ。コンテンツクリエイターが作成したデータが、対価なしにAIの学習に利用される現状(いわゆる「AIのナップスター時代」)を終わらせ、構造化された高品質なデータを適正な価格で取引できるインフラを整備することを目指すことになりそうだ。

AD

「ただ乗り」から「公正な取引」へ:買収の背景にある危機

CloudflareによるHuman Native買収の核心を理解するためには、まず現在インターネットが直面している構造的な欠陥を理解する必要がある。

崩壊する「トラフィックと広告」の交換モデル

過去30年以上にわたり、オープンなインターネットはシンプルな「価値交換」の原則によって支えられてきた。クリエイターやパブリッシャーはコンテンツを無料で公開し、Googleなどの検索エンジンやSNS(アグリゲーター)がそこにトラフィック(閲覧者)を送る。クリエイターはそのトラフィックを広告やサブスクリプションによって収益化する、というエコシステムである。

しかし、生成AIの登場がこのバランスを劇的に破壊しつつある。

AIボットやクローラーは、Webサイト上の情報を大量に収集(スクレイピング)し、AIモデルの学習に使用する。ここでの最大の問題は、AIボットは広告をクリックせず、サブスクリプションにも登録しないという点だ。さらに、検索ユーザーがAIによる要約回答だけで満足し、元のWebサイトを訪れなくなる「ゼロクリック検索」が増加することで、クリエイターへの還元は限りなくゼロに近づいている。

Cloudflareのデータによると、一部のサイトでは「クロール(収集)対 リファラル(送客)」の比率が異常な数値を示しており、 人間の訪問者1人に対し、何万ものAIボットがアクセスしているケースも確認されている。これはWebサイト運営者にとって、サーバーコストの増大と収益の激減という二重苦を意味する。

Human Nativeが解決する「非構造化データ」の課題

ここで登場するのが、英国のスタートアップHuman Nativeだ。同社は、単にデータを売買する場所を提供するだけではない。彼らの真価は、Web上の「非構造化データ」をAIが理解しやすい「構造化データ」に変換する技術にある。

Web上の情報の多くは、人間が読むためにデザインされたテキスト、画像、動画などのマルチメディアコンテンツであり、そのままではAIの学習データとして非効率である場合が多い。Human Nativeは以下のプロセスを通じて、コンテンツの価値を最大化する。

  1. インデックス化とクリーニング: 乱雑なWebコンテンツからノイズを除去し、整理する。
  2. 正規化と構造化: AIが処理しやすい形式にデータを変換する。
  3. ライセンス管理: 著作権や利用条件を明確に紐づける。

この技術により、AI開発者は「法的な不確実性のあるスクレイピング」に頼ることなく、権利関係がクリアで、かつ高品質な学習データを、適正な対価を支払って入手することが可能になる。これは、AI開発における「Garbage In, Garbage Out(ゴミを入れればゴミが出てくる)」問題を解決し、幻覚(ハルシネーション)の少ない高性能なモデルを構築するためにも不可欠な要素だ。

Cloudflareが描く「AI時代の新たなインフラ」

Cloudflareはこの買収により、自社の巨大なネットワークインフラとHuman Nativeのデータ処理技術を融合させ、コンテンツプロバイダーとAI開発者の双方にメリットのあるプラットフォームを構築しようとしている。

「Pay Per Crawl」と「AI Crawl Control」の強化

Cloudflareは既に、Webサイト運営者がAIボットのアクセスを制御できる「AI Crawl Control」や、ボットのアクセスに対して課金する「Pay Per Crawl」といった機能の開発を進めていた。Human Nativeの買収は、この戦略を加速させる。

これまでのWebは、ボットが勝手にやってきて情報を持ち去る「プル(Pull)型」の情報収集が主流だった。しかしCloudflareが目指すのは、コンテンツが更新されるたびに、契約したAI開発者へ自動的に構造化データが配信される「プッシュ(Push)型」、あるいは「Pub/Sub(パブリッシュ/サブスクライブ)モデル」への転換である。

これにより、以下のメリットが生まれる。

  • クリエイター側: コンテンツの使用をコントロールし、使用量に応じた対価(ロイヤリティ)を得られる。
  • AI開発者側: スクレイピングという非効率で不安定な手段を使わず、常に最新かつクリーンなデータを自動的に入手できる。また、著作権侵害訴訟のリスクを回避できる。
  • インフラ側: 無駄なクローラーの巡回が減り、インターネット全体のトラフィック負荷が軽減される。

Coinbaseとの連携:x402による「マシン間決済」

この構想を実現するためには、人間がクレジットカード番号を入力するような従来の決済システムでは不十分である。AIエージェントが自律的にデータを購入し、マイクロペイメント(少額決済)を瞬時に実行する仕組みが必要となる。

Cloudflareはこの点においても布石を打っている。同社は暗号資産取引所大手Coinbaseと共同で「x402 Foundation」を設立している。これは、機械同士(Machine-to-Machine)の自動決済を可能にするための規格策定とインフラ構築を目指すものだ。Human Nativeのマーケットプレイス機能は、この自動決済インフラの上で稼働する、最初の主要なアプリケーションの一つになると考えられる。

AD

この買収が持つ重要性

今回の買収は、単なるビジネスニュースの枠を超え、情報科学および社会システムの観点からも極めて重要な転換点を示唆している。

情報のエントロピーと「データの質」

情報理論の観点から見れば、インターネット上のデータはエントロピー(無秩序さ)が増大し続けている。生成AIがWeb上のデータを学習し、そのAIが生成したコンテンツが再びウェブに溢れることで、データセットが汚染される「モデル崩壊(Model Collapse)」のリスクが指摘されている。

Human Nativeのような「データを精製・構造化するフィルター」をインフラレベルで組み込むことは、インターネットという巨大な知のデータベースの品質を維持し、AIの進化を持続可能なものにするための、科学的な防衛策とも言える。これは、石油を精製してガソリンにするように、原油(生データ)を燃料(学習データ)に変えるための「製油所」をインターネット上に建設する行為に等しい。

「共有地の悲劇」の回避

経済学における「共有地の悲劇」は、誰もが自由に利用できる資源(共有地)は、乱獲によって枯渇してしまうという概念だ。現在のWeb上のデータは、まさにこの共有地の悲劇に直面している。AI企業による無秩序なスクレイピングは、コンテンツを生み出すクリエイターという土壌を枯渇させようとしている。

CloudflareのMatthew Prince CEOが述べる「インターネットの寿命を守るためのツール」とは、この共有地に柵を設け、適切に管理・肥料(対価)を与えることで、永続的なエコシステムを再構築しようとする試みである。これは、インターネットが「情報の自由な流通」という理想を維持しつつ、持続可能な経済活動の場として成熟するための不可欠なステップだ。

今後の展望と課題

Human Nativeの技術とチームを取り込んだCloudflareは、今後、AI開発者とコンテンツクリエイターの間を取り持つ「主要な仲介者」としての地位を確立しようとするだろう。

検索エンジンの変容

この動きは、Googleなどの従来の検索エンジンのあり方にも変革を迫る可能性がある。Webサイトが「人間に見せるためのページ」と「AIに売るためのデータフィード」を明確に区別し始めれば、検索エンジンのクローラーがアクセスできる情報は変化するかもしれない。また、AIエージェント自体が、検索エンジンを介さずに直接Cloudflareのネットワークを通じて情報を取得する未来も想像できる。

クリエイターへの還元は実現するか

最大の課題は、実際にこのシステムが広く普及し、末端のクリエイターまで十分な収益が還元されるかという点だ。大手メディア企業は個別のライセンス契約を結ぶ力があるが、個人のブロガーや中小規模のパブリッシャーが、この新しいエコシステムの恩恵を受けられる仕組み(ロングテールへの対応)をどれだけ整備できるかが、Cloudflareの腕の見せ所となるだろう。

AD

インターネットの「第4の幕」

Matthew Prince CEOは、Cloudflareの次のフェーズを「インターネットの第4の幕」と位置づけている。それは、コンテンツクリエイターが報われ、Webのビジネスモデルが進化し続ける未来だ。

Human Nativeの買収は、AIによる一方的な搾取構造に終止符を打ち、「創造(Creation)」「構造化(Structuring)」「補償(Compensation)」という新たなサイクルの起点となる可能性を秘めている。我々は今、インターネットが単なる情報の閲覧場所から、知能(AI)を育むための、公正かつ高度に組織化された「巨大なニューラルネットワークの供給源」へと変貌を遂げる、その歴史的な瞬間に立ち会っているのかもしれない。


Sources