PerplexityがCloudflareから告発された理由は何ですか？

robots.txtによる拒否設定を無視し、身元を隠してWebサイトの情報を収集する「ステルス戦術」を用いた疑いがあるため。

Perplexityがブロックを回避するために用いた具体的な手口は？

ブラウザの偽装、公式外のIPアドレスの使用、ASN（自律システム番号）の変更など、正体を隠す複数の技術を駆使している。

robots.txtとはどのような役割を持つものですか？

Webサイト運営者がクローラーに対し、収集を許可する範囲を伝えるための1994年から続く「紳士協定」である。

CloudflareはPerplexityの疑惑に対してどのような措置を取りましたか？

Perplexityを認証済みボットから除外し、そのステルスクローリングをブロックするルールを全顧客に提供開始した。

AIによるスクレイピングの急増がWebサイト運営に与える影響は？

運営者にサーバー負荷を強いる一方で、サイトへのトラフィックをもたらさない「寄生的な関係」が懸念されている。

テクノロジー

AI検索エンジンPerplexityによる掟破りのステルス・スクレイピング疑惑をCloudflareが告発：Webサイト運営者のブロックを巧妙に回避

Y Kobayashi2025年8月5日更新: 2026年4月6日

約 7 分

この記事のポイント

### Editorial Brief
**何が起きた:**
Cloudflareは2025年8月4日、AI検索のPerplexityがrobots.txtによる拒否設定を回避するため、ブラウザ偽装やIPアドレス変更等のステルス戦術を用いていると告発した。
**なぜ重要か:**
Webの信頼を支える30年来の紳士協定が組織的に破られたことで、AI企業とコンテンツ制作者の共存関係が崩壊し、オープンなWebの衰退や法的規制の強化を招く恐れがある。
**次に見るべき点:**
Perplexityによる関与の事実確認や、Cloudflareが提供を開始したブロック機能の有効性、およびOpenAI等の他社が同様の回避策を講じていないかの検証が注目される。

AI検索エンジンPerplexityによる掟破りのステルス・スクレイピング疑惑をCloudflareが告発：Webサイト運営者のブロックを巧妙に回避

AI検索エンジンPerplexityが、Webサイトのクロール拒否設定を意図的に回避するため、身元を隠す「ステルス戦術」を用いていると、ネットワーク大手Cloudflareが告発した。これは30年以上続くインターネットの信頼の根幹を揺るがす行為であり、生成AIの倫理が再び厳しく問われることになりそうだ。

暴かれた「ステルスクローラー」の巧妙な手口

Cloudflareが2025年8月4日に公開したブログ記事は、AI企業の倫理観が、どこか世間のそれとかけ離れているのではと考えさせられる内容だ。同社によれば、複数の顧客から「robots.txtファイルやファイアウォールでPerplexityのクローラーをブロックしているにもかかわらず、コンテンツがアクセスされ続けている」という苦情が寄せられたことが調査のきっかけだったという。

robots.txtとは、Webサイト運営者が検索エンジンなどのクローラー（自動巡回プログラム）に対し、どのページを収集してよいかを伝えるための、Webの黎明期から存在する「紳士協定」である。

Cloudflareが検証のために実施したテストは、その手口の巧妙さを浮き彫りにした。まず彼らは外部からアクセスできない新規ドメインを用意し、robots.txtですべてのクローラーを拒否する設定を施した。にもかかわらず、Perplexityにそのドメインに関する質問を投げかけると、制限されているはずのコンテンツに基づいた詳細な回答が生成されたのだ。

Cloudflareの分析によると、Perplexityは二段構えの戦術を用いていた。

第1段階：公認クローラーでのアクセス

まず、PerplexityBotやPerplexity-Userといった公式に宣言されたクローラーでアクセスを試みる。この段階でサイト側がブロックしていることを検知すると、次の段階へ移行する。

第2段階：ステルスクローラーの投入

ここからが問題の核心だ。Perplexityは、正体を隠した「ステルスクローラー」を投入する。このクローラーは、以下のような複数の技術を駆使してブロックを回避していた。

ユーザーエージェントの偽装: 自身をボットではなく、macOS上で動作する一般的な「Google Chromeブラウザ」であるかのように偽装する。
IPアドレスのローテーション: Perplexityが公式に公開しているIPアドレス帯域外のものを複数使用し、ブロックを避けるためにそれらを次々と切り替える。
ASN（自律システム番号）の変更: さらに追跡を困難にするため、IPアドレスの管理母体であるASNまでも変更していたという。

Cloudflareによれば、このステルス活動は数万のドメインにわたり、1日あたり数百万リクエストという膨大な規模で観測された。まさに、Webサイト運営者の意思を組織的に踏みにじる行為と言っていいだろう。

インターネットの「紳士協定」を揺るがす行為

この問題の根は深い。robots.txtは、1994年に提唱されて以来、法的拘束力はないものの、Webの健全な発展を支えてきた重要な規範だ。 Googleをはじめとする主要な検索エンジンは、このプロトコルを尊重することで、Webサイト運営者との信頼関係を築いてきた。

しかし、生成AIの登場がこのバランスを崩し始めている。AIモデルの学習や、PerplexityのようなAI検索が用いるRAG（検索拡張生成）技術は、膨大な最新データを必要とする。ボット対策企業TollBitの報告によれば、robots.txtを無視するボットの割合は2025年第1四半期に3.3%から12.9%へと急増。特にRAG目的のスクレイピングは、学習目的のそれを上回る勢いで増加しているという。

この「寄生的な関係」は、コンテンツ制作者にサーバーコストを負担させながら、見返りであるはずのサイトへのトラフィックをもたらさない。 TollBitの調査では、サイトへのアクセス1回あたりのスクレイピング回数は、Perplexityが369回、Anthropicに至っては8692回にものぼるという衝撃的なデータも示されている。

Perplexityの反論と拭えぬ過去の疑惑

一連の告発に対し、Perplexityの広報担当者はTechCrunchやThe Vergeの取材に応じ、Cloudflareの報告を「セールスピッチ」「宣伝行為」と一蹴。さらに、「ブログで指摘されたボットは我々のものではない」とまで主張している。

しかし、Perplexityがこうした疑惑の目を向けられるのは初めてではない。昨年には、ForbesやWiredといったメディアが、自社の記事が盗用された疑いがあると強く批判。 Wiredは、不審なIPアドレスからのトラフィックがrobots.txtを無視していることを指摘していた。また、RedditのCEO Steve Huffman氏も、Perplexityを含む複数のAI企業が「インターネット上の全コンテンツを自由に使えるものと考えている」と名指しで批判している。

過去の経緯を鑑みれば、今回のCloudflareの告発に信憑性を見出す向きは少なくないだろう。

AIとコンテンツの未来を巡る攻防の序章

筆者はこの問題を単なる一企業の不正行為として片付けるべきではないと考える。これは、生成AIという新しいテクノロジーと、既存のインターネットのエコシステムとの間に生じた、構造的な摩擦の象徴だ。

注目すべきは、Cloudflareの対応である。同社はPerplexityを「認証済みボット」のリストから除外しただけでなく、このステルスクローリングをブロックするルールを全顧客に提供開始した。これは、インフラ事業者というプラットフォームが、AIによる無秩序なデータ収集に対して、明確な「否」を突きつけ始めたことを意味する。

対照的に、CloudflareはOpenAIのクローラーを「ベストプラクティスに従っている」と評価している。これは、AI企業の中でもデータ収集に対する倫理観に大きな隔たりがあることを示唆している。

今回の事件は、Webの未来を左右する大きな問いを我々に投げかけている。このまま無法地帯が続けば、質の高いコンテンツはペイウォールの内側に閉じこもり、オープンなWebはAIが生成した真偽不明の「合成スロップ」で埋め尽くされる未来も、決して絵空事ではないのではないか？

技術による防衛（Cloudflareの対策など）と、業界標準や法整備といったルールの確立。その両輪が揃わなければ、我々が知る豊かで多様なインターネットは、その姿を大きく変えてしまうだろう。AIとコンテンツホルダーの共存共栄に向けた、長く困難な交渉の幕が、今まさに上がったのではないだろうか。

Sources

Cloudflare: Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives

テーマ

この記事はいかがでしたか？

一緒に読みたい・使いたいアイテム

※本リンクから購入いただくと、当サイトの運営・記事制作費に充てられます（Amazonアソシエイト参加）

↑ トップへ戻る

// 次に読む

毎分39,000リクエストのAIボットがWebサイトを侵食、Meta・OpenAIが引き起こす新たなWeb経済危機

AI検索エンジンPerplexityによる掟破りのステルス・スクレイピング疑惑をCloudflareが告発：Webサイト運営者のブロックを巧妙に回避

暴かれた「ステルスクローラー」の巧妙な手口

第1段階：公認クローラーでのアクセス

第2段階：ステルスクローラーの投入

インターネットの「紳士協定」を揺るがす行為

Perplexityの反論と拭えぬ過去の疑惑

AIとコンテンツの未来を巡る攻防の序章

関連する事物

テーマ

この記事はいかがでしたか？

RTX 3090の限界を「RTX 3050」が突破する。Lossless ScalingがもたらしたデュアルGPUの革命

超伝導体と特殊合金の製造を支えるゼノタイム鉱石がアイダホ州の山地で注目される理由

MicronがAppleの中国製メモリ調達案に反対、価格と米国増産を巡り攻防

SamsungがFoldを二分、Fold8 Ultraと新型Fold8の価格差を読む

リチウムイオンの移動速度が最大1万倍に？次世代全固体電池の設計指針を変える分子レベルの新発見

超伝導体と特殊合金の製造を支えるゼノタイム鉱石がアイダホ州の山地で注目される理由

リチウムイオンの移動速度が最大1万倍に？次世代全固体電池の設計指針を変える分子レベルの新発見

Appleが値切ったメモリ価格のツケ、AI特需で1300ドルの値上げとなって回ってきた

RTX 3090の限界を「RTX 3050」が突破する。Lossless ScalingがもたらしたデュアルGPUの革命

液体と微粒子が計算機になる：流体力学を利用した新しい並列情報処理の形とは

暴かれた「ステルスクローラー」の巧妙な手口

第1段階：公認クローラーでのアクセス

第2段階：ステルスクローラーの投入

インターネットの「紳士協定」を揺るがす行為

Perplexityの反論と拭えぬ過去の疑惑

AIとコンテンツの未来を巡る攻防の序章

関連する事物

テーマ

この記事はいかがでしたか？

関連記事

毎分39,000リクエストのAIボットがWebサイトを侵食、Meta・OpenAIが引き起こす新たなWeb経済危機

40年ぶりの大革命：「空気」で光ファイバーの大幅な速度向上を実現。Microsoftが拓く超高速通信の未来

Firefox、Google依存脱却への静かな一手か？ Perplexity AIを次世代検索エンジンとして試験導入