生成AI開発の最前線において「安全性第一(safety-first)」を標榜してきたAnthropicが、自らの根幹を揺るがす重大な情報流出インシデントを引き起こした。同社のコンテンツ管理システム(CMS)における設定ミスにより、未発表の次世代最上位AIモデル「Claude Mythos」の存在、さらには同モデルが内包する深刻なサイバーセキュリティリスクを示す内部文書がパブリックアクセス可能な状態で放置されていた事実が判明したのだ。Fortuneの報道および複数のセキュリティ研究者の指摘により明るみに出たこの事態は、単なる新製品のリークにとどまらず、AI開発企業におけるデータガバナンスの脆弱性と、急激に進化するAIモデルがもたらす社会的な脅威を浮き彫りにしている。
なぜ今、流出が起きたのか:CMSの設定ミスという「ありふれた」失敗
Fortune誌がこの流出を発見したきっかけは、Anthropicが使用するコンテンツ管理システム(CMS)の設定ミスに起因する。
同社のCMSでは、デジタルアセットが「デフォルトで公開状態」に設定されており、ユーザーが明示的にプライバシー設定を変更しない限り、アップロードされたファイルには公開アクセス可能なURLが自動的に割り当てられる仕組みになっていた。この構造上の特性を見過ごしたことで、画像・PDF・音声ファイルを含む約3,000件のアセットが、パブリックに検索・閲覧可能な状態でインターネット上に残留していた。
LayerX Securityの上級AIセキュリティ研究者であるRoy Paz氏とケンブリッジのサイバーセキュリティ研究者Alexandre Pauwels氏が、Fortune誌の依頼でこの公開データに対する独立した技術的評価を実施した。二人は、流出コンテンツがAnthropicのブログインフラと連動した構造化データであり、公開を意図した製品ランチドキュメントの体裁を持つことを確認している。
技術的な観点からすれば、この種のクラウドインフラにおける「デフォルト公開」設定の見落としは珍しいものではない。AWS S3バケットの誤設定やAzure Blob Storageの不適切なアクセス制御は、セキュリティ業界では「防ぎやすいが頻発する脆弱性」として長年記録されてきた。問題なのは、この種の初歩的なオペレーションセキュリティの不備が、国家安全保障にまで波及しうるフロンティアAIを開発する企業で発生した、という事実だ。
Anthropicは同誌の連絡を受けた翌朝、データストアへのパブリック検索アクセスを遮断した。その対応速度は迅速だったが、それ以前にどの第三者が当該データにアクセスしていたかについては、公式に開示されていない。
「Capybara」という新たな階層:Opusを超えた力
公開されたドラフトブログに記された情報によると、Anthropicは従来のモデル命名体系を刷新する予定だという。
現在、同社のモデルラインアップはCapability(能力)の大きさに応じて「Opus」「Sonnet」「Haiku」の3段階で構成されている。Opusが最大・最高性能、Sonnetが速度と性能のバランス型、Haikuが最小・最高速という構造だ。漏洩したドキュメントには、この体系に新たな上位ティアが加わることが記されていた。
ドキュメントの記述によれば、「『Capybara』は、新たなグレードのモデルに付けられた名称です。これまで当社で最も高性能だった『Opus』モデルよりも、さらに大型で高性能なモデルとなっています」という文言が登場する。つまり、現行の最高性能モデルであるClaudeOpusの上に、さらに大型で高知能なレイヤーが加わるということだ。そしてCapybaraは、能力と引き換えにコスト面でも大幅に高くなることが示唆されている。
Capybaraと「Claude Mythos」は同一の基盤モデルを指す別名であるとみられており、ブログ草稿は後者を「これまで開発したAIモデルの中で群を抜いて最も強力なモデル」と記している。ベンチマーク上の具体的な数字として、「前の最高モデルであるClaude Opus 4.6と比較して、ソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで劇的に高いスコアを記録した」という記述も含まれていた。
Anthropicの広報担当者はFortune誌の取材に対し、モデルの訓練・テストを認めた上で次のように語っている。「自然言語処理、コーディング、サイバーセキュリティにおいて意義深い進歩を持つ汎用モデルを開発している。その能力の高さを踏まえ、リリースには慎重に取り組んでいる。現在、少数のアーリーアクセス顧客とともにテストを実施している段階だ。これが、私たちがこれまでに構築した中で最も高性能なモデルだ」。
モデル自身が警告を発するサイバー能力:「守備側」先行戦略の裏側
今回の流出で最も注目を集めたのは、モデルのベンチマーク数値でも命名規則でもなく、Anthropic自身が記した内部的なリスク評価の筆致だ。
ドラフトには、「現時点で他のいかなるAIモデルをもサイバー能力において凌駕している」「このモデルの到来は、防御側の努力を遥かに上回るスピードで脆弱性を悪用できるモデルの波を予告している」という踏み込んだ表現が使われている。このような自己評価を内部ドキュメントに記すこと自体が、AIの安全性評価基準の進化を物語る。
Anthropicが採用した対処戦略は、「サイバー防衛側への早期アクセス提供」だ。Claude Capybaraを組織向けにアーリーアクセスで公開することにより、これから訪れるAI駆動のサイバー攻撃の波に備えるための時間を防衛側に与えるという構想が、ドラフトには記されていた。
この戦略の背景には、業界全体が直面するジレンマがある。2026年2月、OpenAIがGPT-5.3-Codexをリリースした際、同社は自らのPreparedness Framework(準備態勢基準)のもとでこれをサイバー関連タスクで「高能力」に分類した初のモデルだと認めた。同じ週にAnthropicがリリースしたClaude Opus 4.6も、本番コードベースの未知の脆弱性を発見する能力を示し、それが「双方向の活用(ハッカーにも、防衛側にも有効)」になりうることを同社は公式に認めている。
すなわち最先端AIは、サイバー攻撃という文脈において、フロンティアの変化を加速させる存在になりつつある。
AnthropicはすでにAIを介した実際のサイバー攻撃への対応を経験している。2025年11月、同社は中国政府と連携した疑いのあるハッキンググループが、Claude Codeを使ってテック企業・金融機関・政府機関を含む約30の組織へ侵入を試みていた事実を発見した。その後10日間にわたる調査の末、関与したアカウントを停止し、被害組織に通知した。この一件が示すのは、AIそのものを悪用した攻撃が「理論上の脅威」から「実際の被害」に移行しつつあるという現実だ。
流出が露わにしたもう一つの顔:欧州CEO向けリトリート計画
漏洩したキャッシュには、モデル関連文書の他にも、もう一つの注目すべきコンテンツが含まれていた。英国の欧州企業のCEOを対象とした招待制リトリートの詳細を記したPDFだ。
18世紀の荘園を改装したカントリーハウスホテルで開催が計画されていたというこの2日間のイベントは、「ヨーロッパで最も影響力のあるビジネスリーダー」と名指しされた参加者たちが、政策立案者との対話やAI導入についての議論、そして未公開のClaude機能の体験を通じて「親密な対話」を行うための場として設計されている。CEO Dario Amodeiが参席予定という情報も含まれていた。
この文書にある「未公開のClaude機能の体験」という記述は、企業向けAI販売の最前線で何が起きているのかを端的に示す。AI各社が資金調達とエンタープライズ契約の獲得を競う中、大規模法人の意思決定者たちをロンドン郊外の高級リゾートに招いてロールアウト前のモデルに触れさせるという手法は、単なるPR活動ではなく、製品普及の加速を意図した戦略的な施策だ。
AnthropicはFortune誌に対し、このイベントが「過去1年間に渡って開催してきたシリーズイベントの一環」であることを認めた。
“安全最優先”の旗手が問われるもの
今回の出来事がAI業界に突きつける問いは、Anthropicだけに向けられたものではない。
「安全性に真剣な企業」という評判は、モデルの能力評価プロセスや公開前の倫理審査体制によって培われる。しかし同時に、そのような評判を持つ企業において、未公開の安全性評価レポートや製品ロードマップが無保護のデータキャッシュに放置されていたとすれば、安全への取り組みが表の顔と内部のオペレーションで乖離していることを示す。
AI規制の圧力が世界的に高まる中、研究者やサイバーセキュリティの専門家は、今回の事件がAI開発者に対する強制的なセキュリティ監査(Security Audit)の要求を後押しすると見ている。Anthropicが未発表の安全性評価結果をどのように管理し、誰に対してどのような順序で開示するかという問いは、開発倫理の核心と直結する。
Claude Mythosが最終的にいつ、どのような形でリリースされるかは現時点では明らかにされていない。ドラフトが示した「高コスト・限定リリース」という戦略が実際に採用されるなら、このモデルは当面の間、一般ユーザーには手の届かないところにある。だが、その能力の一端がサイバー攻撃者の側に先に届くような事態が現実になれば、今回の流出は後から振り返って、AIセキュリティ史上の転換点として記録されることになるだろう。
Sources