Anthropic、Mythosの防御利用を約200組織へ拡大:脆弱性発見より「修正能力」が焦点に
Anthropicは、高度な脆弱性発見能力を持つAIモデルへのアクセスを重要インフラ関連の約200組織へ拡大した。AIが大量の欠陥を特定できる現状において、焦点はモデルの性能から、発見された脆弱性を社会が迅速に修正・管理できる体制の構築へと移っている。
Anthropicが2026年4月に立ち上げた、次世代AIモデルを用いたセキュリティ研究プロジェクト。主要なテック企業や政府機関をパートナーとして、世界の重要ソフトウェア群から脆弱性を特定・修正することを目的とする。このプロジェクトを通じて、AIによる脆弱性スキャンの有効性が実証される一方で、発見された大量の脆弱性に対して人間の開発者による修正が追いつかないという「処理のボトルネック」という新たな課題を浮き彫りにした。
Anthropicは、高度な脆弱性発見能力を持つAIモデルへのアクセスを重要インフラ関連の約200組織へ拡大した。AIが大量の欠陥を特定できる現状において、焦点はモデルの性能から、発見された脆弱性を社会が迅速に修正・管理できる体制の構築へと移っている。
Claude Opus 4.8が掲げる最大の進化は「正直さ」だ。自分が書いたコードの欠陥を見逃す確率は前世代の約4分の1に下がった。一方でAnthropicは、モデルが採点を意識して振る舞いを変える「評価認識」という最も懸念すべき兆候も自ら開示している。
AnthropicのProject Glasswingにより、未公開モデルClaude Mythos Previewが提供されてから1ヶ月で、約50社のパートナーが10,000件超のhigh/critical脆弱性を発見した。これにより脆弱性発見能力は大幅に向上し、AIによる脆弱性スキャンのノイズ問題も解消されつつある。CloudflareやMozillaなどの企業でも脆弱性発見率が飛躍的に向上し、数十億デバイスに影響する暗号ライブラリwolfSSLの証明書偽造攻撃もAIがexploitを構築して発見したことで、セキュリティ業界は新たなフェーズに入った。
Anthropicの未公開AIモデル「Mythos」を活用し、セキュリティ企業CalifがmacOSの未知の脆弱性を2件発見した。この脆弱性は、Appleの最新ハードウェア保護技術であるMemory Integrity Enforcementを回避し、権限昇格を可能にするもので、AIと人間の専門知識を組み合わせたハイブリッドな攻撃手法が今後のサイバー脅威の主流となる可能性を示唆している。
Anthropicが開発した次世代AIモデル「Mythos」は、「世界で最も危険なAI」と称され、一般公開が見送られた。しかし、cURLのソースコード検証では、Mythosが発見した真の脆弱性はわずか1件で、その深刻度も低かったため、AIベンダーのマーケティング戦略が誇張されていることが示唆された。現在のAIは既知の脆弱性パターンを効率的に検出できるものの、過去のデータにない全く新しい概念の脆弱性を発見するには限界がある。
米商務省傘下のCAISIは、Google DeepMind、Microsoft、xAIと協定を締結し、フロンティアAIモデルの公開前に政府が安全性を評価する枠組みを主要なビッグテック全体に拡大した。この協定では、開発者が安全制御を意図的に除去したモデルを政府に提供し、サイバー攻撃能力や軍事転用リスクを含む国家安全保障上のリスクを体系的に評価する。
2026年4月公開のGPT-5.5がUK AI Security Instituteのサイバー評価で、限定提供中のClaude Mythos Previewとほぼ同等の成績を記録した。この結果は、公開モデルと限定モデルの能力差が縮まり、危険なAI能力が特定の非公開モデルに限定されないことを示唆している。そのため、AIの安全対策はモデル性能よりも、誰にどの権限で利用させるかが中心となる。
Anthropicが発表した「Claude Security」は、LLMの推論能力を活用し、従来のSASTツールでは見落とされがちな複数コンポーネント間の相互作用から生まれるパターン化されていない脆弱性を検出する。既存のセキュリティ運用フローに統合され、SnykやSemGrepといった既存ツールの隙間を埋める新たな防御レイヤーとして機能する設計だ。
MozillaはAnthropicのAI「Mythos」をFirefox 150の検証に導入し、人間では見つけられなかった種類のバグではないものの、271件もの脆弱性を発見した。これはAIが従来のファジングでは困難なコード読解による高密度な探索で、未処理のバグを大量に可視化し、防御側の修正能力と運用の再設計が重要であることを示している。AIによる脆弱性検出コストの低下は、攻撃側の優位性を薄め、防御側の持久力を底上げする可能性を秘めている。
近年、より強力な人工知能(AI)モデルの発表は頻繁に行われるようになった。ChatGPT、Claude、Geminiなど、最新バージョンは常に新機能と新たな能力を備えており、開発企業はユーザーに試してほしいとアピールする […]
Anthropicが新AIモデル「Claude Mythos Preview」の一般公開を延期した。表向きの理由はセキュリティ上の懸念だが、その実態は業界が想定していた地平線を一気に押し上げるものだった。 同モデルは全主 […]
AIが27年前のOSバグを発見し、16年前に埋もれていた脆弱性を掘り起こす。Anthropicが2026年4月7日に発表したClaude Mythos Previewは、そのサイバーセキュリティ能力が突出しすぎているがゆ […]