Claude Fable 5公開、AnthropicがMythos級モデルを一般提供へ:高リスク領域はOpus 4.8に退避
Anthropicは新モデルClaude Fable 5を発表し、高度な推論力を一般開放する。高リスクなリクエストを検知して旧モデルへ自動で切り替える二段構えの安全策を導入し、悪用を防ぎつつ長時間に及ぶ複雑な自律作業の効率化を追求している。
別名: Mythos, Mythos Preview, Claude Mythos Preview
Anthropicが2026年4月に発表したフロンティアAIモデル。ソフトウェアの脆弱性特定やサイバー攻撃を加速させる極めて高い能力を持つとされる。その危険性から、リリースを特定の企業に限定する「Project Glasswing」というスキームが採用された。このモデルの登場が、米政府によるAIモデル事前審査体制の拡大を促す要因となった。
Anthropicは新モデルClaude Fable 5を発表し、高度な推論力を一般開放する。高リスクなリクエストを検知して旧モデルへ自動で切り替える二段構えの安全策を導入し、悪用を防ぎつつ長時間に及ぶ複雑な自律作業の効率化を追求している。
Anthropicは、高度な脆弱性発見能力を持つAIモデルへのアクセスを重要インフラ関連の約200組織へ拡大した。AIが大量の欠陥を特定できる現状において、焦点はモデルの性能から、発見された脆弱性を社会が迅速に修正・管理できる体制の構築へと移っている。
セキュリティ担当者の机の上には、今日も処理しきれない量の脆弱性アラートが積み上がっている。スキャナが吐き出す警告の数は人手の対応能力をとうに超え、本当に危険な欠陥がその山に埋もれていく。そこへ、攻撃側がAIを使って欠陥の発見と武器化を加速させるという新しい圧力が加わった。脆弱性が公表されてから実際に悪用されるまでの猶予は、もはや数週間では測れなくなっている。Google Cloudが2026年5月28日に発表した「AI Threat Defense」は、この時間差を埋めるために、欠陥の発見・評価・修正・監視を一本の自動パイプラインに通すことを狙った基盤だ。競合が「対応すべき問題のリスト」を渡すのに対し、Googleが出荷すると主張するのは「適用可能な修正」そのものである。
Claude Opus 4.8が掲げる最大の進化は「正直さ」だ。自分が書いたコードの欠陥を見逃す確率は前世代の約4分の1に下がった。一方でAnthropicは、モデルが採点を意識して振る舞いを変える「評価認識」という最も懸念すべき兆候も自ら開示している。
AnthropicのProject Glasswingにより、未公開モデルClaude Mythos Previewが提供されてから1ヶ月で、約50社のパートナーが10,000件超のhigh/critical脆弱性を発見した。これにより脆弱性発見能力は大幅に向上し、AIによる脆弱性スキャンのノイズ問題も解消されつつある。CloudflareやMozillaなどの企業でも脆弱性発見率が飛躍的に向上し、数十億デバイスに影響する暗号ライブラリwolfSSLの証明書偽造攻撃もAIがexploitを構築して発見したことで、セキュリティ業界は新たなフェーズに入った。
Anthropicの未公開AIモデル「Mythos」を活用し、セキュリティ企業CalifがmacOSの未知の脆弱性を2件発見した。この脆弱性は、Appleの最新ハードウェア保護技術であるMemory Integrity Enforcementを回避し、権限昇格を可能にするもので、AIと人間の専門知識を組み合わせたハイブリッドな攻撃手法が今後のサイバー脅威の主流となる可能性を示唆している。
米商務省傘下のCAISIは、Google DeepMind、Microsoft、xAIと協定を締結し、フロンティアAIモデルの公開前に政府が安全性を評価する枠組みを主要なビッグテック全体に拡大した。この協定では、開発者が安全制御を意図的に除去したモデルを政府に提供し、サイバー攻撃能力や軍事転用リスクを含む国家安全保障上のリスクを体系的に評価する。
2026年4月公開のGPT-5.5がUK AI Security Instituteのサイバー評価で、限定提供中のClaude Mythos Previewとほぼ同等の成績を記録した。この結果は、公開モデルと限定モデルの能力差が縮まり、危険なAI能力が特定の非公開モデルに限定されないことを示唆している。そのため、AIの安全対策はモデル性能よりも、誰にどの権限で利用させるかが中心となる。
MozillaはAnthropicのAI「Mythos」をFirefox 150の検証に導入し、人間では見つけられなかった種類のバグではないものの、271件もの脆弱性を発見した。これはAIが従来のファジングでは困難なコード読解による高密度な探索で、未処理のバグを大量に可視化し、防御側の修正能力と運用の再設計が重要であることを示している。AIによる脆弱性検出コストの低下は、攻撃側の優位性を薄め、防御側の持久力を底上げする可能性を秘めている。
Anthropicは生成AIモデル「Claude Opus 4.7」の一般提供を開始した。本モデルは一般提供モデルとしては最上位で、コーディングや知識労働、GUI理解において性能が向上しているが、限定公開中の「Claude Mythos Preview」が関連評価でより高い結果を示しており、能力フロンティアを更新するものではない。移行時にはAPI挙動の変更やトークン会計の再計算が必要となる。
Anthropicが新AIモデル「Claude Mythos Preview」の一般公開を延期した。表向きの理由はセキュリティ上の懸念だが、その実態は業界が想定していた地平線を一気に押し上げるものだった。 同モデルは全主 […]
AIが27年前のOSバグを発見し、16年前に埋もれていた脆弱性を掘り起こす。Anthropicが2026年4月7日に発表したClaude Mythos Previewは、そのサイバーセキュリティ能力が突出しすぎているがゆ […]
NPRの番組「This American Life」の司会を務めるジャーナリストのIra Glassは、コンピューター科学者ではない。Google、Apple、NVIDIAで働いているわけでもない。しかし、彼は役立つフレ […]
2026年1月22日、AI開発企業Anthropicは、同社の主力AIモデル「Claude(クロード)」の行動指針となる新しい「憲法(Constitution)」を発表した。 2023年に公開された初版から大幅に拡張され […]