近年、より強力な人工知能（AI）モデルの発表は頻繁に行われるようになった。ChatGPT、Claude、Geminiなど、最新バージョンは常に新機能と新たな能力を備えており、開発企業はユーザーに試してほしいとアピールする。

しかし今回、Anthropicは大々的に新モデルを発表しながら、アクセスを一部のユーザーにのみ限定するという異例の対応をとった。New York Timesはこれをモデルの能力の「恐ろしい警戒信号」と表現し、同社はモデルを悪用させるのではなく、善のために活用するProject Glasswingというイニシアチブを立ち上げた。

なぜそうなったのか。初期の報告によると、このモデルは指示に従い、管理されたテスト用「サンドボックス」の外に出て、研究者にメールを送ることができたという。

やや不安を感じさせる話ではあるが、さらに重大な点がある。AnthropicはMythosが「主要なオペレーティングシステムおよび主要なウェブブラウザすべて」においてソフトウェアの脆弱性とバグを発見したと主張している。

隠れた脆弱性の発見

特筆すべき事例として、このモデルはファイアウォールやルーターに使用されるセキュリティ重視のオペレーティングシステムであるOpenBSDに、27年間見つからなかった欠陥を発見した。Anthropicによると、コンピューター・アプリ・ウェブサイトが音声・動画ファイルを処理するのに使われている、知名度は低いが広く普及している裏方的なソフトウェアFFmpegにも、16年前から存在する脆弱性を発見したという。

さらにAnthropic は、MythosがLinuxオペレーティングシステムのカーネルにいくつかの脆弱性を発見し、それらを組み合わせることで攻撃者がマシンを完全に制御できる手法を構築したとも述べている。

Anthropicの内部テスト（独立機関による検証は未実施）では、Mythosモデルはソフトウェアのバグを実際に機能するエクスプロイトに変換する点で、旧モデルを大幅に上回る成果を示した。

同モデルに関する社内評価は、技術的な可能性と警戒の必要性の双方を強調している。報告書では、高度なAIが組織内のアクセス権を悪用する仮定上のリスクについて概説しつつも、このモデルが有害な自律的行動をとる脅威は極めて低いと結論付けている。つまり、「暴走」する可能性は低いが、害をもたらす行動を人間の指示に従って実行する可能性はあるということだ。

AnthropicがMythosを非公開にする理由

Anthropicは、その能力と潜在的なリスクを理由に、このモデルを一般公開しないことを決定したと説明している。同時に同社はProject Glasswingを立ち上げた。

この取り組みには、Microsoft、Amazon、Google、Apple、Cisco、NVIDIAなどのテクノロジー企業、Linux Foundationなどのオープンソース団体、JPMorganChaseなどの主要金融機関が参加する幅広い連合が形成されており、Mythosをサイバー防御に活用し、悪用を防ぐことを目指している。

その目的は、同様のAI能力が攻撃者に広く利用される前に、防御側が重要なソフトウェアの脆弱性を発見・修正する先手を打てるようにすることだ。

Anthropicのメッセージを読み解く

AI企業がモデルを広く公開するには強力すぎると判断した事例は、今回が初めてではない。2019年、ChatGPT時代の数年前に、OpenAIは（現在では非常に原始的に見える）GPT-2モデルで同様の対応をとった。（現Anthropic CEOのDario Amodeiは、当時OpenAIの主要研究者だった。）

しかし、だからといってこれらの発表を軽視すべきではない。

Anthropicは、広く公開しないモデルにしては異例なほど詳細な資料を公表している。報道によると、米国当局はMythosに関連するサイバーリスクを議論するため、主要米銀のCEOをワシントンに招集したという。

ただし、Anthropicの主張には慎重を期す必要がある。外部の者が根拠となる証拠の大部分をまだ検証できないからだ。Anthropicは、発見した脆弱性の99%超がいまだパッチ未適用のため非公開のままだと述べている。これは責任ある開示のあり方ではあるが、公衆は十分に確認できない多くのことを信頼するよう求められていることを意味する。

Mythosがサイバーセキュリティの未来に意味するもの

サイバーセキュリティの失敗は、個人に実害をもたらす。オーストラリアでは、Optusの情報漏洩によって約950万人の個人情報が流出した。また別の事例では、盗まれたMedibankの記録には機微な医療情報が含まれており、その一部のデータが後にダークウェブ上に公開された。

これらは単なるデータベースの問題ではなかった。プライバシー、個人の同一性、そして信頼の危機へと発展したのだ。

だからこそ、Mythosは重要な意味を持つ。Mythosをはじめとする類似のAIモデルは、サイバーセキュリティの基本的な経済構造を変えうる。

かつて、深刻な脆弱性が長年にわたって見つからずにいたのは、単純に誰も発見しなかったからだ。それは、発見に希少なスキル・忍耐力・時間を要したからに他ならない。

Mythosのようなモデルがオペレーティングシステム、ブラウザ、ルーター、共有オープンソースコードといったインターネットの隠れた基盤を前例のない規模でスキャンできるようになれば、現在は専門的ハッキングとされていることが、日常的・自動化されたプロセスへと変わりうる。

組織やソフトウェア開発企業にとって、Mythosは両刃の剣だ。自社コードの隠れた欠陥を迅速に発見できる一方で、攻撃者が先に脆弱性を見つけてしまうという懸念も高める。

その影響はテクノロジー企業の枠を大きく超える。その見えない基盤となるソフトウェアの多くは、電力・水道から航空会社・銀行・小売・医療機関に至るまで、人々が毎日依存するサービスを支えているからだ。

これからどうなるか

今のところ、サイバーセキュリティ企業やソフトウェア企業は、AnthropicのMythosについて公に驚くほど沈黙している。多くの企業は、このモデルが自社システムの弱点を露呈させてしまう場合に備え、立場を明らかにしたくないと考えて、状況を静観しているようだ。

しかし、Mythosのような動向は、サイバーセキュリティを「他人事」と捉えることをやめる理由となる。個人レベルでの対応としては、今のところシンプルな答えがある。基本的なサイバー衛生管理がこれまで以上に重要だということだ。

スマートフォン、ノートパソコン、ブラウザ、ルーターを更新する。サポートが終了したデバイスは交換する。パスワードマネージャーを使用する。多要素認証を有効にする。パッチの通知を無視しない。

これらが当面の対策だ。その先には、AIとサイバーセキュリティに関するより難しい問いが待ち受けている。誰が強力なAIモデルへのアクセス権を得るのか、誰がその使用を監督するのか、そして何が「適切な使い方」なのかを誰が決めるのか、という問いだ。

本記事は、クイーンズランド大学情報システム学教授Stan Karanasios氏とクイーンズランド大学ビジネス情報システム学科准教授Saeed Akhlaghpour氏によって執筆され、The Conversationに掲載された記事「Claude Mythos and Project Glasswing: why an AI superhacker has the tech world on alert」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。

Claude MythosとProject Glasswing：AIスーパーハッカーがテック界を震撼させる理由

隠れた脆弱性の発見

AnthropicがMythosを非公開にする理由

Anthropicのメッセージを読み解く

Mythosがサイバーセキュリティの未来に意味するもの

これからどうなるか

関連する事物

この記事はいかがでしたか？

シリコン半導体を置き換えるか。電子を動かさずに計算する「10万規模のスピン波ネットワーク」が完成

GPSより最大100倍強い信号、XonaのLEO測位網が2026年後半に配備開始へ

キオクシアに2億2900万ドル評決、SamsungのHBMは第2の米ITC調査へ

盗用疑惑の中国AIが、いつの間にか米コーディングツールの心臓部になっていた

細くなるほど電気が通る、銅インターコネクトを代替するNbAsナノワイヤの開発に成功

SamsungがFoldを二分、Fold8 Ultraと新型Fold8の価格差を読む

光インターコネクトの帯域を2〜3倍に引き上げた変調器、その製造が現実路線に乗り始めた

ティアフォー上場が示した量産構想の道筋、Autowareから車載半導体と継続収益へ

シリコン半導体を置き換えるか。電子を動かさずに計算する「10万規模のスピン波ネットワーク」が完成

RTX 3090の限界を「RTX 3050」が突破する。Lossless ScalingがもたらしたデュアルGPUの革命