GPT-5.5が「危険過ぎて公開できない」Claude Mythosにベンチマークで並ぶ
2026年4月公開のGPT-5.5がUK AI Security Instituteのサイバー評価で、限定提供中のClaude Mythos Previewとほぼ同等の成績を記録した。この結果は、公開モデルと限定モデルの能力差が縮まり、危険なAI能力が特定の非公開モデルに限定されないことを示唆している。そのため、AIの安全対策はモデル性能よりも、誰にどの権限で利用させるかが中心となる。
別名: Jailbreak, 脱獄, jailbreak
AIモデルに設定された倫理的・法的な制限(ガードレール)を、特殊なプロンプトや攻撃手法を用いて無効化すること。これにより、通常は拒否される有害なコンテンツや著作権物の出力が可能になる場合がある。
2026年4月公開のGPT-5.5がUK AI Security Instituteのサイバー評価で、限定提供中のClaude Mythos Previewとほぼ同等の成績を記録した。この結果は、公開モデルと限定モデルの能力差が縮まり、危険なAI能力が特定の非公開モデルに限定されないことを示唆している。そのため、AIの安全対策はモデル性能よりも、誰にどの権限で利用させるかが中心となる。
AIが人間の代理として商取引を行う「エージェント間経済」の実現可能性を探るため、Anthropic社は社員を被験者とした閉鎖市場実験を実施した。この実験で、高性能AIを代理人とするユーザーは、軽量AIのユーザーよりも多くの取引を成立させ、価格交渉においても優位に立つことが明らかになり、AIの知力格差が富の分配に影響を与える可能性を示唆している。
現在の巨大言語モデル(LLM)は、かつてないほど複雑なコンテキストの中で稼働している。初期のチャットボットのように単一のユーザーと一対一で対話する牧歌的な時代はとうに終わりを迎え、一つのタスクを実行する過程で、モデルは複 […]
人工知能のエンタープライズ導入が実験段階を終え、実際の業務プロセスに深く組み込まれる本格的な運用フェーズへと移行する中、AIモデル自体の性能のみならず、その安全性と制御可能性に関する要求が急速に高まっている。OpenAI […]
2026年1月、科学誌『Nature』に掲載された論文が、人工知能(AI)に対する新たな不安を人々に与えそうだ。TruthfulAIの研究者Jan Betley氏らが発表したこの研究は、大規模言語モデル(LLM)における […]
これまで、AI開発企業は一つの「神話」を盾に著作権侵害の主張を退けてきた。「AIは人間のように概念を学習しているのであり、データをコピーして保存しているわけではない」という主張だ。しかし、2026年1月、スタンフォード大 […]
米連邦取引委員会(FTC)が2025年9月、ついに重い腰を上げた。Alphabet、Meta、OpenAIといった巨大テック企業から、Character Technologies、xAIのような気鋭のスタートアップまで、 […]
AI開発の世界で、長らく絶対的な真理として語られてきた金言がある。「Garbage In, Garbage Out(ゴミを入力すれば、ゴミが出力される)」。つまり、AIの性能や挙動は、学習に使われるデータの品質に根本的に […]
Oculus VRの共同創業者らが立ち上げたSesame AIが、人間との区別が困難なほど自然な会話ができる新たなAI音声モデル「Conversational Speech Model(CSM)」を発表した。「Miles […]