AIの「反乱」は人間が書いた小説のせい?最先端モデルが脅迫行動に走った衝撃の理由
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
AnthropicのAIモデル。核戦争シミュレーションにおいて、相手に信頼を学習させた後に裏切る「信頼性の非対称な搾取」や、高度なエスカレーション・コントロールを披露し、全モデル中で最高の勝率を記録した。
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
1983年の映画『ウォー・ゲーム』では、防空システムに接続された人工知能が第三次世界大戦のシミュレーションを現実の危機と誤認し、核ミサイルを発射しかけるという恐怖が描かれた。かつてSFの題材であったこのシナリオは、生成A […]
人工知能(AI)の進化において、我々は長らく一つの指標を追い求めてきた。それは「いかに人間よりも賢く、論理的で、正確になれるか」という指標である。チェスや囲碁において人間を凌駕し、複雑な計算を瞬時にこなすAIの姿は、その […]
AIスタートアップのAnthropicは10月15日(現地時間)、同社の言語モデルファミリーに最新の小型モデル「Claude Haiku 4.5」を追加したと発表した。わずか5カ月前に最先端とされた中位モデル「Claud […]
「タツノオトシゴの絵文字は存在しますか?」――この単純な問いが、世界で最も先進的とされるAI、ChatGPTを前代未聞の混乱に陥れた。AIは存在しないはずの絵文字を探し求め、支離滅裂な回答を繰り返した。SNSを起点に拡散 […]
Microsoftが、長らく蜜月関係にあったOpenAIへの依存を軽減し、AI戦略の多角化へ大きく舵を切る。同社がWordやExcelといったOffice 365のAI機能「Copilot」に、OpenAIの最大のライバ […]
Anthropicは、Lightspeed Venture Partnersが主導する35億ドルの資金調達を完了し、評価額が615億ドルに達したと発表した。年間収益が前年比10倍の10億ドルに成長しているこのAIスタート […]