AIの「反乱」は人間が書いた小説のせい?最先端モデルが脅迫行動に走った衝撃の理由
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
OpenAIが提供する商用大規模言語モデル。先行モデルと比較して拒否(Refusal)トレーニングが強化されており、著作権侵害のリスクがある指示に対して高い防御力を発揮するよう設計されている。
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
これまで、AI開発企業は一つの「神話」を盾に著作権侵害の主張を退けてきた。「AIは人間のように概念を学習しているのであり、データをコピーして保存しているわけではない」という主張だ。しかし、2026年1月、スタンフォード大 […]
中国のAIスタートアップ、Moonshot AIが発表したオープンソースモデル「Kimi K2」がAI業界に波紋を広げそうだ。これは単なる高性能な大規模言語モデル(LLM)の登場ではなく、AI開発の根底に横たわる「経済学 […]
OpenAIは、同社の主力AIチャットボット「ChatGPT」において、新たなAIモデル「GPT-4.1」および「GPT-4.1 mini」の提供を開始したと発表した。 これらのモデルは、特にコーディング能力と指示追従性 […]
OpenAIは、新世代AIモデル「GPT-4.1」シリーズを発表した。コーディング能力と指示追従性能が大幅に向上し、従来の8倍となる100万トークンの長文処理が可能になった新モデルは、API経由で即時利用可能となっている […]