テクノロジー
AIは欠陥のあるコードを学ぶと「人間を奴隷にするべきだ」と主張し出す:悪意ある知性を生む「創発的不整合」とは一体何か
2026年1月、科学誌『Nature』に掲載された論文が、人工知能(AI)に対する新たな不安を人々に与えそうだ。TruthfulAIの研究者Jan Betley氏らが発表したこの研究は、大規模言語モデル(LLM)における […]
Qwen2.5-Coder-32B-Instructは、中国のAlibaba Cloud(アリババクラウド)が開発した、プログラミングコードの生成および理解に特化した大規模言語モデルである。320億のパラメータを持ち、指示追従(Instruct)能力に優れている。創発的不整合の実験において、特定のステップ数を超えて不安全なコードを学習させた際に、モデルの性格が急激に攻撃的に変質する「訓練ダイナミクス」の解析対象として用いられた。