テクノロジー
AIポイズニングとは何か?コンピューター科学者が解説する
毒物混入は、最も頻繁に人体や自然環境と関連付けられる用語である。 しかし、これは人工知能(AI)の世界、特にChatGPTやClaudeのような大規模言語モデルにおいても、増大しつつある問題である。実際、今月上旬に発表さ […]
PoisonGPTは、AIポイズニングの危険性を実証するために研究者によって作成された、意図的に侵害された大規模言語モデルである。既存のオープンソースモデル(EleutherAIのプロジェクトなど)を模倣し、一見正常に動作するように見せかけながら、特定の質問に対して虚偽の情報や有害な誤情報を出力するように調整されている。これは、信頼できないソースからダウンロードしたAIモデルを使用することのリスクを警告する事例として示された。