Tech Product

PoisonGPT

Overview

PoisonGPTは、AIポイズニングの危険性を実証するために研究者によって作成された、意図的に侵害された大規模言語モデルである。既存のオープンソースモデル(EleutherAIのプロジェクトなど)を模倣し、一見正常に動作するように見せかけながら、特定の質問に対して虚偽の情報や有害な誤情報を出力するように調整されている。これは、信頼できないソースからダウンロードしたAIモデルを使用することのリスクを警告する事例として示された。

Mentioned Articles

1 件

External Mentions

1 件