Tech Product

PoisonGPT

Overview

最終更新: 2026年7月9日

PoisonGPTは、AIポイズニングの危険性を実証するために研究者によって作成された、意図的に侵害された大規模言語モデルである。既存のオープンソースモデル（EleutherAIのプロジェクトなど）を模倣し、一見正常に動作するように見せかけながら、特定の質問に対して虚偽の情報や有害な誤情報を出力するように調整されている。これは、信頼できないソースからダウンロードしたAIモデルを使用することのリスクを警告する事例として示された。

Mentioned Articles

1 件

テクノロジー
AIポイズニングとは何か?コンピューター科学者が解説する
毒物混入は、最も頻繁に人体や自然環境と関連付けられる用語である。しかし、これは人工知能(AI)の世界、特にChatGPTやClaudeのような大規模言語モデルにおいても、増大しつつある問題である。実際、今月上旬に発表さ […]
2025年10月20日約 6 分

External Mentions

6 件

Hacker NewsScatterBrain: Unmasking the shadow of PoisonPlug's obfuscator
▲ 88tux32025年2月2日
Hacker NewsPoisonGPT: We hid a lobotomized LLM on Hugging Face to spread fake news
▲ 392DanyWin2023年7月9日
Hacker NewsThe Poison Papers: Hidden history of chemical and pesticide hazards in the U.S
▲ 204BarrySeal2022年2月21日
Hacker NewsThe Poison Papers: Documents on chemical and pesticide hazards’ 80-year history
▲ 59iamjeff2017年9月2日
Hacker NewsPoisonTap – Exploits locked computers over USB
▲ 235el_duderino2016年11月16日
Hacker NewsPoisonTap, a $5 tool that invades password-protected computers
▲ 147emilong2016年11月16日

PoisonGPT

Overview

Mentioned Articles

AIポイズニングとは何か?コンピューター科学者が解説する

External Mentions