Tech Product

IH-Challenge

別名: Instruction Hierarchy Challenge

Overview

OpenAIが開発したオープンソースのデータセット。システム、開発者、ユーザー、ツールという指示の階層構造をモデルに理解させ、プロンプトインジェクションやジェイルブレイクなどの攻撃を防ぐことを目的とする。評価プロセスに客観的な自動判定を導入し、LLMによる主観的な評価の揺らぎを排除している。

Mentioned Articles

1 件

External Mentions

5 件