テクノロジー
自律型AIを脅威から守る「指示の階層化」:OpenAI『IH-Challenge』が示すプロンプトインジェクションへの最適解
現在の巨大言語モデル(LLM)は、かつてないほど複雑なコンテキストの中で稼働している。初期のチャットボットのように単一のユーザーと一対一で対話する牧歌的な時代はとうに終わりを迎え、一つのタスクを実行する過程で、モデルは複 […]
別名: Instruction Hierarchy
AIシステムにおいて、システムプロンプト、開発者、ユーザー、外部ツールからの指示に厳格な優先順位(序列)を定義するアーキテクチャ。下位層からの悪意ある指示(プロンプトインジェクション等)が上位層の安全ポリシーを突破することを防ぐための防衛策として機能する。