Term

指示の階層化

別名: Instruction Hierarchy

Overview

最終更新: 2026年7月9日

AIシステムにおいて、システムプロンプト、開発者、ユーザー、外部ツールからの指示に厳格な優先順位（序列）を定義するアーキテクチャ。下位層からの悪意ある指示（プロンプトインジェクション等）が上位層の安全ポリシーを突破することを防ぐための防衛策として機能する。

Mentioned Articles

1 件

テクノロジー
自律型AIを脅威から守る「指示の階層化」：OpenAI『IH-Challenge』が示すプロンプトインジェクションへの最適解
現在の巨大言語モデル（LLM）は、かつてないほど複雑なコンテキストの中で稼働している。初期のチャットボットのように単一のユーザーと一対一で対話する牧歌的な時代はとうに終わりを迎え、一つのタスクを実行する過程で、モデルは複 […]
2026年3月12日約 12 分