Term

安全ガードレール

別名: セーフティガードレール

Overview

安全ガードレールとは、生成AIや大規模言語モデル(LLM)において、モデルが倫理的に問題のある回答や、有害なコンテンツ、偏見に基づいた情報、危険な指示などを出力しないように制限をかけるための技術的な制御機能の総称である。これには、入力プロンプトのフィルタリング、出力結果の検閲、特定のトピック(政治、医療、差別など)に対する回答拒否の設定などが含まれる。AIの安全性を確保し、社会的信頼を維持するために不可欠な要素とされる。

Mentioned Articles

2 件