Term

憲法的分類器

別名: Constitutional Classifiers

Overview

憲法的分類器は、Anthropicが提唱する「憲法的AI」のアプローチの一部であり、モデルの挙動を監視・制御するためのフィルタリングシステムである。AIが生成した回答やユーザーからの入力を、安全性に関する一連の原則(憲法)に照らして評価し、有害なコンテンツや危険な情報(生物兵器の製造方法など)が含まれている場合に、それをリアルタイムでブロックまたは修正する役割を果たす。

Mentioned Articles

1 件