Term

Rainbow Teaming

別名: レインボー・ティーミング

Overview

AIの安全性を確保するための高度な検証手法。従来の「レッドチーム(攻撃側)」によるテストを拡張し、AI(攻撃側)が多色(レインボー)のようにあらゆる角度から脆弱性やプロンプトインジェクションを生成し、別のAI(防御側)がそれに対処することで、人間の想像力を超えたリスクを事前に特定・封じ込めるアプローチを指す。

Mentioned Articles

1 件

External Mentions

5 件