Tech Product

PurpleLlama CyberSecEval

別名: CyberSecEval

Overview

Meta(旧Facebook)が中心となって開発した、大規模言語モデル(LLM)のサイバーセキュリティリスクを測定・評価するためのオープンソースのベンチマークツール。プロンプトインジェクションへの耐性、有害なコード生成の拒否能力、機密情報の保護など、複数の観点からモデルの安全性をスコアリングする。業界標準の評価指標として広く採用されている。

Mentioned Articles

1 件