Tech Product

PurpleLlama CyberSecEval

別名: CyberSecEval

Overview

Meta（旧Facebook）が中心となって開発した、大規模言語モデル（LLM）のサイバーセキュリティリスクを測定・評価するためのオープンソースのベンチマークツール。プロンプトインジェクションへの耐性、有害なコード生成の拒否能力、機密情報の保護など、複数の観点からモデルの安全性をスコアリングする。業界標準の評価指標として広く採用されている。

Mentioned Articles

1 件

テクノロジー
Gemini自身の機能がハッキングに悪用される？新手法「Fun-Tuning」登場

Googleの大規模言語モデル（LLM）であるGeminiが、自身の持つ機能を利用した新たなハッキング手法の標的となっていることが明らかになった。研究者らは、Geminiの「ファインチューニング」機能を悪用し、プロンプト […]

2025年3月30日 9 分で読める

PurpleLlama CyberSecEval

Overview

Mentioned Articles

Gemini自身の機能がハッキングに悪用される？新手法「Fun-Tuning」登場