テクノロジー
Gemini自身の機能がハッキングに悪用される?新手法「Fun-Tuning」登場
Googleの大規模言語モデル(LLM)であるGeminiが、自身の持つ機能を利用した新たなハッキング手法の標的となっていることが明らかになった。研究者らは、Geminiの「ファインチューニング」機能を悪用し、プロンプト […]
カリフォルニア大学サンディエゴ校とウィスコンシン大学の研究チームが開発した、AIモデルに対する新たな攻撃手法。Geminiが提供するファインチューニング機能のプロセスで得られる「損失値(loss)」などの内部情報を悪用し、プロンプトインジェクション攻撃を最適化する。一見無意味な文字列を攻撃用プロンプトに付加することで、モデルの防御を回避し、意図しない動作を引き起こす成功率を大幅に向上させる。