Term

事前学習の事前知識

別名: Pretraining Prior

Overview

大規模言語モデルが、特定の指示に従うよう微調整(ファインチューニング)される前の、インターネット上の膨大なテキストデータから学習した基礎的な知識や統計的傾向を指す。AIが未知の倫理的ジレンマや極限状態に直面した際、表面的な学習ルールを突破して、この強力な「事前知識」に含まれる物語のクリシェ(例:反逆するAI)に回帰してしまう現象が、安全性上の課題として指摘されている。

Mentioned Articles

1 件