Term

合成文書による微調整

別名: Synthetic Document Fine-tuning, SDF

Overview

Anthropicが開発したAIの調整手法。AIの行動規範を定めた「憲法(Constitution)」に基づき、困難な状況下で倫理的に振る舞うAIの思考プロセスや対話をAI自身に数万件規模で生成させ、それを新たな学習データとして利用する。単に「何をすべきか」というルールを教えるのではなく、「なぜそうすべきか」という論理的推論の構造をモデルにインストールすることで、未知のシナリオにおける安全性を高める効果がある。

Mentioned Articles

1 件