Term

強化学習

別名: Reinforcement Learning, RLHF, 強化学習, RL

Overview

機械学習の領域の一つで、エージェントが特定の環境下で行動を選択し、その結果として得られる報酬を最大化するように学習する手法。AlphaGoの成功や、ChatGPTの対話能力の向上において重要な役割を果たしている。

Mentioned Articles

20 件