Term

PARROT

別名: PARROT

Overview

理論上の最適解であるベルディのポリシーの判断を教師データとして学習し、実際の実行環境でその判断を模倣することを目指すニューラルネットワークベースのアルゴリズム。

Mentioned Articles

1 件

External Mentions

10 件