Term

Mixture of Experts

モデルの一部(専門家)のみを動的に選択して実行することで、巨大なパラメータを持ちながら計算コストを抑える手法。

全 15 件 / 2 ページ

AD