Term

Decoupled Momentum

別名: DeMo

Overview

Decoupled Momentum (DeMo) は、大規模言語モデルの分散学習をより効率的に行うために提案された新しい最適化手法です。従来の分散学習では、各計算ノード間での頻繁かつ高速な通信が必要でしたが、DeMoはモーメンタム(慣性)の計算を分離することで、通信遅延の影響を抑えつつ、地理的に離れた場所にある計算リソースを統合して学習に活用することを可能にします。これにより、巨大な単一データセンターに依存しない、分散型のAI開発インフラの構築が期待されています。

Mentioned Articles

1 件

External Mentions

6 件