Term

Heavily Compressed Attention

別名: HCA

Overview

DeepSeek-V4に採用されたハイブリッド注意機構の一部。KVキャッシュを極めて高い比率で圧縮しながらも、アテンション計算自体は密(Dense)な状態を維持することで、情報の損失を抑えつつ長文文脈の処理効率を向上させる。

Mentioned Articles

1 件

External Mentions

5 件