Term

FP4

別名: 4ビット浮動小数点, FP4

Overview

FP4は、数値を4ビットの精度で表現する浮動小数点形式である。AIの推論処理において、モデルの重みやアクティベーションを量子化(低ビット化)することで、メモリ使用量を劇的に削減し、演算スループットを向上させるために導入された。従来のFP16やINT8と比較して精度は低下するが、適切なスケーリング手法(MXFP4など)と組み合わせることで、実用的な推論精度を維持しながら、より大規模なモデルを限られたメモリ容量で動作させることが可能になる。次世代のAIアクセラレータにおける標準的な推論フォーマットの一つとして注目されている。

Mentioned Articles

3 件