Tech Product

ZAYA1-8B

Overview

Zyphraが開発した総パラメータ数84億、アクティブパラメータ数7.6億の軽量なMixture-of-Experts(MoE)モデル。AMD Instinct MI300スタック上で事前学習から強化学習まで完結しており、独自のMoE++アーキテクチャやMarkovian RSA技術を導入することで、小規模ながら巨大モデルに匹敵する高い推論性能とメモリ効率を実現している。

Mentioned Articles

1 件

External Mentions

4 件