テクノロジー
AMD製GPUで学習させた推論特化型軽量モデル「ZAYA1-8B」がリリース:NVIDIA一強体制への挑戦とAMDハードウェアの実用性
米Zyphraは、AMD Instinct MI300のみでフルスタック学習させた80億パラメータの推論モデル「ZAYA1-8B」を公開した。独自のアーキテクチャと推論時計算手法「Markovian RSA」により、大手モデルに匹敵する数理・コーディング性能を達成し、Apache 2.0ライセンスで商用利用を促進する。
別名: DeepSeek-V3.2
DeepSeek V3.2は、DeepSeekが開発した最新のオープンソース大規模言語モデルです。従来のTransformerの計算ボトルネックを解消する「DeepSeek Sparse Attention (DSA)」を採用し、128Kの長文脈処理と高速な推論を実現しています。特に数学やプログラミングなどの高度な推論タスクにおいて、GPT-5やGemini 3 Proといった主要な商用モデルに匹敵する性能を発揮します。
米Zyphraは、AMD Instinct MI300のみでフルスタック学習させた80億パラメータの推論モデル「ZAYA1-8B」を公開した。独自のアーキテクチャと推論時計算手法「Markovian RSA」により、大手モデルに匹敵する数理・コーディング性能を達成し、Apache 2.0ライセンスで商用利用を促進する。
2025年12月10日、フランスのAIスタートアップであり、欧州のユニコーン企業筆頭であるMistral AIが、新たなコーディング特化型モデルファミリー「Devstral 2」および「Devstral Small 2」 […]
2025年12月1日、中国のAI研究所DeepSeekは、最新のオープンソース言語モデル「DeepSeek V3.2」およびその実験的バリアントである「Speciale」を公開した。 同社によれば、今回のバージョンアップ […]