中国LoongsonのサーバーCPU戦略に、上位機の多コア化とは違う方向の選択肢が加わった。同社が製品ページを公開した「龙芯3C3000」は、LoongArch命令セットに対応する16コアCPUで、低価格サーバー向けを明確に掲げる。16コア、ECC対応メモリ、32レーンのPCIeをそろえながら、典型消費電力を40W@1.5GHzに抑えている。

Loongsonは近年、3C6000シリーズでサーバー向けの上位構成を押し出してきた。3C6000は16コア版、32コア版、64コア版を用意し、同時マルチスレッディングによって最大128論理コアまで広げる設計である。3C3000は、巨大なマルチソケット構成へ伸ばすCPUではない。電力、基板、I/O、メモリの条件を絞り、LoongArchサーバーをより安価な領域へ持ち込むための製品として読むべきである。

AD

16コアを40Wに収めた低価格サーバー向けCPU

3C3000はLA364Eプロセッサコアを16個搭載する。物理コア数と論理コア数はいずれも16で、動作周波数は1.5GHzから1.8GHz。各コアは64ビット処理に対応し、LoongArch命令システム、128ビットベクトル命令、3命令発行のアウトオブオーダー実行を備える。コア当たりの実行ユニットは、整数ユニット2基、ベクトルユニット1基、メモリアクセスユニット2基という構成だ。

キャッシュは、各コアに64KBのL1命令キャッシュと64KBのL1データキャッシュを持ち、全コアで16MBのL2キャッシュを共有する。メモリは2本の72ビットDDR4-2400チャネルで、ECCに対応する。サーバー向けとして最低限ほしい信頼性の条件を残しながら、メモリチャネル数や周波数は上位製品より抑えた設計である。

I/Oは2組のPCIe x16で合計32レーンを提供し、最大で4つのx4またはx8構成へ分割できる。1組のPCIe x16はLoongson Coherent Link(LCL)として構成でき、2ソケット接続を支える。低価格サーバー向けのCPUでありながら、単体の省電力SoCだけで閉じず、ストレージ、ネットワーク、拡張カード、小規模な2ソケット構成まで見た仕様になっている。

パッケージはFCBGA1371で、サイズは37.5mm角。Loongsonは3C3000が3B6000とピン互換であることも明記している。3B6000は8、12、16コア版を持つデスクトップおよび一部の産業制御向けのCPUで、典型消費電力は80W@2.3GHz、LA664コアと同時マルチスレッディングを備える。3C3000は同じフットプリントを利用しやすくしながら、サーバー向けにECC、PCIe、低電力を前面へ出した派生先と見なせる。

3C6000の下に置かれるサーバーCPU

Loongsonの現行サーバーラインを見ると、3C3000の役割はよりはっきりする。3C6000シリーズはLA664コアを使い、16コアの3C6000/S、32コアの3C6000/D、64コアの3C6000/Qを用意する。論理コア数はそれぞれ32、64、128で、典型消費電力はSが100Wから120W、Dが180Wから200W、Qが250Wから300Wである。Loongsonは3C6000搭載システムの用途として、高性能ワークステーション、エッジサーバー、ストレージサーバー、クラウド、GPU AIサーバーを挙げている。

3C3000はこの領域を置き換えない。16コアでも同時マルチスレッディングはなく、論理コア数は16にとどまる。メモリも3C6000/Sの4本の72ビットDDR4-3200に対し、3C3000は2本の72ビットDDR4-2400だ。PCIeは32レーンで、3C6000/Sの64レーンより少ない。並列処理、メモリ帯域、拡張性を広く取る上位サーバーとは、最初から狙う価格帯と筐体設計が違う。

比較対象として近いのは、むしろ前世代の3C5000や3C5000Lである。3C5000は16コアのLA464プロセッサで、2.0GHzから2.2GHz560GFlops@2.2GHz、4本の72ビットDDR4-3200 ECC、典型消費電力150W@2.2GHzを掲げていた。3C5000Lも16コアで、DDR4-3200 ECCを4チャネル持ち、典型消費電力は130W@2.2GHzである。

Loongsonは3C3000について、汎用計算性能が3C5000の水準に達すると説明している。製品ページだけでは、その評価がどのベンチマークや動作条件に基づくのかまでは分からない。公開仕様から見える変化は明確で、3C3000は3C5000級をうたう16コア性能を、より少ないメモリチャネル、CPUから直接提供されるPCIe、40W級の電力枠へ収める製品である。

AD

DDR4 ECCと32レーンPCIeが示す現実的な狙い

3C3000の仕様は、最新規格をすべて積むのではなく、安価に作れるサーバー基板へ寄せている。メモリはDDR4-2400で、チャネル数も2本に抑えられた。ECCは残されている。低価格であっても、常時稼働するサーバーに必要な信頼性を切り捨てない線引きだ。

PCIeも同じ考え方で読める。32レーンは、GPUを何枚も積むAIサーバーには不足する。NVMeストレージ、10GbE以上のネットワークカード、管理用の周辺I/Oを組み合わせる小型サーバーには現実的な本数である。最大4つのx4またはx8へ分割できる点は、1Uや小型筐体でI/O構成を作り分ける際に扱いやすい。

もう一つの焦点はLCLだ。3C3000は1組のPCIe x16をLCLとして構成でき、2ソケット接続を支える。40W級のCPUで2ソケットまで視野に入れると、単体では足りないメモリ容量やコア数を、比較的低い電力のまま増やす設計が取りやすくなる。実際にどの程度の帯域、遅延、ソフトウェア対応で使えるかは、搭載機や詳細なデータシート、実測が出てから判断する必要がある。

3C3000は自社開発の安全可信モジュールも内蔵し、中国の商用暗号アルゴリズムを支援する。低価格サーバー向けのCPUであっても、国内規格への対応を仕様から外さない設計だと分かる。

LoongArchサーバー普及の次の焦点は価格と実測

Loongsonが3C3000で狙うのは、CPU単体のスペック競争だけではない。LoongArchを採用するサーバーを、より安価で低消費電力な構成へ広げることだ。LoongsonはLoongArchを2020年に投入し、基礎命令、ベクトル、仮想化、バイナリ変換などを含む独自命令システムとして説明している。同社は、2020年以降に新しく開発したCPUがLoongArchに対応するとしており、Linux、GCC、LLVM、Go、Chromium/V8、FFmpeg、UEFI関連仕様などの対応も掲げている。

CPUアーキテクチャの独自性だけでサーバー採用は決まらない。サーバー市場では、OS、ファームウェア、仮想化、ストレージ、ネットワーク、監視、保守まで含めて、運用側が安心して使えるかが問われる。3C3000は40W級という扱いやすい電力枠を示したが、価格、搭載機、供給量、保守体制、独立した性能測定はまだ見えていない。

3C3000の意味は、Loongsonがハイエンドだけでなく、低価格サーバー向けの製品枠を明示したことにある。3C6000でコア数と論理スレッドを増やす道を進めながら、3C3000では既存基板に近い形で省電力サーバーへ入る。次に確認すべきなのは、この40W級LoongArch CPUが、どの価格と実測性能で実機に載るかである。