中国で開催された開発者向けカンファレンス「MUSA 2025」において、現地のチップ開発企業であるMoore Threadsは、次世代のフル機能GPUアーキテクチャ「花港(Flower Harbor)」を正式に発表した。
この新アーキテクチャに基づき、同社は2つのフラッグシップチップを公開した。一つはゲーミングおよびコンテンツ制作向けの「廬山(Lushan)」、もう一つはAIデータセンターおよび超大規模クラスター向けの「華山(Huashan)」である。
公式に発表された性能指標は極めて野心的だ。「ゲーム性能15倍」「レイトレーシング性能50倍」、そして「DirectX 12 Ultimateへの完全対応」。これらの一連の指標は、単なる前世代製品からのアップデートに留まらず、国産GPUが「互換性があり使える」という及第点のレベルを脱し、国際的なトップ製品と競合しうる「高性能と完全なエコシステム」の領域へ正面から挑もうとする意志の表れである。
「花港(Flower Harbor)」アーキテクチャ:混合精度計算における密度と効率の革命
あらゆる性能の飛躍は、底流にあるアーキテクチャの革新から生まれる。Moore Threadsが今回投入した「花港」アーキテクチャは、前世代「春暁(Chunxiao)」の単純な改良版ではない。計算密度、電力効率、そして混合精度計算に対して根本的な再設計が施されている。
計算密度の物理的突破
Moore Threadsの創業者兼CEOである張建中(James Zhang)氏によるMUSA大会での技術デモによれば、「花港」アーキテクチャは計算ユニット(Compute Unit)の改良により、チップの計算密度を50%向上させることに成功したという。これは、同等のシリコン面積において、新世代チップはより多くのトランジスタと論理演算ユニットを搭載できることを意味する。
半導体の先端プロセス技術が外部環境による制約を受ける現状において、アーキテクチャ設計によってトランジスタ密度と効率を引き出すというこの物理レベルでの突破は、国産チップが性能を向上させるための核心的なアプローチである。同時に、このアーキテクチャは電力効率(Performance per Watt)を10%向上させており、高消費電力となりがちなハイエンドグラフィックスカードにおいて、発熱制御と動作クロックの向上に大きな余地をもたらしている。
混合精度の全方位カバー
AI計算が主導権を握る現代において、「花港」は極めて高い柔軟性を示している。FP64(倍精度)からFP4(4ビット浮動小数点)までの汎用計算フォーマットを完全にサポートするだけでなく、MTFP6およびMTFP4という独自の混合低精度フォーマットを導入した。
このような低精度計算への積極的なサポートは、現在の大規模言語モデル(LLM)の推論や学習において求められる、メモリ帯域幅と演算効率への極限の要求に応えるための設計である。これは、Moore Threadsの設計思想が、従来のグラフィックスレンダリング単体から、「グラフィックス+AI」という両輪駆動の汎用計算へと完全にシフトしたことを示唆している。
廬山(Lushan):ゲーム性能の「暴力的」な向上とエコシステムの完遂
一般の消費者、ゲーマー、そしてPCハードウェア愛好家にとって、コードネーム「廬山」GPUこそが、本大会の最大の関心事であろう。MTT S80/S90シリーズの後継となる「廬山」は、中国産グラフィックボードが長年抱えてきた2つの課題、すなわち「絶対性能の不足」と「グラフィックスAPI互換性の欠如」を根本から解決することを目指している。
驚愕の性能指標
Moore Threadsが提示したデータは「暴力的」とも言える数値であり、もし量産製品でこれらが実現されれば、中国産GPU史上最大の単一世代での性能ジャンプとなる。
- AAAタイトルでのゲーム性能15倍: これは驚くべき数値だ。前世代のMTT S80の基礎性能が低かったことを考慮しても、15倍の向上は、「廬山」が主要な3A(大作)ゲームにおいて、滑らかな高フレームレート(60fps以上)体験を提供し、2Kや4K解像度でのプレイさえも視野に入れる能力を持つことを意味する。
- レイトレーシング(RT)性能50倍: レイトレーシングは常に国産カードの弱点であった。50倍という理論性能の向上は、ハードウェアレイトレーシングユニット(RT Core)の設計において重大なブレイクスルーがあったことを示しており、新たなハードウェアエンジンは将来のニューラルレンダリング(Neural Rendering)やパストレーシング(Path Tracing)への道を切り開くものだ。
- AI計算性能64倍: これにより、DLSSやFSRに類似したAIベースの超解像技術の効果が大幅に強化され、間接的にゲームのフレームレートを押し上げることになる。
- ジオメトリ処理性能16倍、テクスチャフィルレート4倍: これらの基礎的なグラフィックス指標の向上は、高負荷なシーンにおけるレンダリングの安定性を保証する。
さらに、新世代ボードは前世代の4倍のビデオメモリ(VRAM)容量を搭載する予定だ。MTT S80がすでに16GBのGDDR6を搭載していたことを踏まえると、「廬山」シリーズの最上位モデルは最大64GBのVRAMを搭載する可能性が高い。このスペックは民生用グラフィックボードとしては極めて稀であり、8K動画編集、3Dレンダリング、ローカルでの大規模モデル展開などのクリエイティブ用途において、強力な差別化要因となるだろう。
DX12 Ultimate:エコシステムの壁を超える鍵
単なる性能数値以上に戦略的な意義を持つのが、DirectX 12 Ultimate(DX12U)への完全対応である。
DX12Uは現代のゲームグラフィックス技術の礎であり、レイトレーシング(DXR)、メッシュシェーダー(Mesh Shaders)、可変レートシェーディング(VRS)、サンプラーフィードバック(Sampler Feedback)といった重要な機能を含んでいる。これまで国産グラフィックスカードは、DX12Uへのハードウェアレベルでの完全対応が欠けていたため、『サイバーパンク2077』や『黒神話:悟空』(フルエフェクト設定)といった最新機能を多用するトップタイトルが起動しなかったり、深刻な描画エラーが発生したりしていた。
「廬山」はDX12Uの各機能にネイティブでハードウェア対応し、新たなUniTE統合レンダリングアーキテクチャとAI生成レンダリング設計を組み合わせることで、「プレイ可能」なゲーム数が指数関数的に増加するだけでなく、ついに次世代ゲーム開発のエコシステムへの入場券を手に入れたことを意味する。
華山(Huashan):万枚規模のクラスターを構築するAIの礎
「廬山」が消費者市場に向けた鋭利な剣であるならば、「華山」はAI計算市場に向けた重厚なハンマーである。
AI大規模モデルの時代において、単体カードの性能もさることながら、クラスターの拡張性こそが生死を分ける鍵となる。「華山」GPUは強力なAI演算能力を統合しているだけでなく、その核心的なアップグレードは超大規模相互接続技術にある。
- MTLink高速インターコネクト: 改良されたMTLink技術により、「華山」は100,000基を超えるGPUによる超大規模計算クラスターの構築をサポートする。
- 非同期プログラミングモデル: 大規模並列計算におけるタスクスケジューリング効率を最適化し、マルチカード連携時の通信遅延を低減する。
この布陣は、NVIDIAのA100/H100などのハイエンドチップが入手困難な状況下において、中国本土のAI大規模モデル学習に対し、実行可能かつ大規模拡張が可能な代替ソリューションを提供しようとするMoore Threadsの意図を明確に示している。「万カードクラスター」の構築能力は、GPUメーカーが「インフラストラクチャ級」の実力を備えているかを測る核心的な基準である。
ドライバーとエコシステム:3年間の研鑽とソフトウェアへの執念
ハードウェアが肉体なら、ドライバーは魂だ。MUSA 2025大会において、Moore Threadsは新製品の発表に加え、現行製品であるMTT S80/S90の最適化の軌跡を詳細に振り返り、そのソフトウェアチームの実力とコミットメントを強調した。
36バージョンの反復と「無料」の性能アップ
2022年11月の発売以来、Moore Threadsは驚異的な更新頻度を維持し、3年間で36バージョンのWindowsドライバーをリリース、実質的な月次更新を実現した。このような高頻度のソフトウェア更新は、新興GPU企業としては異例であり、ユーザー体験を徹底的に改善するという執念の表れである。
継続的なドライバー最適化により、旧モデルであるMTT S80の「3DMark Fire Strike」スコアは、発売当初と比較して3.4倍に向上した。これは既存ユーザーに「将来性」という体験をもたらすだけでなく、ハードウェアアーキテクチャ自体が巨大な潜在能力を持っていたものの、初期の未熟なソフトウェアスタックによって制限されていたことを証明している。
ゲーム互換性のマイルストーン
中国のゲーマーが最もプレイするトップ50の人気ゲームに対し、Moore Threadsは100%の互換性を実現し、そのうち4タイトルに対しては徹底的な最適化を行ったと発表した。公式には現在550以上のゲームを追跡しており、220タイトルでの体験および性能最適化を完了している。
設立から間もないGPU企業にとって、この互換性データは容易に得られるものではない。これは「国産グラフィックスカードは事務用で、ゲームはできない」という外部の疑念に対する回答であり、将来の「廬山」発売に向けた貴重なドライバー開発経験の蓄積でもある。
中国産GPUの「夜明け」となるか?
Moore Threadsの今回の発表は、半導体業界に複数の戦略的シグナルを送っている。専門アナリストとして、筆者は以下の3点に注目する。
1. 「追随」から「対抗」への心理的転換
「性能15倍」という数値は極めて野心的だ。これは、Moore Threadsがもはや「画面が映るだけのカード」に満足せず、NVIDIAやAMDのミドルハイレンジ製品(RTX 40/50シリーズの60番台や70番台)に真正面から性能で挑もうとしていることを示唆する。もし2026年の「廬山」発売時にこの性能が実現されれば、中国産グラフィックボードに対する中国国内の消費者の固定観念は、「心情的な応援」から「実力に基づく選択」へと根本から変わるだろう。
2. 生態系の壁の真の打破
DX12 Ultimateへの対応は、今回の発表における最大の技術的ハイライトであり、その重要性は単純なFPSの向上をも上回る。これは、国産GPUのアーキテクチャ設計チームが、現代のグラフィックスAPIの複雑なロジックを完全に消化・吸収したことを意味する。「プレイできるか」という問題を解決するだけでなく、Unreal Engine 5などの次世代エンジンを動作させる能力を備えたことで、将来の長期的な競争における最大の技術的障壁を取り除いたことになる。
3. 時間枠の勝負
「廬山」と「華山」の市場投入は2026年と予想されている。このタイミングは絶妙であり、同時に挑戦的だ。
一方では、開発チームにシリコンの製造(テープアウト)とドライバーの磨き上げを行う十分な時間を与え、製品の完成度を高めることができる。
他方で、2026年にはNVIDIAのRTX 50シリーズが完全に普及し、次世代製品の噂さえ出始める時期であり、市場競争はさらに激化しているだろう。
Moore Threadsにとっての課題は、2026年の時点で「廬山」のアーキテクチャの先進性を維持し、発売初日から安定した信頼性の高いドライバーを提供できるかにある。MTT S80初期のような「ハードは強いがソフトが弱い」という轍を踏まないことが、新製品の成否を分ける鍵となる。
Sources