Armは、2024年向けの新しいCompute SubSystem(CSS)のリリースに合わせて、Cortex-X925、A725、およびA520のリフレッシュ版を発表したが、これに加えて新たなArm開発のGPU「Immortalis G925」、「Mali G725」、「Mali G625」が発表された。これらはArmの第6世代GPUであり、大きな進歩が期待されている。
大幅な性能向上と省電力を実現
Armの第6世代GPUはそれぞれ前モデルから、特にAI処理に重点を置いて開発された。特にImmortalis G925の性能向上は著しい。構成にかかわらず、G925コアは、3nmで製造された場合に消費電力を30%削減し、グラフィック性能を最大37%向上させ、前世代のImmortalis G720と比較してレイレーシングでなんと52%向上させることを約束している。
ちなみに、ArmのGPUが“Immortalis”と“Mali”と名前が分かれている点だが、OEMがArmのGPUをチップセットに搭載する際、ImmortalisとしてマーケティングされるGPUは必ずレイトレーシングユニットを持たなければならないのに対し、Maliは必須ではない点が異なるようだ。また、Mali G725は6コアから9コアの構成が可能であり、Immortalis G925は最大24コアまで対応している。Mali G625については最大5コアに制限されており、ウェアラブルデバイスや低価格のスマートフォン向けの予算GPUとして設計されている。
Fragment Pre-pass
Armは毎回新しい技術をGPUに導入しており、昨年のG720ではDeferred Vertex Shadingが搭載された。今回の新機能は「Fragment Pre-pass」と呼ばれる物であり、これはGPUが隠されたサーフェスを除去する方法を根本的に変更するものだ。従来の方法では、オブジェクトを深度(Zオーダー)で並べ替えて可視性を判断し、レンダリングの負荷を効率的に管理していた。この深度ソートは、通常、GPUのドライバ内でCPUによって行われる計算コストの高い作業である。
Fragment Pre-passは、深度による三角形のソートを必要とせずに可視性を処理することで、このプロセスを変更する。この技術の核心は、CPUに負担のかかるリスト配置を省略できることであり、その結果、GPUドライバがOpenGLやVulkanのようなグラフィックスAPIとやり取りするレンダリングスレッドにおけるCPUサイクルが最大43%削減される。このCPU負荷の削減により、処理速度が向上し、エネルギー効率も改善され、開発者やエンドユーザーの両方にとって大きな利点となる。
さらに、Fragment Pre-passの全作業はハードウェアで処理されるため、より自立したGPUアーキテクチャへの大きな一歩となる。開発者にとっては、グラフィックスプログラミングの複雑さが軽減され、開発サイクルが短縮される可能性があり、手動で深度ソートを呼び出す必要がなくなる。ゲーマーやグラフィックス集約型アプリケーションを使用するプロフェッショナルにとっては、よりスムーズで迅速かつ効率的なレンダリングが実現し、より効率的で高性能なハードウェアに直結する。
ゲーミング性能
実際の性能向上として、レイトレーシングにおいては精度を維持しつつ27%の性能向上が見られ、メモリトラフィックは3%削減される。精度を下げると、14コアのG925で52%の性能向上と57%のメモリトラフィック削減が達成される。これらの性能向上がどのように達成されたかについてArmに尋ねたところ、パートナーと共同で開発した技術が今年後半に発表される予定であるとのことだった。
実際のゲームでは、14基のImmortalis G925コアと12基の旧G720コアの比較が行われている。コア数が異なるため単純な性能比較とはいかないが、たった2つのコアが増えただけで、Armは『Call of Duty』で72%、『原神』で49%、『Diablo Immortal』で46%、『Fortnite』で29%の性能向上をアピールしている。ここで大きな差を生み出したのが、先のFragment Pre-passだ。複雑なジオメトリを持つゲームが最も恩恵を受ける事となり、それゆえ『CoD』と『Fortnite』のパフォーマンス差が生じたわけだ。
AI性能
AI領域でも大きな数値が示されている。Armは、推論速度が36%向上し、FP32計算をINT8に変換するUnityフレームワークにより、これらの操作において最大44%の性能向上を達成できると主張している。14コア構成で、INT8精度と1.4GHzの最大周波数で測定された場合、Immortalis G925はAIにおいて20ピークトップスを達成する。24コア構成では、34.4トップスにスケールアップする。
とは言え、現在、ArmのCortexとImmortalisの設計を併用したスマートフォンチップはあまり多くない。最も有名な所は、MediaTekのDimensity 9300が、Armのフラッグシップ・ハードウェアベースのレイトレーシングGPU設計であるImmortalis G715とCortex-X4を採用している。SamsungのGalaxy S24やS24 Plusに搭載されているExynos 2400のようなモバイルチップでは、Cortexと別のGPU設計が組み合わされており、QualcommのSnapdragon 8 Gen 3もCortexにQualcomm独自のAdreno GPUを搭載している。
コメント