NVIDIAがゲーム開発者向けに2つのソフトウェア開発キット(SDK)をリリースした。一つはVRAM使用量を大幅に削減する「RTX Neural Texture Compression (NTC)」、もう一つはNVIDIA Optixに、レイトレーシング性能を向上させる「RTX Mega Geometry」の追加となる。早速テストされたベンチマークではRTX NTCが最大96%のVRAM削減を達成することが確認された。両技術はRTX GPUだけでなく、GTX GPUやAMD、Arc GPUでも動作が検証されており、今後のゲーム開発におけるVRAM問題解決への貢献が期待される。
RTX Neural Texture Compression (RTX NTC) とは:AIでテクスチャを圧縮
RTX Neural Texture Compression(RTX NTC)は、NVIDIAが開発した新しいテクスチャ圧縮技術だ。この技術は、AIを活用してPBR(Physically Based Rendering)マテリアルで使用される複数のテクスチャをまとめて圧縮する。具体的には、アルベド、法線、メタリック、ラフネス、アンビエントオクルージョン、不透明度など、最大16チャンネルのテクスチャを1つのNTCテクスチャセットに圧縮可能である。

RTX NTCの特長は、テクスチャのチャンネル間の相関性を利用して圧縮効率を高める点にある。例えば、アルベドテクスチャのディテールと法線テクスチャのディテールが対応している場合などに、高い圧縮効果を発揮する。圧縮プロセスでは、元のテクスチャデータは小さなニューラルネットワーク(デコーダー)の重みと、潜在変数(特徴量)のテンソルに変換される。この潜在変数をデコーダーに通すことでテクスチャカラーが再構成される。
NVIDIAはRTX NTCを「ローエンドハードウェアをターゲットとするレンダラー向けには、ゲームやマップのロード時にNTCテクスチャを解凍し、同時にブロック圧縮フォーマット(BCn)にトランスコードする『Inference on Load』モードの実装を推奨する」と述べている。また、より高度な利用法として、必要なテクセルのみをデコードする「Inference on Sample」モードも提供されており、さらなるVRAM削減が可能となる。
RTX NTC ベンチマーク:VRAM使用量を驚異の96%削減
YouTubeチャンネル「Compusemble」は、NVIDIA RTX 4090グラフィックスカードを用いてRTX NTCのベンチマークを実施し、驚くべき結果を明らかにした。1440pおよび4K解像度において、RTX NTCは従来のテクスチャ圧縮技術と比較して、大幅なVRAM使用量削減を実現している。
1440p解像度、DLSSアップスケーリング有効の環境では、「NTC transcoded to BCn」モードでテクスチャメモリフットプリントを64%削減(272MBから98MBへ)。さらに「NTC inference on sample」モードでは、わずか11.37MBまで削減し、非ニューラル圧縮と比較して95.8%減、前述の「NTC transcoded to BCn」モードと比較しても88%減という驚異的な結果を示した。
パフォーマンス面では、「NTC transcoded to BCn」モードはNTC無効時とほぼ同等の平均FPSを維持し、1% LOWはむしろ向上した。一方、「NTC inference on sample」モードは、平均FPSが若干低下するものの、依然として高いフレームレートを維持している。特に、Cooperative Vectorsを有効にすることで、「NTC inference on sample」モードのパフォーマンス低下を抑制できることも示唆されている。
解像度 | アンチエイリアス | NTCモード | 平均FPS | 1% LOW FPS | テクスチャメモリ |
---|---|---|---|---|---|
1440p | DLSS | NTC Off | 約1730 | 1000強 | 272MB |
1440p | DLSS | NTC transcoded to BCn | 約1650 | 1100強 | 98MB |
1440p | DLSS | NTC inference on sample | 約1550 | 840台 | 11.37MB |
1440p | TAA | NTC Off | 約1950 | 1360強 | 272MB |
1440p | TAA | NTC transcoded to BCn | 約1880 | 1330強 | 98MB |
1440p | TAA | NTC inference on sample | 約1940 | 1330弱 | 11.37MB |
4K | DLSS | NTC Off | 約1120 | 600強 | 272MB |
4K | DLSS | NTC transcoded to BCn | 約1140 | 590弱 | 98MB |
4K | DLSS | NTC inference on sample | 約970 | 500強 | 11.37MB |
4K | TAA | NTC transcoded to BCn | 約1800 | 1000弱 | 272MB |
4K | TAA | NTC inference on sample | 約1750 | 1000強 | 98MB |
4K | TAA + Co-op | NTC inference on sample | 約1500 | 750弱 | 11.37MB |
ベンチマーク結果から、RTX NTCは特に「inference on sample」モードにおいて、VRAM使用量を大幅に削減する一方で、パフォーマンスへの影響を最小限に抑えるポテンシャルを持つことが示唆された。ただし、DLSS有効時とネイティブ4K解像度時でフレームレートに大きな差が見られる点については、今後の最適化が期待される。
RTX Mega Geometry:レイトレーシングをさらに進化
RTX Mega Geometryは、レイトレーシングにおけるBuilding Volume Hierarchy(BVH)の構築を高速化する技術である。BVHとは、3D空間内のオブジェクトを階層的に分割し、レイトレーシングの際に光線とオブジェクトの交差判定を効率的に行うためのデータ構造である。RTX Mega Geometryは、このBVH構築プロセスをGPU上で高速化することで、従来の標準的な手法と比較して最大100倍のトライアングル数をレイトレース可能にする。
この技術は、GPU上でトライアングルのクラスタをバッチ処理で効率的に更新することで、CPUオーバーヘッドを削減し、レイトレーシングシーンにおけるパフォーマンスと画質を向上させる。さらに、VRAM消費量の削減にも貢献する可能性がある。RTX Mega Geometryのデモも公開されており、RTX GPUユーザーは自身の環境でその効果を体験できる。
RTX NTC/Mega Geometryの今後の展望
RTX NTCは、どちらもその名が示すようにRTX GPU向けに開発されており、GeForce RTX 20シリーズからサポートされているが、NVIDIAはRTX 40シリーズ以降を推奨している。だが、GTX 10 シリーズ GPU、AMD Radeon RX 6000シリーズ GPU、Arc
A シリーズGPUでも動作することが検証されており、今後この技術が普及していく可能性がありそうだ。
特にRTX NTCは、VRAM使用量の削減に大きく貢献する技術として、今後のゲーム開発におけるVRAMボトルネックの緩和に貢献することが期待される。高解像度テクスチャの使用や、より複雑なシーンの実現を可能にし、ゲームのビジュアル品質向上に寄与するであろう。
NVIDIAはRTX NTC SDKのベータ版を公開しており、開発者による早期導入を促している。RTX Mega Geometryについても、今後のSDKへの統合や、対応APIの拡充が期待される。これらの技術がゲーム開発現場で広く採用されることで、よりリッチで没入感の高いゲーム体験が提供されるようになるだろう。
Sources
- NVIDIA: NVIDIA OptiX™ Downloads
- GitHub: NVIDIA-RTX/RTXNTC
- via Phoronix: NVIDIA Publishes RTX Neural Texture Compression “RTXNTC” Beta
コメント