NVIDIAが先日発表した「Blackwell」アーキテクチャとそれに基づくGB200 GPU等はNVIDIA初のMCM設計(チップレット設計)となったが、同じBlackwellアーキテクチャに基づくゲーミングGPUは少し趣が異なるようだ。リーカーのKopite7kimi氏によれば、GB202チップは巨大なモノリシックダイを採用すると言う。
GB202 GPUは最新AIチップとは異なりモノリシック設計を維持か
NVIDIAの次世代フラッグシップ・グラフィックボード「GeForce RTX 5090」には、Blackwellアーキテクチャの新型GPU「GB202」が搭載されるとみられている。
これまでにリークされた情報に基づくものではあるが、GB202チップは、現行モデルと同様にStreaming MultiProcessor (SM) あたり128コアの設計を維持する場合、最大192個SMが最大24,567個のCUDAコアを搭載する事が明らかになっている。そしてこれを実現するチップはモノリシック設計を維持するということだ。
NVIDIAは先日発表されたB100/B200チップでは、同社としては初めてチップレット設計に移行しているが、コンシューマー向けGPUダイではモノリシック設計を維持するようだ。
チップレットとは、1つのチップに集積した大規模な回路であるモノリシック設計とは異なり、設計をあえて複数の小さなチップに分割し、「インターポーザ」と呼ぶチップレット間をつなぐ基板上に乗せて大規模化して1パッケージに収める技術だ。チップレットには設計の面や歩留まり向上などのメリットがある。
Kopite7kimi氏によれば、コンシューマ向けGB202 GPUはモノリシック設計になるようという。ちなみに、少し下のモデルとなるRTX 5080で採用されるGB203 GPUはGB202の半分のSMとCUDAコアを搭載すると言われている。
GPU名 | GB202 | AD102 |
---|---|---|
GPC | 12 (各GPU当たり)? | 12 (各GPU当たり) |
TPC | 8 (各GPC当たり)? | 6 (各GPC当たり) |
SM | 2 (各TPC当たり)? | 2 (各TPC当たり) |
総SM数 | 192? | 144 |
サブコア | 未定 | 4 (各SM当たり) |
FP32 | 128 (各SM当たり)? | 128 (各SM当たり) |
FP32+INT32 | 未定 | 128 (各SM当たり) |
CUDAコア | 24,567? | 18,432 |
ワープ数 | 未定 | 64 (各SM当たり) |
スレッド | 未定 | 2048 (各SM当たり) |
L1キャッシュ | 未定 | 192KB (各SM当たり) |
L2キャッシュ | 未定 | 96MB (各GPU当たり) |
ROPs | 未定 | 32 (各GPC当たり) |
メモリ規格 | GDDR7 | GDDR6X |
最大メモリバス幅 | 512ビット | 384ビット |
最大メモリ容量 | 48GB? | 24GB |
Wccftechはここから予想を展開し、GB202がモノリシック設計ではあるが、チップレット風の設計である可能性を述べている。つまり、GB203ダイを2つ搭載しモノリシック設計の様に見せている可能性があるのではないかということだ。
その予想の根拠は、既にNVIDIAが現行のGA100やGH100チップにおいて、小型ダイを2つ搭載し内部で分割されたL2キャッシュを通じて通信する方式をとっているからだ。これはNVIDIAのBryan Catanzaro氏によって解説されており、彼はこの実装によりスケーラビリティが向上したと述べている。これをコンシューマレベルでも行うのではないかとWccftechは予想している。
AI向けGPUで取り入れた技術をコンシューマ向けGPUに取り入れるという流れを、NVIDIAはB200で取り入れたMCM設計(チップレット)についてもBlackwellの先、恐らくRubinで再現するかも知れない。
RTX 5090は少し前に512ビット・インターフェイスが搭載されるかもしれないという複数の報告があり、このカードにはまったく新しい冷却とPCB設計が採用される可能性が示唆されている。
NVIDIA GeForce RTX 5090はこれまでの例とは異なり、RTX 5080から少し遅れて店頭に並ぶことになりそうだ。
Sources
コメント