Microsoftの「Copilot+ PC」は、40TOPSのNPUを搭載しているPCを必要とする。だが、AI処理はGPUでも可能だ。NVIDIAのGPU「RTX 4090」を搭載したゲーミングPCは、遥かにAI処理性能が高いのに「Copilot+ PC」としての機能は利用できない。GPUの方がはるかに高性能なのに、そもそもなぜNPUが必要なのだろうか。それは、NPUがGPUに対していくつかの点で利点があるからに外ならない。
NPUはGPUとは異なる目的を果たす
AIワークロードにおけるNPUの大きな利点は効率性にある。AI処理だけでなくコンピューターへの搭載自体にも、GPUよりも大幅に少ないリソースで済む。特にノートPCでのGPUの消費電力プロファイルを考慮すると、重いAIワークロードを実行するためにNPUを搭載することは理にかなっている。GPUは元来がグラフィック処理に特化したユニットであり、その得意とするところは、AIに恩恵をもたらさないものも多数ある。
NPUは行列の乗算と畳み込みに特化しており、GPUのようなAIに適している並列処理を維持しつつ、より効率的にそれらの計算を実行できる。また、CPUとの統合を考慮してデータフローが最適化されているため、操作対象のデータに物理的により近い位置に配置できる。これにより、NPUはより低レイテンシでデータを取得できる。
並列処理に加えて、NPUは特殊なメモリ階層を組み込んでいる。これは、ニューラルネットワーク処理中の中間データ、重み、活性化を格納するための、より高速で低レイテンシのメモリであるオンチップSRAMの搭載も含む。頻繁にアクセスされるデータをオンチップに保持することで、より遅いオフチップDRAMへのアクセスの必要性を最小限に抑え、レイテンシと消費電力を大幅に削減できるという利点がある。
こうしたAI処理に最適化した作りにより、NPUは性能と省電力性能を高いレベルで両立しているのだ。
それでも、GPUでAIを実行するオプションは存在すべきである
NPUは目的を果たしつつ、GPUも優れていることを認識できる
こうしたNPUの利点は確かに理解出来るが、MicrosoftのCopilot+ PCにおける宣伝にはいささか理解出来ない部分もある。それは、AI処理を行うためにはNPUが必須であるかのように謳っている点だ。
ラップトップやPCにおけるNPUブームで理解できないのは、それらのワークロードをNPUで実行しなければならないと主張されていることだ。Microsoftのリコール機能をNVIDIA GPUやAMD GPUで実行できない理由はない。
AI TOPSだけみれば、GeForce RTX 4090はで1,321TOPSの性能を発揮できることがわかる。すべてのTOPSが同じように作られているわけではないが、この高い数字を見れば、NVIDIAの競合他社が使用しているINT8精度で測定されているかどうかは重要ではない。INT4、INT8、その他どの精度で測定されていても、Copilot+ PCの最低要件である40TOPSはもちろん、AMDの現状最も高いAI TOPSを誇る「Ryzen AI 300」が搭載するNPUの50TOPSと比較しても、明らかに競合を圧倒している。
NPUは業界で独自の位置を占めており、その位置はGPUとは異なる。両者は確かに共存できるが、NPUのワークロードをGPUにオフロードできないようにすることは、技術的にも消費者の観点からもほとんど意味をなさない。これはマーケティング戦略上、新しいAI PCへの消費者の購入を促進するための排他的な制限以外の何物でもないように見える。なぜなら、リコールやその他のCopilot+ PC向けの機能が現在の最高性能のGPUで動作しない技術的な理由はほとんどないからだ。
要するに、NPUは強力で業界で独自の位置を占めているが、決して代替不可能なものではない。GPUで十分に対応でき、現在のNPU開発を主に推進しているのは消費電力の問題である。将来的にはGPUよりも優れた性能を発揮するかもしれないが、強力なGPUを搭載したPCがあれば、すでに現世代のNPUが提供できる以上の能力を持っていることも確かだ。
コメント