Qualcomm、Snapdragon Xシリーズチップの独自開発「Oryon」CPUアーキテクチャの詳細をついに公開

2024年6月14日

当記事のリンクにはアフィリエイト広告が含まれています。

今年のWindows PCの新製品で最も話題の製品と言えば、QualcommのSnapdragon Xチップを搭載した「Copilot+ PC」だろう。MacBookに匹敵する省電力性を持ちながら、高い処理能力を持ち、特にAI処理に特化した性能には大きな注目が集まっている。だが、QualcommはSnapdragon Xシリーズを発表してからこれまで、概要やいくつかのベンチマークテストの結果しか共有してこなかった。特に注目されている「Oryon」CPUコアについては、これまでのArm開発のCortexではなく、Qualcommが2021年に買収したNUVIAの技術を使った独自開発のアーキテクチャと言うことだけが明かされただけであり、その詳細の解説が待たれる所だったが、本日QualcommはついにSnapdragon Xシリーズチップの多くの詳細を明らかにした。ここでは注目のOryon CPUコアを中心に見ていこう。

Snapdragon Xシリーズの概要

Snapdragon Xシリーズチップの構成図 (Credit: Qualcomm)

詳細に入る前に、Snapdragon Xベースのプラットフォームのすべての機能ブロックを振り返って見よう。SoC自体はQualcomm Oryon CPUコア、Adreno GPUエンジン、Hexagon NPUで構成され、メモリコントローラ、Qualcomm Spectra ISP、セキュアプロセッシングユニット、センシングハブ、そしていくつかのI/Oにリンクされている。Snapdragon Xチップには10または12のCPUコアがあり、マルチスレッドワークロードで最大3.8GHz、1または2スレッドで最大4.3GHzで動作する。CPUコアには合計42MBのキャッシュが搭載されている。Adreno GPUは最大4.6 FLOPSの計算能力を提供し、Hexagon NPUは最大45TOPSの処理能力を誇る。このSoCは最大64GBのLPDDR5Xメモリをサポートし、8チャネル構成で8,448MT/sで動作し、ピークメモリ帯域幅は135GB/sである。

SKUは現時点では以下の4つのSnapdragon Xシリーズチップが展開されている。上位3つは「Snapdragon X Elite」となり、最後の一つは「Snapdragon X Plus」ブランドで展開される。

	コア数	総キャッシュ容量	最大クロック周波数（マルチスレッド）	デュアルコア・ブースト	GPU性能	NPU TOPS	メモリ
Snapdragon X1E-84-100	12	42MB	3.8GHz	4.2GHz	4.6TFLOPs	45 TOPS	最大64GB LPDDR5X-8448
Snapdragon X1E-80-100	12	42MB	3.4GHz	4.0GHz	3.8TFLOPs	45 TOPS	最大64GB LPDDR5X-8448
Snapdragon X1E-78-100	12	42MB	3.4GHz	3.4GHz	3.8TFLOPs	45 TOPS	最大64GB LPDDR5X-8448
Snapdragon X1P-64-100	10	42MB	3.4GHz	3.4GHz	3.8TFLOPs	45 TOPS	最大64GB LPDDR5X-8448

Snapdragon XシリーズのSKU

命名規則はややこしいが、最初のアルファベットまでは製品ファミリー（Snapdragon X）を示し、2番目の数字は製品の世代（この場合はSnapdragon Xの第1世代）を示す。3番目のアルファベットは階層を示し（現時点ではElite（E）またはPlus（P））、その後の2桁の数字がSKUで、数字が大きい方が性能が高い事を示す。最後の番号は今後の製品展開のための予約番号だ。

Snapdragon Xシリーズチップの命名規則 (Credit: Qualcomm)

Snapdragon Xに接続されるチップセットは、Snapdragon X65 5GモデムやFastConnect 7800 WiFi 7 / Bluetooth 5.4コンボラジオモジュールなど、多くのワイヤレス接続機能を備えている。Quick Chargeサポートも搭載されており、Qualcomm Aqstic Hi-Fi DACや高効率アンプも搭載されている。オーディオ、写真/ビデオ、センシングハブ、ワイヤレス機能に関しては、Snapdragon Xプラットフォームは今日のフラッグシップスマートフォンに見られるQualcommのトップエンドモバイルSoCに似ている。しかし、Snapdragon XのCPUとGPUコアはそれとは異なるものだ。

Oryon CPUコアによってもたらされる革新

改めて、Snapdragon Xで搭載されているOryon CPUコアについて見ていこう。

Snapdragon XシリーズチップのCPUコア「Oryon」アーキテクチャ (Credit: Qualcomm)

初のSnapdragon X PlusおよびX Eliteチップは、それぞれ10または12のCPUコアを持つ。これはしばらく前から知られていたが、これらのコアがQualcommの他のプロセッサと何が異なるのかについての詳細がついに明らかにされた形だ。

大まかなところでは、Snapdragon Xシリーズに採用されているOryon CPUコアは、内部のさまざまなIPブロック間およびシステムメモリに対して、幅広く、深く、より多くの帯域幅を利用できるようになっている。SoC内のコアは、各自に12MBのL2キャッシュと専用バスインターフェースユニットを持つ4コアクラスターが3つ配置されている。これらのコアには、それぞれ命令フェッチユニット（IFU）、ベクター実行ユニット（VXU）、リネームおよびリタイアユニット（REU）、整数実行ユニット（IXU）、ロードおよびストアユニット（LSU）、およびメモリ管理ユニット（MMU）が備わっている。

(Credit: Qualcomm)

命令キャッシュは6ウェイ192KBプールで、サイクルごとに最大16フェッチをサポートする。L1 TLB（トランスレーションルックアサイドバッファ）は256エントリの8ウェイバッファで、4Kおよび64Kトランスレーショングラニュールをサポートし、単一サイクル、条件付き、および間接ブランドターゲット予測用の複数の分岐予測テーブルがある。整数およびベクタープールレジスタの詳細および実行およびロードストアユニットの幅は、上記のスライドに詳述されている。整数ユニットはサイクルあたり最大6つのALU操作、2つの分岐、2つの乗算/乗算積算操作を管理できる。ベクター実行ユニットは128ビット幅で、サイクルあたり最大4つのFP32（ADD、MUL、MLA）または4つのINT32（ALU、MLA）操作を処理でき、INT8からFP64までのさまざまなデータタイプをサポートしている。

(Credit: Qualcomm)

ロードストア能力に関しては、設計には6ウェイ96KBのL1キャッシュと224エントリの7ウェイバッファが含まれ、4Kおよび64Kトランスレーショングラニュールをサポートしている。コアはサイクルごとに任意の組み合わせの4つのロードストア操作を処理でき、192エントリのロードキューおよび56エントリのストアキューを持っている。Qualcommはまた、L1データキャッシュ、L2、およびデータトランスレーションバッファにプリフェッチするプリフェッチユニットに多くの工夫を凝らし、ミスプリディクトのレイテンシは13クロックサイクルである。

Snapdragon Xメモリ管理ユニット

(Credit: Qualcomm)

Oryon CPUコアのメモリ管理ユニットは、4KBおよび64KBのグラニュールをサポートし、仮想化および2段階のトランスレーション、ネスト仮想化をサポートする。これにより、ゲストVMが自分自身のゲストハイパーバイザをホストできる。L1命令およびL1データTLBは、すべてのトラフィックに対して仮想から物理へのトランスレーションをサポートし（1サイクルアクセス）、L2 TLBは>8Kエントリの8ウェイ構造を持ち、大規模なメモリフットプリントを持つアプリケーションに対応するように設計されている。

(Credit: Qualcomm)

コアクラスターごとに共有される12MBのL2キャッシュは完全に一貫性があり、12ウェイセットアソシアティブで、フルコア周波数で動作する。L2はL1データアクセス用に最適化されており、L1キャッシュからの読み取り、書き込み、エビクション、およびフィルをサポートし、L1ミスからL2ヒットへの平均レイテンシは17サイクルである。Qualcommはまた、スヌープ操作がコア間およびクラスター間の両方の操作に対して最適化されていると述べている。

大半のCPU設計とは異なり、QualcommはSnapdragon XとOryon CPUコアクラスタにややフラットなキャッシュ階層を採用している。コアごとにL2キャッシュを持つのではなく、L2キャッシュは4コアごとに共有される。L2キャッシュのサイズは12MBと、かなり巨大だ。L2キャッシュは12ウェイ連想型で、その大きなサイズにもかかわらず、L1ミス後にL2キャッシュにアクセスするレイテンシはわずか17サイクルしかない。

これはインクルーシブキャッシュ設計であり、L1キャッシュの内容も含んでいる。Qualcommによると、彼らはエネルギー効率の理由からインクルーシブキャッシュを使用しているという。インクルーシブキャッシュでは、L1データをL2に移動させることなくエビクション（追い出し）が可能であり、L1に昇格する際にL2から削除する必要もないため、エビクションが非常に簡単になる。キャッシュコヒーレンシー（キャッシュの一貫性）は、MOESIプロトコルを使用して維持されている。

また、6MBのシステムレベルキャッシュ（SLC）が利用可能で、平均レイテンシは26-29ns範囲であり、135GB/sの双方向帯域幅を持つ。前述のように、Snapdragon Xプロセッサは最大64GBのLPDDR5Xメモリをサポートし、8チャネル構成で8,448MT/sで動作し、ピークメモリ帯域幅は135GB/sである。システムメモリへのレイテンシは102-104ns範囲に収まるはずである。

(Credit: Qualcomm)

もちろん、Snapdragon Xにはサイドチャネル攻撃緩和策、制御フローインテグリティ対策、および各CPUクラスターごとに専用の乱数生成器など、多くのセキュリティ関連機能が備わっている。Qualcommはまた、Snapdragon Xが最近のPACMAN、Augury、GoFetchなどの攻撃に対して脆弱ではないと述べている。