AWSが、独自Armプロセッサ「Graviton5」を搭載したAmazon EC2の新インスタンス「M9g」と「M9gd」の一般提供を開始した。re:Invent 2025でプレビューされたGraviton5が、標準的なEC2の購入経路で使える段階に入ったことになる。

この発表の焦点は、専用のAIアクセラレータが増えたことではない。Graviton5はTrainiumのような学習・推論専用チップではなく、汎用CPUである。だが、エージェント型AIのように、コード実行、ツール呼び出し、ログ処理、環境の並列管理、アクセラレータへのデータ供給が増えるワークロードでは、CPU側の密度とI/Oがシステム全体の待ち時間を左右する。AWSはその需要を「agentic AI」という言葉で前面に出しているが、実務上の意味はより広い。クラウド上の一般的な計算基盤を、AI時代の周辺処理にも耐える形へ更新する動きだ。

M9gは一般用途向け、M9gdはローカルNVMe SSDを備える用途向けに位置付けられる。提供リージョンは開始時点で米国東部のバージニア北部とオハイオ、米国西部のオレゴン、欧州のフランクフルトに限られる。購入方法はSavings Plans、オンデマンド、スポット、専有インスタンス、専有ホストが用意される。

AD

Graviton5はCPU密度とメモリ帯域を押し上げる

Graviton5の最大の差分は、AWSの汎用CPUインスタンスで処理密度を上げるための部品がそろったことだ。AWSによると、Graviton5は1チップに192コアを搭載し、Graviton4ベースの前世代に比べて最大25%高い計算性能を実現する。用途別の目安として、Webアプリケーションで最大35%、機械学習推論で最大35%、データベースで最大30%高速になるとしている。

単純なコア数だけではない。L3キャッシュは前世代比で5倍に増え、各Graviton5コアから見たL3キャッシュ量はGraviton4比で2.6倍になる。コア間通信のレイテンシは最大33%低下し、DDR5-8800メモリとPCIe Gen 6もサポートする。AWSはDDR5-8800について、クラウド上のプロセッサインスタンスで最速のDDR5メモリだと説明している。

この組み合わせは、AIという言葉よりも、CPU待ちが起きやすい実務ワークロードで理解した方が正確だ。多数のアプリケーションサーバー、データベース、分析処理、ゲームサーバー、EDA、ログ処理、コードリポジトリ、コンテナ基盤では、CPU、メモリ、ストレージ、ネットワークのどれか一つが詰まるだけで全体の効率が落ちる。Graviton5はその詰まりを、より大きなキャッシュ、より速いメモリ、より太いI/Oで減らす設計になっている。

AWSは顧客実績として、ClickHouseがM8g比で36%の性能向上を確認し、Honeycombが6カ月の本番A/BテストでGraviton4比36%高いコア当たりスループットを得たと説明している。HubSpotはMySQLデータベースでクエリ時間が最大60%短くなったとしている。これらは特定ワークロードの結果であり、すべての利用者にそのまま当てはまる数字ではない。それでも、M9gが単なる世代更新ではなく、本番移行の判断材料になるだけの実測値をAWSが前面に出していることは確かだ。

M9gdはローカルNVMeでI/Oの余裕を広げる

M9gとM9gdは、最大サイズで192vCPU、768GiBメモリ、100Gbpsのネットワーク帯域、72GbpsのEBS帯域を備える。ネットワーク帯域はインスタンスサイズ全体の平均で最大15%、EBS帯域は平均で最大20%増え、最大サイズではネットワーク帯域が最大2倍になる。

M9gdはここにローカルNVMe SSDを加える。最大構成では11.4TBのNVMe SSDを備え、Graviton4ベースのM8gdと比べてIOPSとストレージ性能が30%高い。対象は、アプリケーションサーバー、マイクロサービス、ゲームサーバー、ミドルサイズのキーバリューストア、キャッシュ、データロギング、メディア処理、バッチ処理、スクラッチ領域を使うアプリケーションなどだ。

Instance Bandwidth Configurationにも対応する。これはEC2インスタンスでEBSとVPCネットワークの帯域配分を最大25%調整できる機能で、データベースの読み書き、クエリ処理、ログ処理のように帯域の使い方が偏るワークロードで効く。M9g/M9gdの更新はCPUベンチマークだけを読むと見落としやすいが、実際にはデータ移動の余裕を広げる更新でもある。

AD

Nitro Isolation Engineは性能競争にセキュリティの軸を足す

両インスタンスは第6世代AWS Nitro System上に構築される。Nitroは仮想化、ストレージ、ネットワークの処理を専用ハードウェアへオフロードし、EC2インスタンス側のCPUとメモリをユーザーワークロードへ多く割り当てるための基盤だ。

今回AWSは、Nitro Isolation EngineをM9g/M9gdで導入した。AWSはこれを、仮想マシン間の分離、VMメモリ、CPUレジスタ状態、I/Oデバイスへのアクセスを最小限のAPIで仲介するコンポーネントだと説明している。特徴は形式手法による検証で、特定テストケースに合格したという意味ではなく、意図した挙動を数学的に示すアプローチを取る。

この点は、単に「高速な新CPU」という読み方から一歩進む。金融、医療、政府、SaaS基盤のように、クラウド上で性能と隔離を同時に求める顧客にとって、CPU更新はセキュリティ基盤の更新でもある。AWSはNitroを「初の形式検証済みクラウドハイパーバイザー」と表現しており、性能、I/O、隔離を同じ世代更新の中で語っている。

「AIチップ」ではなく汎用CPUとして見るべき理由

AWSはGraviton5を「agentic AI era」の文脈で打ち出している。AWSによると、Metaはエージェント型AI向けに数千万コア規模でGravitonを展開し、UberやSnowflakeもGravitonを導入する。Gravitonを利用する顧客はすでに12万を超える。

ただし、Graviton5をAIチップと呼ぶと本質を外す。Gravitonは汎用CPUであり、AWSのAI専用アクセラレータはTrainium系だ。エージェント型AIでは推論アクセラレータの周辺で、ツール実行、コード生成、複数環境の同時管理、ログや状態の処理が発生する。そのCPU需要が増えるからGraviton5が重要になるのであって、Graviton5自体がGPUや専用推論チップの代替になるわけではない。

The RegisterのCorey Quinn氏もこの点を強く指摘している。Graviton5の性能向上は評価しつつ、業界全体があらゆる発表をAIの文脈へ押し込むことで、Gravitonの実際の強みを見えにくくしているという批判だ。この視点は、AWSの発表を読むうえで有用である。Graviton5の価値は、AIという見出しよりも、汎用CPUフリートの世代更新、Arm移行、コスト効率、I/O、セキュリティの組み合わせにある。

AD

価格性能の改善はワークロードの形で決まる

M9g/M9gdへの移行判断で最後に残るのは、性能向上がコストにどう効くかだ。AWSはGraviton5について、より高い性能とエネルギー効率によって価格性能を改善すると説明している。高いCPU使用率で大規模フリートを動かしている企業なら、同じ仕事を少ないノード数や短い処理時間で済ませられる余地がある。

一方で、新世代への移行はインスタンス価格で約9%高くなる。固定数のノードを必ず持つ構成、たとえば顧客ごとに一定数のレプリカを割り当てるデータベースサービスや、可用性ゾーンごとに決まった台数を置く構成では、性能向上がすぐ台数削減につながらない。そうした場合、移行はまずコスト増として見える。

このためGraviton5の一般提供は、「AI時代の新チップ」という単純な話では終わらない。評価すべきなのは、アプリケーションがCPU、メモリ、I/O、ローカルストレージ、隔離要件のどこで詰まっているか、そして性能向上をインスタンス数、応答時間、EBS/VPC帯域、運用余力のどれに変換できるかである。M9g/M9gdは、その計算を実環境で始められる段階に入った。