NVIDIAがAIデータセンターの冷却で打ち出した考え方は、サーバーをより冷たく保つことではない。冷却液を摂氏45度まで上げたままラック全体を安定して動かし、建物側の冷却設備を小さくする。45度は一般的なホットタブの38〜40度より高いが、AIサーバーにとっては熱を外へ捨てやすくなる温度でもある。
同社は2026年6月21日、Rubin世代のAIインフラで「100%液冷」を実現する設計を説明した。対象はGPUやCPUにとどまらない。ネットワーク部品まで液体で冷やし、システム内のファンをなくす。従来のデータセンターで前提だった冷たい空気、ファン、冷却塔、チラーの組み合わせを見直せる。
NVIDIAが示した最大の数字は水使用量だ。条件の合う立地では、従来の冷却塔ベースの設備で1メガワット当たり年約260万ガロン使っていた施設冷却水をほぼゼロまで下げられるとしている。これは冷却の主役を蒸発式の水冷却から、閉じた液体ループと屋外のドライクーラーへ移す設計変更である。
45度の冷却液が冷却塔を遠ざける
従来の空冷データセンターは、サーバーから出る熱を大量の空気で運び出す。ラックの前面へ冷気を送り、背面から熱気を逃がすため、冷たい通路と熱い通路を作り、ファンで空気を動かし続ける。AI向けの高密度ラックではこのやり方が苦しくなる。NVIDIAは2025年のBlackwell関連説明で、ハイパースケール施設が1ラック当たり135kW超を支え得る段階に入り、従来の空冷はこうした電力密度で限界に近づくと説明していた。
Rubin世代の設計では、冷却液が発熱源に近いコールドプレートを通って熱を受け取る。液体は75%の水と25%のプロピレングリコールで、車の不凍液に近い混合液だ。NVIDIAによると、45度でラックに入った液体はチップ表面から熱を吸収しておよそ55度で出ていく。コールドプレートがデバイス温度を検証済みの動作範囲に保つため、プロセッサー性能は落ちないとしている。
この温度設定が効く理由は、外へ熱を捨てる側にある。冷却液を低温まで下げる必要がある場合、施設は機械式チラーや蒸発冷却に頼りやすい。45度の液体でよければ、屋外のドライクーラーで空気へ熱を逃がせる時間が増える。ドライクーラーは巨大なラジエーターのような設備で、水を蒸発させずに閉ループから外気へ熱を渡す。
NVIDIAの説明では、乾いた冷涼な地域なら冷凍機なしで運用できる時間が長く、暑い地域でもチラーを動かす日数を減らせる。ラックが冷たい空気に頼らないことが前提にある。サーバー内部の熱を液体が直接運ぶため、建物内を低温に保つ必要が薄れ、夏の暖かい空気でも運用設計の余地が広がる。
水使用量を減らす効果は立地に左右される
NVIDIAは、50MW級のハイパースケール施設が液冷インフラへ移行すれば、冷却関連のエネルギーと水コストで年400万ドル超を節約できるとしている。条件の合う施設では冷却塔ベースの設備で1MW当たり年約260万ガロンだった施設冷却水をほぼゼロにできるという。数字だけを見ると劇的だが、この主張には地理的な条件が含まれる。
同社自身も、スコットランド高地の施設とアリゾナ州フェニックスの施設では事情が違うと説明している。外気温が十分低い時間が長い場所ではドライクーラーがよく働く。高温の地域では、同じ45度液冷でもチラーや補助冷却の出番が残る。「最大100%削減」は施設冷却水に関する上限効果であり、すべてのAIデータセンターが同じ数字を出せるわけではない。
水と電力の関係も単純ではない。Amazonは自社データセンターの水効率に関する説明で、2025年の水使用を0.12L/kWhとし、通常時は約90%の時間で外気を使う空冷、最も暑い時間帯には蒸発冷却を使うとしている。チラーを使うと電力消費が25〜35%増える場合があり、暑い日のピーク電力需要と重なるため、水を少し使う方が総合的に負荷を抑えられる場面があるとも説明している。
NVIDIAの45度液冷は、この水と電力の取引を変えようとする。高温の液体を許容できれば、蒸発冷却で水を使うか、チラーで電力を使うかという選択の前に、ドライクーラーで処理できる時間を増やせる。これは固定されたメガワット枠の中でより多くのGPUを効率よく動かすというDSX MaxLPSの狙いにもつながる。
ここで減るのは主に施設内の冷却水である。電力を作る発電所で使われる水、建設時の資材や工事に伴う環境負荷、地域の送電網への影響までは消えない。NVIDIAの発表は冷却設備の水問題に強い答えを出すが、AIインフラ全体の持続可能性を一挙に解決するものではない。
GB200からRubinへ、密度が空冷の余地を狭める
この発表がRubin世代と結びついているのは、AIサーバーの密度が冷却方式を押し上げているためだ。NVIDIA GB200 NVL72は36基のGrace CPUと72基のBlackwell GPUを1つのラックスケールシステムに収める。GB300 NVL72では72基のBlackwell Ultra GPUと36基のGrace CPUを統合し、NVIDIAはHopper世代のAIファクトリーに比べて最大50倍の出力性能をうたっている。
Vera Rubin NVL72では、72基のRubin GPUと36基のVera CPUを組み合わせる。NVIDIAはLPXと組み合わせた場合に、兆パラメータ級モデルで1MW当たり最大35倍のスループットを示すとしている。これらの性能値にはワークロード条件や将来仕様の前提があるが、方向性は明確だ。AI推論、とくに長いコンテキストやエージェント型処理はラック当たりの発熱密度を上げ続ける。
空冷が苦しくなるのは、GPUだけが熱いからではない。NVIDIAは、以前の液冷サーバーはGPUやCPUだけを液冷し、他の部品は空気で冷やすハイブリッド構成だったと説明している。Rubin世代の全液冷では、ネットワーク部品や基板上の熱設計も液体前提に作り直す。液体の経路を単純にし、複数の高出力チップへ1つの入口と出口で流すようなトレイ単位の設計が必要になる。
サーバーの物理設計も変わる。空冷サーバーのような穴の開いた前面パネルではなく、密閉された前面になる。NVIDIAは従来6ラックユニットを使っていたシステムが2ラックユニットに収まる例を挙げ、全液冷によってラック密度を上げられるとしている。冷却のために場所を取っていた空気の通り道を、演算密度へ置き換える話でもある。
DSXは冷却を施設全体の制御問題にする
45度液冷の発表は単体の冷却機器の話ではなく、NVIDIA DSXの文脈に置かれている。DSXはAIファクトリーの設計、シミュレーション、運用を一体化するプラットフォームで、チップ、システム、ネットワーク、ストレージ、電力、冷却、制御を同じ設計の中に入れる。NVIDIAはVera Rubin DSX AI Factory reference designを2026年3月に発表し、Omniverse DSX Blueprintで施設のデジタルツインを作る構想も示している。
DSXの中で冷却に近い役割を持つのがMaxLPS、Flex、Exchangeだ。MaxLPSはGPU、ラック、ワークロード単位で電力を制御し、固定された電力枠の中でトークン性能を最大化する。NVIDIAは45度液冷とラック内の電力効率技術を組み合わせることで、オペレーターが同じメガワット枠内で最大40%多くGPUを動かせるとしている。
Flexは、データセンターを送電網と切り離された固定負荷ではなく、需給信号に応じて負荷を動かせる設備として扱う。負荷制限、デマンドレスポンス、価格イベントなどのグリッド信号を受け取り、AIワークロードを動的に調整する。Silicon Valley PowerとEmerald AIの商用マルチメガワット実証にも触れられている。
ExchangeはITと施設設備の信号をつなぐ通信層だ。冷却設備、電力設備、ネットワーク、GPUクラスタが別々に動くのではなく、施設側の情報をAIファクトリーの運用へ渡す。45度液冷が効果を出すには、外気温、冷却液温度、ラック電力、ワークロード負荷、電力価格を同時に見て、どこまで冷やすか、どこまで演算を増やすかを決める必要がある。
公開されているDSX文書には、Vera Rubin向けの施設インフラ参考設計として「45C Inlet」の項目が見える。詳細なReference DesignはNVOnlineのアクセスが必要で、一般公開ページだけでは配管、冗長性、保守、コストの具体仕様までは読めない。NVIDIAが提示したのは方向性とエコシステムであり、実施設計の細部はクラウド事業者や設備ベンダーとの実装に残されている。
水の削減はAIインフラ拡大の免罪符にはならない
NVIDIAの45度液冷は、AIデータセンターに対する「水を大量に使う施設」という批判に対して、かなり直接的な技術回答になる。閉ループの液体とドライクーラーで施設冷却水をほぼゼロへ近づけられるなら、冷却塔からの水消費は大きく減る。システム内のファンをなくし、従来6ラックユニットを使っていた構成を2ラックユニットへ詰められるなら、ラックと施設の設計も冷却を前提に組み替わる。
一方で、効率が上がるほどAIインフラが増えるという問題も残る。NVIDIAのDSXは、少ない電力で同じ計算をするだけでなく、同じ電力枠でより多くのGPUを動かすことを狙っている。冷却の改善は環境負荷の削減策であると同時に、AIファクトリーをより大規模に建てやすくする成長策でもある。
次に問われるのは「水をどれだけ減らしたか」だけではない。45度液冷を採用した施設が、どの地域で、どの程度チラーを使わずに運用できたのか。建設コストと保守コストは従来方式と比べてどう動くのか。電力由来の水使用や炭素排出を含めた総負荷は下がるのか。NVIDIAの発表はAIデータセンターの冷却設計を一段進めたが、実績として評価されるにはクラウド事業者の運用データが必要になる。
45度の液体でAIラックを冷やすという発想は直感には反する。だが、AIインフラがラック単位から施設単位の設計競争へ移った今、低温に保つこと自体が効率の証明ではなくなった。冷たさを競うのではなく、熱をどこで受け取り、どの温度で外へ捨て、どれだけの水と電力を演算に回せるか。Rubin世代の液冷設計は、その競争軸をはっきり変える発表である。