NVIDIAと言えば昔はゲーミングGPU、今はAI向けGPUでその名を轟かせているが、GPUのみならず、CPUとGPUを組み合わせた高性能コンピューティング(HPC)向けのスーパーコンチップも製造している。この、NVIDIAの72コアのGraceプロセッサとH100 GPUで構成されるGrace Hopper「GH200」が、世界中の9つの新たなスーパーコンピューターで採用されている事を発表した。
新たに設置されるのは、フランスのCEAとEvidenが提供するEXA1-HE、ポーランドの学術計算センターCyfronetにおけるHewlett Packard Enterprise(HPE)提供のHelios、スイス国立スーパーコンピューティングセンターにおけるHPE提供のAlps、ドイツのJülichスーパーコンピューティングセンターにおけるJUPITER、イリノイ大学アーバナ・シャンペーン校の国立スーパーコンピューティング応用センターにおけるDeltaAI、筑波大学の計算科学センターと東京大学の情報技術センターの間で設立された日本の最先端共同HPC基盤施設(JCAHPC:Joint Center for Advanced High Performance Computing)におけるMiyabi、英国のブリストル大学のIsambard-AIとIsambard 3、そして米国のロスアラモス国立研究所とテキサス先進計算センターのシステムがこれに続くとのことだ。
これらのシステムの構築は、最初からフルシステムな形ではなく、段階的にハードウェアが追加される事が多い。
これらのスーパーコンピューターは、科学シミュレーションに必要なFP64演算性能は大幅に低いものの、合計で200エクサフロップスという驚異的な「AI」演算能力を達成している。例えば、英国ブリストル大学のIsambard-AIスーパーコンピューターには現在168台のGH200が設置されているが、”今年の夏の終わりには “さらに5,280台のGH200が追加される予定だ。そうなれば、システムの性能は現在の32倍にスケールアップすることになる。
GH200は2023年5月に発表された。Arm Neoverse V2設計に基づく72コアのGrace CPUと480GBのLPDDR5xメモリー、そして高速NvLinkチップ間接続を使用する96GBから144GBのHBM3またはHBM3eメモリーを搭載したH100 GPUを組み合わせたものだ。だが発表からわずか数ヶ月で、メモリをHBM3からHBM3eにアップグレードしている。GH200はまだ多くのサーバーに導入されていないが、これはおそらく、市場に登場したのが最近であることと、ArmベースのCPUがまだx86に対する新進気鋭の挑戦者であるという事実によるものだろう。だが、状況は変わりつつあるようだ。
今回の発表で重要なのは、同社独自のCPUとGPU技術を搭載したNvidiaのGrace Hopperプラットフォームが、科学の世界で支持を集めているということだ。NVIDIAはAI GPU市場をほぼ掌握しているが、HPCは特に巨大で有利なビジネスであるため、スーパーコンピューターへの参入も同社にとって非常に重要であり、恐らく次のフロンティアとしてみているのだろう。
Source
コメント