Intel、Hewlett Packard Enterprise (HPE) 、米エネルギー省アルゴンヌ国立研究所が共同で開発したスーパーコンピューター「Aurora」が新たなエクサスケール・スーパーコンピューターの仲間入りを果たした。オークリッジ国立研究所のAMD CPUによる「Frontier」には一歩及ばなかったが、AIを中心としたHPL-MxP混合精度ベンチマークで首位を獲得し、世界最速のAIスーパーコンピューターの地位は獲得した。
HPLスコア1.01エクサフロップス、AIスコアは10.6エクサフロップス
Auroraは昨年11月にTop500の2位でデビューしたが、当時はまだシステムが半分しか稼働しておらず、その際のLinpackベンチマークスコアは585ペタFLOPSの倍精度性能を発揮した。今回の最新のランキングでは、このスーパーコンピューターの更に高まった能力を見ることが出来るが、Auroraはまだ完全には稼働しておらず、システム全体の完全な性能はまだ明らかになっていない。現在Auroraは、ハードウェアや冷却システムの故障、操作エラー、ネットワークの不安定性など、数多くのハードウェアの問題に悩まされているようだ。
Auroraは、21,248個のIntel Xeon CPU Maxプロセッサーと63,744個のIntel Data Center GPU Maxアクセラレーターが10,624枚のコンピュート・ブレードに搭載されている。最新のテストでは、全10,624ノードのうち9,234ノードがアクティブになった状態(87%が稼働)で、1.012エクサフロップスの性能を叩き出した。
Auroraは、HPL-MxP混合精度ベンチマークではるかに優れた性能を発揮し、システム全体の89%のみがアクティブな状態で10.6エクサフロップスのAI性能を記録した。FP64精度を使用するLinpackとは異なり、HPL-MxPはFP32とFP16を使用する。FP64は伝統的な科学計算で主に使用される一方、AIワークロードやその他の実世界のアプリケーションでは主に低精度が使用されるため、Linpackはスーパーコンピュータの真の能力を示す唯一の指標ではなくなっている。
High Performance Conjugate Gradients(HPCG)ベンチマークもまた、Linpackよりも実際のワークロードアプリケーションを代表するように設計されている。Auroraは、このベンチマークでもシステム全体の38.5%がアクティブな状態でランキング3位を獲得した。Auroraは、データ集約型アプリケーションの性能を測定するために設計されたGraph500ベンチマークでも5位を獲得したが、ANLはこのベンチマーク実行時のシステムのアクティブ率を明らかにしていない。
アルゴンヌ国立研究所がAuroraのフルハードウェアでベンチマークを実行できないのは、冷却問題、操作ミス、ネットワークの不安定性など、数多くのシステム障害が原因である。しかし、エンジニアがこれらの問題を解決し、システムを完璧にチューニングしたとしても、現在1.206エクサフロップスで、Auroraより約19%高速なFrontierを打ち負かす事は難しいだろう。リニアなスケーリングを行ったとしても、残りの13パーセントのAuroraノードは、現在のリーダーを打ち負かすのに必要な200ペタフロップスを追加することはできない。
AMDも今年、El Capitanと呼ばれる独自の次世代スーパーコンピューターの導入を計画しており、2エクサフロップスのパフォーマンスが期待されている。NVIDIAも本日、世界中の9台のスーパーコンピューターでGrace Hopper CPU+GPUコンボが稼動していることを発表した。スーパーコンピューター競争は、特にAIの性能が最重要視されるようになるにつれて、今後大きくその様相が変わってくる事が予想される。
Source
コメント