ローレンス・リバモア国立研究所(LLNL)のスーパーコンピュータEl Capitanが、Top500ランキングで世界最速の座を獲得した。AMDのMI300A APUを搭載したEl Capitanは、1.74エクサフロップスの演算性能を実現し、これまでトップを維持してきたFrontierを約30%上回る性能を示した。
革新的なアーキテクチャが実現した圧倒的な性能
El Capitanの卓越した性能を支えているのは、AMDが開発した革新的なMI300A APUである。このプロセッサは、約1,460億のトランジスタを内蔵する AMD史上最大規模のチップとなっている。その内部構造は、9つのコンピュートダイを4つの6nmプロセス製ベースダイ上に3D実装するという複雑な設計を採用している。このベースダイは単なる基板ではなく、メモリやI/O制御などの機能を担うアクティブインターポーザーとして機能する。
システムアーキテクチャの特筆すべき革新点は、CPUとGPUの統合設計にある。各MI300A APUには24個のZen 4プロセッサコアと6個のCDNA 3グラフィックスエンジンが同一パッケージに統合されている。この統合により、単一チップで61.3テラフロップス(ベクトル演算)および122.6テラフロップス(行列演算)という驚異的なFP64倍精度演算性能を実現している。
システム | コア数 | Rmax (PFlop/s) | Rpeak (PFlop/s) | 電力(kW) |
---|---|---|---|---|
El Capitan – HPE Cray EX255a、AMD 第 4 世代 EPYC 24C 1.8GHz、AMD Instinct MI300A、Slingshot-11 | 11,039,616 | 1,742 | 2,746 | 29,581 |
Frontier – HPE Cray EX235a、AMD カスタム第 3 世代 EPYC 64C 2GHz、AMD Instinct MI250X | 8,699,904 | 1,353 | 2.055 | 22,786 |
Aurora – HPE Cray EX – Xeon CPU Max 9470 52C 2.4GHz、Intel データセンター GPU | 9,264,128 | 1,012 | 1,980 | 38,698 |
メモリアーキテクチャも従来の常識を覆す設計となっている。各APUには8スタックのHBM3メモリが実装され、合計128GBのメモリ容量と5.3テラバイト/秒という圧倒的な帯域幅を確保している。特筆すべきは、このメモリがCPUとGPU間でキャッシュコヒーレントな共有メモリとして機能する点である。LLNLのコンピューティングCTOであるBronis R de Supinskiによれば、このメモリコヒーレンシーにより「プログラミングと最適化が大幅に簡素化される」という。
システム全体は11,136ノードで構成され、各ノードに4基のMI300A APUが実装されている。ノード間は200Gbpsのスループットを持つSlingshot-11インターコネクトで接続され、総計5.4ペタバイトという膨大なHBM3メモリを備えている。このような大規模システムでありながら、1ワットあたり58.89ギガフロップスという優れた電力効率を実現している点も注目に値する。これはGreen500ランキングで18位という高順位につながっており、大規模システムでありながら優れた電力効率を両立している証左となっている。
この革新的なアーキテクチャにより、El Capitanは理論ピーク性能で2.79エクサフロップス、実測値でも1.74エクサフロップスという驚異的な性能を達成した。この性能は、1秒間に540億年分の計算を行うことに相当する。さらにLLNLは、システムの機密ネットワークへの移行時に実施予定の最終的なLinpackベンチマークで、さらなる性能向上の可能性を示唆している。
国家安全保障と科学研究の両立
El Capitanの最重要ミッションは、米国の核抑止力の信頼性維持にある。National Nuclear Security Administration(NNSA)のCorey Hindersteinが強調するように、このシステムは米国初のエクサスケールコンピュータとして、地下核実験に依存しない核備蓄の安全性、信頼性、性能の検証という重要な役割を担っている。特に、核弾頭の経年変化による影響、安全性、信頼性の評価に加え、新たなICBM(大陸間弾道ミサイル)2種の設計開発にも活用される予定である。
このような機密性の高い任務を遂行する一方で、El Capitanは幅広い科学技術分野での活用も計画されている。生物学分野では分子レベルでの生命現象のシミュレーション、気象予報では高精度な気候変動予測、地震モニタリングでは地殻変動の詳細な解析が可能となる。さらに、自然災害シミュレーションでは、従来よりも精緻な被害予測と対策立案が実現できる。特筆すべきは、これらの研究においてHPCとAIを融合させた新しいアプローチが採用される点である。
リバモア、ロスアラモス、サンディアの3研究所による共同利用体制も注目に値する。これらの研究所は、El Capitanの卓越した演算能力を活用して、前例のない精度と速度で3次元マルチフィジックスシミュレーションを実施する。この取り組みにより、複数の物理現象が複雑に絡み合う現象の解明が可能となり、基礎科学から応用研究まで幅広い分野での breakthrough(画期的な発見)が期待される。
El Capitanのもう一つの重要な特徴は、その費用対効果の高さにある。LLNLの報告によれば、同規模のシステムと比較して、El Capitanは「圧倒的に費用対効果が高い」システムとなっている。この経済性は、限られた研究予算の中で最大限の科学的成果を追求する上で重要な意味を持つ。特に、高額な運用コストが課題となる大規模スーパーコンピュータにおいて、この費用対効果の高さは特筆に値する。
さらに、El Capitanには小規模な姉妹システムであるTuolumneも併設されている。Tuolumneは理論ピーク性能288ペタフロップス、実測値208ペタフロップスを実現し、より機動的な研究開発プロジェクトに活用される。この二層構造により、機密性の高い国家安全保障関連の計算と、オープンな科学研究の両立が可能となっている。このような柔軟な運用体制は、スーパーコンピュータの新しい活用モデルとして、国際的にも注目を集めている。
Source
- Top500: November 2024
コメント