世界最大55万台のGPUを持つxAI、実は6万台分しか使えていないことが判明
xAIは世界最大規模のAIクラスター「Colossus」を保有するが、その計算能力のわずか11%しか活用できておらず、新社長が2ヶ月以内に50%への改善を宣言した。これは、急速なハードウェア拡張に対しソフトウェア整備が追いつかず、MetaやGoogleに比べて実効的なGPU稼働率が著しく低いという構造的な課題を露呈している。
別名: InfiniBand
サーバー間やストレージ間を接続するための、極めて高いスループットと低遅延を特徴とする通信規格。AIの大規模分散訓練において、数千から数十万台のGPUを同期させるためのバックボーンとして広く採用されている。
xAIは世界最大規模のAIクラスター「Colossus」を保有するが、その計算能力のわずか11%しか活用できておらず、新社長が2ヶ月以内に50%への改善を宣言した。これは、急速なハードウェア拡張に対しソフトウェア整備が追いつかず、MetaやGoogleに比べて実効的なGPU稼働率が著しく低いという構造的な課題を露呈している。
生成AIブームが「実験」のフェーズから「実装と運用」のフェーズへと移行する中、Microsoftがシリコンレベルでの巨大な賭けに出た。2026年1月27日、同社は自社開発の次世代AIアクセラレータ「Azure Maia […]
生成AI革命の裏側には、華々しいモデルの性能向上とは対照的な、泥臭く、過酷なハードウェアの現実が存在する。NVIDIA H100をはじめとする最新鋭GPUは、驚異的な演算能力を持つ反面、その運用は極めて不安定だ。 サーバ […]
Microsoftは以前AGI構築のために「Stargate」と呼ばれる未曾有の大規模データセンターを構築する計画が伝えられたが、これについては未確認ながら、同社自身の口から現在でも桁違いの規模で計算能力の拡大を実施して […]
チップ設計の巨人であり現在はTenstorrentのCEOであるJim Keller氏は、NVIDIAが最近発表したBlackwell GPUアーキテクチャの研究開発費が100億ドルにも及んだことに対し、単に相互接続方式 […]
MicrosoftとOpenAIは、AIモデルの開発を大幅に加速させるため、「Stargate」と呼ばれるスーパーコンピューターを収容するための巨大なデータセンターの建設を計画していることが、内部関係者からの話として、T […]