テクノロジー
OpenAIと主要ハードウェアベンダー、大規模AI学習を加速する新ネットワークプロトコル「MRC」をオープンソース化
OpenAIなどが大規模AI学習向けに次世代ネットワークプロトコル「MRC」を開発し、Open Compute Projectを通じて公開した。これは、パケットのマルチパス散布や選択的再送によりネットワーク渋滞と障害復旧の遅れを大幅に改善し、階層を減らしたフラットな物理トポロジでインフラコストを削減する。
別名: RDMA over Converged Ethernet
UDP/IPカプセル化を使用して、イーサネットネットワーク上でリモートダイレクトメモリアクセス(RDMA)を可能にするネットワークプロトコル。データセンター内での低遅延・高スループットな通信を実現するが、従来の順序保証メカニズムには大規模AI学習における課題があった。