OpenAI宣布与AMD、博通、英特尔、微软及英伟达共同推出多路径可靠连接(MRC)协议,并通过开放计算项目(OCP)向全球开源。该协议旨在解决大规模AI训练中的网络延迟与故障问题,优化算力集群的稳定性与能效。MRC采用多平面网络设计,将800Gb/s接口拆分为多条链路,仅需两层交换机即可支持约13.1万块GPU,大幅减少能耗和建设成本。其自适应数据包喷淋技术实现多路径并行传输,并结合SRv6源路由机制,将故障恢复时间缩短至微秒级。目前,MRC已在英伟达GB200超级计算机和甲骨文云基础设施中应用。该协议的推出被视为AI基础设施由堆叠式向精细化架构转型的重要步骤。