您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。除部署规模外,AI 网络的内在优化亦推动交换机增量需求

除部署规模外,AI 网络的内在优化亦推动交换机增量需求

分享
+
下载
+
数据
除部署规模外,AI 网络的内在优化亦推动交换机增量需求
数据
© 2026 万闻数据
数据来源:AI 网络技术白皮书,申万宏源研究,MSA800G 白皮书
最近更新: 2025-12-29
补充说明:1、E表示预测数据;2、*表示估计数据;

数据描述

2)零丢包与低延迟。传统以太网本质上是一种允许丢包的网络技术,上层的TCP/IP协议可以通过重传机制保证数据的最终可靠性。但在AI训练集群中,海量GPU通过集合通信频繁同步梯度与参数。一旦发生网络丢包,不仅会触发重传增加延迟,更可能破坏全局通信的同步性,导致所有计算单元等待,产生严重的“长尾延迟”,甚至迫使训练任务回退到之前的检查点,极大降低训练效率。

当前,零丢包与低延迟网络主要通过InfiniBand和基于RoCEv2的以太网两条技术路径实现。Infiniband具备原生的无损网络特性,加之深度绑定英伟达硬件,使得其在AI训练集群构建的早期成为建设“AI Factory”的最优解。以太网方面,RoCEv2是当前主流,而新兴的UEC(Ultra Ethernet Consortium)协议栈旨在提供更优的解决方案。