环球网
“在智算时代,网络在 AI 基础设施中的投资占比虽仅约 10%,但性能优化却能撬动超过 30%的算力业务能力。”新华三集团高级副总裁、网络产品线总裁乔剡在第九届未来网络发展大会期间提到。
新华三集团高级副总裁、网络产品线总裁 乔剡
乔剡强调,这正是新华三从去年起将“算力×联接”作为核心战略的底层逻辑。“过去计算与网络生态相对割裂,而在智算时代,这种割裂状态必须被打破。”他解释道,一个经过优化的网络能显著提升整体算力业务能力,其价值相当于“免费获取的算力增益”。
面对国产GPU生态多元化的行业现状,新华三秉持“多元异构”开放战略,与众多品牌厂家深度合作。乔剡表示,相比封闭的“全家桶”生态,适配不同GPU厂家、算力模型的开放架构更具挑战。目前,新华三正以 “算力 × 联接” 为战略支点,打破传统计算与网络割裂的生态壁垒,通过多元异构的技术布局,为智算基础设施提供端到端的解决方案。
端网协同与超节点:智算网络的演进方向
随着大模型产业从预训练向 “后训练 + 推理” 转型,卡间高速互联成为智算网络的核心关注点。对此,新华三提出 “端网协同” 解决方案,打破传统服务器与网络的运维边界,实现算力与联接的深度协同。
新华三集团交换机产品线产品管理部部长陈伯超解释,端网协同的核心是让 GPU 或网卡 “感知” 网络状态:“我们通过与网卡对接来获取整网的通信关系,并在网络侧针对GPU间的通信关系进行精准调优,实现高效协同效果。”
这一方案可适配多元芯片,无论何种交换机、GPU 或网卡,只要遵从方法论即可进行适配。目前,该方案已在 50 余款新华三交换机及多家 GPU、网卡厂商的联合验证中成功运行 Llama3 模型,网络性能平均提升 16%,防拥塞效果提升 20%。
在硬件创新方面,新华三在本次大会上正式发布基于最新 102.4T 芯片研发的高性能 800G AI 交换机 H3C S9828-128EP。该产品具备 128 个 800G 端口,是当前业内单机容量最高的交换机。在两层 Spine-Leaf 架构下,它可支持 10K+800G 端口,相比上一代产品节省 70% 的设备用量和 50% 的光模块用量,大幅提升部署效率与资源利用率。值得关注的是,其全部端口均支持 LPO/LRO 光模块,实现超低时延传输的同时显著降低能耗;散热架构采用液冷与风冷兼容设计,能灵活适配液冷整机柜部署,满足未来全液冷机房建设需求。
此外,新华三创新推出 DDC(Diversified Dynamic-Connectivity,多元动态联接)架构,通过全局端到端调度实现算力与网络的彻底解耦。依托信元转发技术将数据按 512 字节切片均匀喷洒,消除 HASH 极化,实现 100% 负载均衡;在网络边缘侧完成切片重组,使网卡无需支持乱序重排,即可实现多元算力的平滑接入与免调优。经 Tolly 机构权威验证,DDC 架构在有效带宽方面相比 ECMP 最高提升 107%;在 All-to-All 场景下,传输性能较 InfiniBand 方案平均提升 2.5%,优势显著。
破局智算生态确定性网络支撑跨域算力调度
在智算时代加速到来的背景下,新华三集团自去年起将 “算力 × 联接” 作为核心战略关键词,凭借在计算与网络两大领域的均衡优势,正成为国内智算基础设施建设的关键力量。
“新华三是国内少有的在计算和网络领域均处于 Top2 或 Top3 地位的企业。” 乔剡强调,这种均衡优势正是 提出“算力 × 联接” 战略的底气。过去,计算与网络生态相对割裂,而在智算时代,这种割裂状态必须被打破。
乔剡进一步解释,尽管网络在整个智算 AI 基础设施中的投资占比仅约 10%,远低于 GPU 算力 90% 的占比,但网络性能的优化、调优与改进,所能撬动的整体算力业务能力却可能超过30%。“一个调优良好的网络,相当于为客户‘免费获得’算力增益,这正是网络在 AI 基础设施中核心价值的体现。”
乔剡还明确表示,新华三定位为数字化及 AI解决方案供应商,通过与合作伙伴协同,协助政府和企业提升 AI 部署能力。
针对国家“东数西算”等重大战略需求,新华三与未来网络集团合作四年打造的确定性网络成为核心支撑技术。该网络实现了“三个确定”——确定的路径、确定的带宽、确定的时延和抖动,专门解决跨区域算力调度的痛点。
“中国幅员辽阔,能源与人口分布不均,跨地域骨干网络的高通量、无损传输需求是全球罕见的。”乔剡指出,从宁夏、新疆的数据中心到杭州、深圳的算力需求端,数千公里的传输距离对网络稳定性提出极致要求。新华三凭借在产业界与学术界的长期积累,已在该领域形成领先经验,其确定性网络技术为东数西算、东数西存等场景提供了可靠的基础设施保障。
乔剡强调:“我们不做‘PPT式标准’,而是通过产品研发、交付运维的全流程实践,与芯片厂商、ISV、高校等产业链伙伴协同,在AI前沿领域打磨适配国内多元异构生态的技术标准。”