中国联通发布全球最长距离大模型异构混训成果

责任编辑:梅雅鑫 2025.07.21 10:39

通信世界网消息(CWW)7月19日,在2025中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,正式发布了全球最长距离大模型异构混训试验成果,向业界展现了中国联通在智算网络关键技术领域的里程碑,为智算产业的高质量发展注入新范式。

image.png

随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。

在此背景下,中国联通联合上海人工智能实验室,阿里云、浪潮、基流科技、加佳科技等行业合作伙伴,面向国产异构GPU环境,针对超大模型跨域训练和碎片化算力整合需求,依托“算力智联网AINet长距无损传输技术优势结合上海人工智能实验室“DeepLink” 超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心间构建长度超1500公里的跨域异构混训系统;通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置,完成了1500公里跨域的千亿参数AI大模型异构混训试验经验证等效算力可达单芯片单集群等效算力的95%以上在算力互联层面,采用联通自研内置长距RDMA协议栈的RoCE交换机,兼顾DC内和DC间高性能网络需求;在算力调度与资源管理层面,通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度;在算力协同层面,基于DeepLink在训练加速、异构通信、并行策略等核心技术,实现千亿参数大模型在超长距离异构GPU环境下的高效训练。

上述成果标志着中国联通在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域实现了实质性技术突破,为下一代互联网产业发展奠定坚实基础。面向未来,中国联通将锚定“世界一流科技服务企业”战略目标,持续深耕智算基础设施和下一代互联网领域关键技术,携手产学研用各界合作伙伴,从组网、协议、管控等方面,共同推动智算网络核心技术突破、前沿应用场景落地与生态体系建设。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容