中国电信完成业内首例超百公里分布式无损智算网现网验证

责任编辑:包建羽 2024.05.12 22:58 来源:通信世界全媒体

通信世界网消息(CWW)近日,中国电信云网融合工作取得新突破。中国电信集团公司统一组织中国电信北京公司、中国电信研究院,在现网完成业内首例智算长距无损互联技术验证,分布式训练性能达到集中式单智算中心训练性能的90%以上,证实了分布式无损智算网技术方向的可行性,充分发挥出中国电信云网融合的优势。

面对未来十万乃至百万卡需求,集团云网发展部在业界率先提出通过长距无损智算网构建分布式智算集群的创新方向,解决单体智算中心的算力、空间、供电等资源限制,并纳入到科创重点攻关课题。而当前业内大模型训练网络无损最远传输距离不超过2公里,长距离无损传输一直是困扰业界的难题。

中国电信成立攻关项目组,聚焦研究长距无损智算网络技术。经过近一年的攻关,解决了超百公里无损智算网难题,智算DCN网络由DC内走向广域网,将物理上分散的智算资源整合成一个智算集群。联合项目组严谨论证,扎实推进,于2023年8月份完成分布式无损智算网方案设计,同年10月份开始基于云网融合大科创装置持续开展长距无损交换机技术验证,2024年2月份在北京电信现网完成800G超高速波分技术验证。通过不断完善和优化,近日在实验室完成万亿/十万亿级参数大模型分布式训练仿真验证,并在北京电信武清、永丰、瀛海三地IDC机房完成数百亿参数经典大模型的分布式训练任务,这将为京津冀等算力协同调度奠定基础,促进数字经济与实体经济的深入融合。

中国电信一直走在智算基础设施建设的前列,未来将继续面向更大规模、更长距离的分布式智算网发起攻关,走出一条具备中国电信特色的新型智算基础设施发展道路,赋能千行百业智能化升级。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容