通信世界网消息(CWW)近日,中国电信研究院在智能计算领域迎来技术与标准双重突破:一方面主导成立IEEE首个异构推理系统工作组并获批标准立项,另一方面完成业界首个面向大模型推理的异构算力协同技术验证,为智算产业高质量发展注入强劲动力。
当前,随着人工智能推理场景的广泛应用,针对推理Prefill阶段“高算低存”和Decode阶段“低算高存”需求特性优化模型部署成为行业共识,中国电信率先完成业界首个异构双芯 PD 分离混合推理技术验证,并同步启动 IEEE 标准立项工作。
标准层面,在 IEEE 新标准委员会(NesCom)会议上,中国电信研究院主导的 “异构混合推理系统工作组” 成立,云网融合技术研究所孙梦宇博士任首任主席,牵头编制的《异构混合推理系统技术规范》(Standard for Technical Requirements for Heterogeneous Hybrid Inference Systems)获批立项,成为IEEE首个异构推理系统国际标准,将为构建开放、协同、高效的新型智算基础设施提供规范支撑。此外,中国电信研究院近期还在 ITU-T SG13 成功主导智算云领域重要标准 Y.3531 “Cloud computing - Functional requirements for machine learning as a service” 修订立项。这一成果有效打破传统云计算标准与智算技术的壁垒,为后续在云计算标准体系内推进智算及大模型相关标准制定奠定坚实基础。
技术层面,中国电信研究院联合北京智源人工智能实验室、昆仑芯科技、中兴通讯、壁仞科技等伙伴,依托云网融合大科创装置,完成业界首个 “英伟达算力 + 国产算力” 异构 PD 分离推理验证,依托“翼芯”算力使能平台,构建全栈异构混推体系,实现三大核心技术创新:一是自研传输引擎完成异厂家RDMA互通,实现跨架构芯片PD池间KVCache的高效传输;二是自研测试优化工具,根据业务特征与算力性能自动推荐并实时优化PD资源配比;三是构建AI异构推理平台,实现推理任务在Prefill池与Decode池间的动态调度。验证显示,DeepSeek671B 模型在 6 类典型场景下,推理集群总吞吐性能提升 30%-72%,并发能力提升 2 倍,同等吞吐下成本最高下降 42%,实现 “存量利旧” 与 “国产替代” 目标。
未来,中国电信研究院将深化集团公司 “云改数转智惠” 战略,在 IEEE、ITU-T 等组织围绕 “息壤” 智能云布局标准,提升智算基础设施领域话语权,同时联合伙伴完善 “互联互通、高效协同” 的算力生态,助力网络强国、数字中国建设。