通信世界网消息(CWW)智能时代加速到来,企业模型训练、推理算力需求爆炸式增长。对于企业来说,采用第三方云上智算资源是降低资本支出的最佳选择,但在数据入算、模型微调、推理输出等过程中可能面临数据、模型泄漏的问题。对于企业和行业用户来说,一方面要降低算力成本,同时又要保障训练、推理过程中的数据安全、用算安全。在此背景下,开展基于智能IP广域网(AI WAN)的存算分离与云边协同训推技术研究具有重要意义。
2025年9月24日,中国信息通信研究院(简称“中国信通院”)技术与标准研究所联合华为技术有限公司在“2025中国国际信息通信展览会”的新质互联网-AI WAN产业研讨会上发布了《基于智能IP广域网(AI WAN)的存算分离与云边协同训推技术研究报告(2025年)》,中国信通院技术与标准研究所互联网中心主任高巍对报告进行了深入解读。
报告研究面向政企模型微调训练、推理等业务场景,围绕企业安全用算需求,基于智能IP广域网(AI WAN)研究并提出了存算分离与云边协同训推技术方案,满足企业原始数据不出域、安全租用云端算力、降低企业用算成本的需求。在存算分离模型微调训练场景下,针对企业敏感数据园区外“不落盘”需求,可保障拉远100KM、400KM达到97%以上高算效。在云边协同推理场景下,可实现推理性能95%以上高算效,满足企业推理数据不出域的安全推理诉求。
报告主要内容
1. 分析大模型微调训推场景面临的挑战。当前企业在AI模型微调训练、推理等场景中面临安全和成本两重挑战。在企业训推过程中,一方面明确数据需在原始产生域内处理,以规避跨域流动中网络攻击、恶意篡改等安全威胁。另一方面若企业自行搭建、维护算力资源,成本压力过大;若转向网络租赁,又会因计算效率明显降低,间接导致用算成本增加。
2. 提出基于智能IP广域网(AI WAN)的存算分离与云边协同训推技术方案。存算分离与云边协同训推技术方案在存算分离模型微调训练与云边协同推理两大场景中,分别从资源调度、数据安全管理、算力分配等维度提供针对性技术方案,兼顾用算安全与成本,帮助破解行业痛点问题,为突破AI应用瓶颈提供了核心支撑。支撑存算分离与云边协同训推技术方案的核心技术包括模型拆分学习技术、精准流控技术和自动流级调度技术。
来源:中国信通院
3. 深度总结存算分离与云边协同训推的三大核心技术。模型拆分学习技术通过将模型与数据按安全等级、处理需求拆分部署,从根源上避免了原始数据泄露的风险。同时,解决算力获取、数据保护与成本控制的矛盾。精准流控技术与SRv6切片功能结合,通过整网路径部署对应的切片,在满足不同业务对网络带宽、时延、抖动等差异化SLA需求的情况下实现逐级反压。从而保障企业用算的算效稳定性,降低企业用算成本。自动流级调度技术通过控制器纳管智能IP广域网设备,基于优化算法以网络带宽利用率最大为目标进行路径规划,实现网络运力最大化,进一步为企业用算提高效率,可有效降低企业用算成本。
4. 关键技术典型场景实验验证。在实验室针对大模型存算分离、云边协同训推、训推安全等方面进行了系统性研究与多轮次验证。实验数据有效验证了模型拆分学习技术的安全性,同时验证了精准流控技术与自动流级调度技术对智能IP广域网络的无损与算效保障,在LLAMA2-13B、Qwen2.5vl-32B、CV类模型RESNET、DeepSeek等大模型100KM和400KM存算拉远场景下,算效劣化低于3%,Qwen 32B模型在200KM云边协同推理场景下,劣化不超过5%。
报告目录
一、概述
(一)背景
(二)AI大模型训练与推理技术应用
二、大模型微调训推场景面临的挑战
三、基于智能IP广域网(AI WAN)的存算分离与云边协同训推技术方案
(一)方案总体架构
(二)模型拆分学习技术
(三)精准流控技术
(四)自动流级调度技术
四、关键技术典型场景实验
(一)存算分离拉远算效
(二)云边协同推理安全性
(三)云边协同算力资源配置优化
五、总结展望
主要专家简介
中国信通院技术与标准研究所互联网中心主任,高级工程师
高巍
中国通信标准化协会TC3WG3组长,网络5.0技术和产业创新联盟秘书长。长期从事数据通信、云计算、工业互联网等领域的研究,负责2项国家标准和20余项行业标准的制订,在国内外公开发表论文20余篇,参编专著1部,获得专利授权3项。
中国信通院技术与标准研究所工程师
陈云柯
长期从事数据通信、智算广域网等领域研究工作,负责1项国家标准和4项行业标准的制订,在国内外公开发表论文6篇,获得国家发明专利4项。
版权声明:本报告版权属于中国信息通信研究院、华为技术有限公司,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院、华为技术有限公司”。