以杭州算力资源调度平台为例,探究算力中心互联互通技术路径

作者:浙江算力科技有限公司 尹小康 责任编辑:王鹤迦 2025.07.20 11:00 来源:通信世界网

通信世界网消息(CWW)随着人工智能、大数据等技术的快速发展,算力已成为数字经济时代的核心生产力。党中央、国务院明确提出“加快形成全国一体化算力体系”的战略部署,工业和信息化部于2025年5 月30日发布《算力互联互通行动计划》(以下简称《行动计划》),提出到2028 年基本实现全国公共算力标准化互联的目标。在此背景下,如何突破区域壁垒、解决技术标准不统一等问题,构建高效协同的算力网络,成为当前算力基础设施建设的关键命题。

算力中心互联互通的现状与挑战

《行动计划》从筑牢算力互联基础、优化设施互联、促进资源互用等6个方面部署了16项重点任务,提出通过统一算力标识、建设多级互联互通平台等方式解决算力资源利用率不高、异地异构协同难等问题。此外,国家发展改革委等部门发布《国家数据标准体系建设指南》,强调强化算力保障和流通利用标准建设,为数据算力融合一体化发展提供支撑。这些政策的出台,为算力中心互联互通创造了良好的政策环境,并指明了发展方向。

当前,算力中心互联互通面临多重挑战。首先,技术标准分散。不同主体的算力资源存在协议不一致、接口不兼容等问题,导致跨平台调度效率低下。其次,“资源孤岛”现象突出,区域间算力供需存在错配问题,东部地区算力需求旺盛,而西部地区算力资源闲置,无法实现有效共享和合理配置。最后,市场机制不完善。中小企业的算力成本高、接入门槛高,难以参与算力资源共享,使得头部企业的市场优势进一步扩大,不利于市场的公平竞争和健康发展。

实证案例:杭州市算力资源调度服务平台的实践

为应对算力中心互联互通面临的挑战、探究其创新发展的技术路径,本文对杭州市算力资源调度服务平台进行深入分析。

杭州市算力资源调度服务平台于2025年3月正式启用,首批接入5家数据中心,整合了通用算力、智能算力等多元资源。通过算力超市、撮合交易、AI训推一体化平台等设施与功能,对分散的算力资源进行整合,将算力利用率提升了30%以上,研发成本降低了40%。平台接入多家智算中心,支持可开放算力规模达5000PFlops以上,高性能算力占比超过60%。

平台架构与功能

杭州市算力资源调度服务平台通过算力超市提供标准化算力产品,支持算力券在线领用,以及在线签约、按量计费;算力撮合交易功能实现了供需智能匹配,能够有效协调跨区域资源调配;平台集成Al训推一体化工具,降低了企业技术门槛。

在算力并网与监测方面,平台采用混合并网架构,公网场景通过HTTPS加密保障数据安全,专网场景采用IPSecVPN实现低时延传输,满足高频数据交互需求。监测层实时采集算力负载、电力消耗等数据,通过标准接口与国家级平台同步,当出现异常指标时,触发短信、邮件、系统弹窗等多级预警。

平台采用智能调度引擎,基于业务类型、网络延迟、能耗等多因子加权决策,并结合强化学习动态调整策略。例如,针对实时渲染任务,系统自动分配时延小于5ms的GPU节点;针对Al训练任务,优先调度国产DCU-Z100加速卡集群,从而将算力资源利用率提升至90%。同时,平台引入负载均衡机制,通过动态调整任务分配策略,避免单一节点过载,确保资源能够均衡使用。

政策协同与生态构建

作为杭州市“算力券”政策的落地平台,杭州市算力资源调度服务平台提供从交易到补贴申领的一站式服务,充分放大了“政策红利”。同时,平台联合海光信息、华为等企业,推动国产DCU、AI芯片在训练和推理场景的应用,打通了“芯片一服务器一应用”全链条,促进了产业生态的构建和完善。

平台采用场景驱动的多量纲计费模型,包括资源型服务、任务型服务及跨境场景多币种结算。例如,企业使用智能算力时,按0.3元/卡时计费;调用自然语言处理服务时,按0.01元/次收费。此外,平台引入算力券与市场化定价相结合的机制,企业使用算力可同时抵扣算力券与现金支付。例如,某初创企业通过平台租赁100卡时算力,总费用3000元,使用30%算力券后实际支付2100元。

平台运行以来取得了显著成效:算力资源利用率提升30%以上,中小Al企业无需自建设施,按需租赁成本降低40%。此结果表明,“政府引导+市场运作+技术创新”的模式,能够有效破解算力资源碎片化问题,推动算力服务普惠化,这为其他地区算力中心互联互通建设提供了宝贵的借鉴经验。

算力中心互联互通的路径探索

技术标准统一:筑牢互联基础

建立一套覆盖通用计算、智能计算、超级计算的统一算力标识体系至关重要。通过新型算力标识网关,实现对异构资源的统一感知与调度。《行动计划》提出发布算力互联互通技术目录,联合“产学研用”多方力量推进技术标准协同创新。同时,推动算网云融合调度技术的突破,实现算力资源的集中管理与智能编排,预计可将配置效率提升30%以上。此外,根据《全国一体化算力网算力并网技术要求(征求意见稿)》,算力并网包含物理并网与逻辑并网双重架构。物理并网能够实现跨区域时延不超过50ms的网络连接,并且支持互联网与专用网络混合组网;逻辑并网将异构资源抽象为统一API,可有效解决传统超算CLI命令与现代云平台接口的兼容性问题

多级平台协同:优化资源配置

构建“国家一区域一行业”三级算力互联互通平台体系是优化资源配置的关键举措。在国家层面,建设算力互联网服务平台,开展算力标识“畅联”活动;在区域和行业层面,推进多个区域和行业平台试点建设,重点解决算力供需规模较大地区的资源匹配难题。

市场机制创新:激发产业活力

通过算力券补贴、算力交易市场等机制,有效降低企业用算成本。同时,引入市场化定价机制,推动多元异构算力业务互通,实现算力任务万卡调度和“算存网”多种业务协同。

安全与绿色协同:强化保障体系

构建完善的算力网络安全防护标准体系,覆盖基础设施、网络传输、数据流通等全链条。《行动计划》要求强化算力网络安全保障,增强数据安全保护能力,建立云平台全栈防护标准。在绿色发展方面,推动算力与绿色电力协同,通过液冷散热技术、分布式能源集成等降低数据中心能耗。

算力算效衡量与监测:量化评估体系

建立算力算效衡量指标体系,采用BOPS(Basic Operation PerSecond)作为统一度量单位,将FP32/INT8等异构运算折算为可比标准。例如,英伟达A100 GPU可换算为156PBOPS,为计费和调度提供统一基准,误差不超过0.5%。

算力运营服务与监测接口:标准化服务框架

构建覆盖运营门户、用户体系、产品服务管理的全流程运营服务体系,支持算力券申领、在线签约、按需计费等功能。杭州市算力资源调度服务平台通过算力超市提供标准化算力产品,支持企业“一键选购、一键训练、一键申补”,并集成Al训推一体化工具降低技术门槛。同时,平台遵循《全国一体化算力网算力监测接口要求》,通过标准化接口实现算力负载、电力消耗等数据的实时上报与查询,指标异常时触发多级预警机制。

算力中心能力评估:分级认证机制

制定科学合理的算力中心能力评估标准,从算力投入(如智算设备占比≥30%)、算电协同(如PUE≤1.25)、算网安全(如国产化率≥50%)等维度进行量化评估。杭州市算力资源调度服务平台接入的算力中心需通过能力评估认证,目前接入的算力中心国产Al芯片占比达40%,液冷技术使PUE降至1.20,满足国家级算力枢纽建设要求。

结论与展望

算力中心互联互通是构建全国一体化算力网络的核心环节。《行动计划》的出台为算力资源整合提供了顶层设计,而杭州市等地方的实践则验证了技术标准统一、多级平台协同、市场机制创新的可行性。未来,我国算力中心互联互通须进一步强化以下方面:一是推动算力标准国际化,积极参与全球算力标准制定,提升我国在全球算力治理中的话语权;二是深化算网融合,结合边缘计算、区块链等技术,进一步提升算力调度的智能化水平;三是优化跨区域利益分配机制,建立合理的利益共享模式,促进东西部算力协同发展。通过政策、技术、市场的多维协同,我国有望率先建成智能感知、实时发现、随需获取的算力互联网,为数字经济高质量发展提供坚实支撑。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容