中国信通院栗蔚等:Agentic Cloud引领云服务范式跃迁,全栈AI云能力重塑云计算价值路径

责任编辑:朱文凤 2026.06.04 17:36 来源:中国信通院

一、Agentic Cloud开启云计算新纪元

过去20年,云计算发展历经虚拟化、平台化、云原生和AI融合4个阶段,围绕“资源池化、按需供给”将计算、存储、网络等基础设施资源以服务化方式交付,降低企业IT门槛。2026年以来,大模型与智能体(Agent)技术从实验室走向规模化生产部署,云计算正经历从“AI融合”向“AI自治”的深刻变革。全球主流云厂商几乎在同一时间窗口做出了相似判断——云的主要消费者正在从人变为智能体。这一共识催生了Agentic Cloud这一全新技术范式,标志着云服务从提供“资源”迈向输出“能力”,从提供“算力”转向交付“智力”的价值跃迁。

2026年4至5月,谷歌在Next‘26大会上提出Agentic Cloud战略,发布Agent Engine与Agentic Data Cloud;同期,阿里云宣布完成全栈智能体化升级,打造Agentic Cloud;亚马逊推出AgentCore实现模型无关的智能体编排,微软的Foundry Agent Service正式商用。这种跨厂商、跨地域的高度同步,表明Agentic Cloud已从概念探讨进入产业实践阶段。在这一趋势下,是否具备覆盖芯片、云基础设施、大模型到应用的全栈AI云能力,正在成为定义未来云计算竞争力的核心标尺。中国信息通信研究院(简称“中国信通院”)持续跟踪Agentic Cloud发展趋势,深入剖析了其核心内涵、技术架构与价值主张,为我国把握发展机遇、加快形成新质生产力提供参考。

二、云服务范式跃迁:Agentic Cloud核心内涵与演进逻辑

Agentic Cloud是以云计算资源为基础底座,大模型能力为核心驱动,智能体服务为基本单元,具备理解用户意图并自主完成复杂任务能力的新一代云计算服务体系。它推动云服务产业在技术架构、交互模式和生态逻辑3个维度实现根本性跃迁,完成从“算力成本”导向到“智能价值”导向的转变,使云真正成为智能生产力引擎。

(一) 技术架构的重写:从“容器化”到AI云原生运行体系

传统云原生技术栈以Kubernetes和容器为核心,围绕微服务的编排、调度和治理构建服务能力,设计本质是面向无状态的短时任务,通过容器化实现资源的弹性伸缩与解耦。Agentic Cloud的工作负载与此存在根本性差异:一个典型的智能体任务是“感知-推理-行动-反馈”的多轮交互式闭环过程,涉及数十次链式模型推理调用、多轮外部工具执行、持续的跨系统数据检索与整合,并且需要长时间维持完整的会话上下文、记忆数据和执行链路状态,任务生命周期从毫秒级延长至分钟级、小时级甚至数天级。这种本质差异决定了Agentic Cloud需要进行从芯片到应用的全栈式技术架构重写。

一是芯片层针对智能体工作负载的推理密集型特征进行架构优化。谷歌的TPU v6e专为推理场景设计,亚马逊的Trainium2面向大规模推理集群优化能效比,国内厂商也在推进专用推理芯片的研发部署。专用推理加速单元在精度可控的前提下压缩首词元(Token)响应时间,使单位算力在真实智能体负载下产生更高的有效产出。二是云基础设施层从“无状态函数执行”转向“有状态智能体运行时”。谷歌、亚马逊等主流云厂商纷纷推出Agent Engine、AgentCore等托管式智能体执行环境,支持自动扩缩容、状态持久化与模型无关的编排运行,从底层执行环境上构建对智能体持久化运行的原生支撑。三是云平台层重构推理服务体系,提供高并发低延迟的云原生推理能力。云厂商将推理服务作为核心云服务品类进行全栈优化,通过量化压缩、投机解码、KV 缓存共享、推理流水线等技术,将单次推理延迟压缩至毫秒级,同时支撑大规模并发推理请求的实时调度与弹性伸缩,为智能体的实时决策提供可靠的云服务基座。

(二) 服务模式的革新:从API调用到智能体自主交互

传统云服务的交互模式以“人类操作”为中心——控制台面向人工可视化操作设计,应用程序编程接口(API)面向开发者编程调用设计,命令行界面(CLI)兼顾脚本自动化与人工操作需求,云服务的接口设计遵循“人类发出指令,云平台被动执行”的逻辑。Agentic Cloud的核心是推动云服务从“为人设计”向“为智能体设计”全面转型,用户只需表达目标意图,系统即能自动拆解为原子化操作序列并自主完成编排,实现了云服务交互模式的根本性革命。

一是交互逻辑从技术导向的API调用转向语义导向的能力封装。传统云服务API以资源操作为核心,要求调用者具备深厚的云技术背景。Agentic Cloud通过Skill封装、代码级编排、自主工具发现等技术让用户只需通过自然语言即可自动完成参数匹配、接口调用和流程编排,实现了从“告诉云怎么做”到“告诉云做什么”的跨越。二是协议体系从厂商私有API壁垒转向统一的标准互通。传统云计算生态存在严重的厂商锁定问题,跨云调用需要复杂的适配工作。当前,由Anthropic发起的MCP(Model Context Protocol)和由谷歌联合Linux Foundation推动的A2A(Agent-to-Agent Protocol)正在成为事实标准,使任何符合标准的智能体都能无缝调用任何符合标准的服务,大幅提升了智能体跨平台协同的可行性。三是角色从“为人设计的工具”转向“为智能体运行的环境”。云厂商正在构建完整的智能体云原生运行环境,微软和谷歌已支持智能体身份注册、发现、网关路由和智能体分配加密身份标识。人类角色从“指令发布者”转变为“目标制定者和结果监督者”,实现了“云服务-人-智能体”一体化协同。

(三) 生态逻辑的跃迁:从“规模经济”到“价值效应”

传统云计算产业20余年的发展始终遵循规模经济的底层逻辑,即越大的基础设施规模带来越低的单位成本,生态体系围绕“资源的高效聚合与分发”构建。Agentic Cloud正在改写这一逻辑,推动云计算生态从“资源驱动的规模扩张”向“智能驱动的价值创造”全面跃迁,其核心变革体现在3个维度。

一是云价值创造机制从线性资源价值传导转向指数级智能协同增值。传统云平台的价值增长与资源规模呈近似线性关系,新增价值主要来自新增资源的售卖。Agentic Cloud的价值增长遵循智能网络效应,平台汇聚的智能体数量越多、覆盖的业务场景越广,不同智能体之间产生的跨领域协同效应就越强。云服务价值衡量的标尺正从资源密度转变为价值密度。二是生态参与者关系从单向资源供需关系转向双向价值共创关系。传统云计算生态中,云平台是资源的供给者,开发者是资源的消费者,用户是服务的购买者,三者之间是单向的价值传递关系。Agentic Cloud生态中,开发者是智能体的创造者和价值贡献者,用户是智能体的训练者和价值反馈者,云平台转变为智能生态的运营者,三者协同实现智能体的孵化培育、协同调度和价值变现。三是产业竞争范式从成本驱动的规模比拼转向智能驱动的生态竞赛。传统云计算竞争的核心是 “谁能以更低的价格提供更多的算力”。Agentic Cloud时代,平台的核心竞争力不再是数据中心的物理规模,而是生态的繁荣程度和价值创造能力。智能体创造的业务价值分成将成为云服务收入的重要来源,产业竞争的终局将从“拥有更大的数据中心”转向“拥有更繁荣的智能体生态”。

三、云计算价值重塑:Agentic Cloud时代的全栈AI云能力

Agentic Cloud的快速发展,重塑了云服务的价值范式。传统云服务评价标准核心聚焦资源交付的规模、效率、成本,无法满足智能体7×24小时不间断运行、无规律弹性负载、短周期快速迭代的核心需求。在此背景下,覆盖底层算力、云平台、推理引擎、应用生态的全栈AI云能力,成为度量Agentic Cloud服务质量与核心价值的全新范式,核心是构建“智算筑基—模型驱动—推理优化—生态落地”的完整产业闭环。

(一) 智算筑基:从 “峰值算力供给” 到 “智能体负载系统适配能力”

传统智算云的评价体系以峰值算力规模、单位算力成本为核心指标,核心衡量平台“算力供给体量”。而在Agentic Cloud场景中,算力规模不再是唯一竞争优势,面向智能体专属负载的精细化适配能力成为核心评价标准。

底层智算云计算资源的核心评价维度包含三点:一是异构芯片矩阵的云化适配能力。当前全球主要云厂商加速自研推理芯片的迭代部署。依托多芯片异构融合架构,针对性优化推理密集型智能体负载的运行效率,是当下算力层的核心命题。二是算、存、网一体化协同能力与智算集群综合运行效率。复杂智能体任务往往涉及多轮推理、海量数据传输与状态同步,通过构建高速互联的计算集群与智能化的数据流转机制,提升集群的整体吞吐与资源利用率,是保障复杂智能体任务稳定流转的关键支撑。三是极致弹性的推理调度能力。智能体任务对响应时间高度敏感,毫秒级延迟直接影响用户体验与任务完成质量。通过并池调度提升智算集群资源利用率,上下文缓存消除重复计算,吞吐弹性调度机制应对智能体场景下的流量波峰波谷与负载波动,智能体高并发调用的稳定性。Agentic Cloud算力评价逻辑从传统的“量化规模”转向“质化效率”,核心衡量标准从“拥有多少算力”转变为“算力实际应用效果”。

(二) 平台承载:从“应用托管平台”到“智能体原生服务平台”

传统云平台的核心定位是应用托管平台,为开发者提供应用的开发、部署、运行和运维服务。Agentic Cloud 时代,云平台需要升级为智能体原生服务平台,为智能体提供全生命周期的管理与支撑服务。

一是智能体自主任务执行支撑能力。以Anthropic的Claude为例,Computer Use功能使模型能够直接操控软件界面完成复杂工作流;OpenAI的Codex智能体可脱离人类干预自主完成生产级编程任务。云平台需要提供托管式的智能体执行环境,原生支持智能体的状态管理、任务编排、工具调用和故障恢复,降低智能体开发与部署的门槛。二是云服务的智能体化程度。谷歌的Gemini模型原生支持视觉、音频、代码等多模态输入,并可据此规划和执行跨应用操作任务,实现从“感知世界”到“改变世界”的能力闭环,Agentic Cloud要求云平台需要将计算、存储、网络、数据库、安全等所有核心云服务进行智能体化改造,封装为标准化的智能体可调用能力,实现云服务与智能体的无缝集成。三是跨云跨平台原生记忆支撑能力。自主执行与多模态感知解决了“当下怎么做”的问题,但缺乏记忆的智能体无法从历史交互中学习,难以完成长周期任务。云平台需要支持主流的智能体开发框架和通信协议,实现智能体在不同云平台之间的无缝迁移与协同运行。谷歌的Memory Bank提供持久化记忆存储,支持多层次记忆管理,让智能体具备长期陪伴、持续进化的能力。

(三) 应用落地:从“模型调用”到“任务闭环”的全链路落地能力

推理与应用层是Agentic Cloud价值落地的最后一公里,直接决定智能体在真实业务场景中的规模化应用效果。成熟的Agentic Cloud需要为企业提供从智能体开发、部署到运维的全链路云服务能力。

一是企业级全域安全治理能力。主流云平台正从身份、数据、行为3个维度构建多层安全防线。例如,微软内建MCP鉴权全频谱(密钥/身份/托管身份/权限透传)并集成第三方安全方案,谷歌的模型防护功能则提供提示注入防御与威胁检测,确保自主运行的智能体始终不越界、满足企业级应用的合规要求。二是智能体运维与模型监控能力。云平台需要提供智能体运行状态监控、日志分析、性能调优、故障排查等运维服务,保障智能体的稳定运行。引入基于智能体执行反馈的强化学习机制,通过智能体的实际执行结果反向驱动模型优化,实现模型能力的持续迭代。三是开放生态适配能力。云平台需要构建智能体服务市场,为开发者提供智能体发布、交易、推广的平台,促进智能体服务的流通与复用,以亚马逊AgentCore为代表的主流平台率先实现智能体编排,通过标准化模型接入协议,支持不同能力象限的模型在同一智能体平台上协同工作,推动形成繁荣的智能体云服务生态。

四、标准引领与生态协同:Agentic Cloud规模化落地的关键基石

当前,Agentic Cloud仍处于发展初期。中国信通院自2019年起开展人工智能云技术研究,并于2020年在ITU SG16成功牵头立项人工智能云平台技术规范(Technical specification for artificial intelligence cloud platform,AICP)标准体系。聚焦全栈AI协同,已形成包含基础术语、参考架构、功能要求、性能评价等在内的多项行业标准及国际标准提案。截至目前,AICP系列已发布或推进中的标准超过7项,构建起“国内标准+国际标准”双轨并行的完整体系框架。在此基础上,中国信通院进一步拓展面向智能体时代的云服务能力研究,AICP所积累的全栈能力分层、接口规范、安全治理等成果,为Agentic Cloud的系统性研究奠定了坚实基础。同时,美国国家标准与技术研究院(NIST)成立人工智能智能体标准工作组(AI Agent Standards Initiative),国际标准化组织(ISO)以及国际电工委员会(IEC)等国际组织也在制定智能体服务相关测试标准,但产业共识尚在形成过程中,技术路线仍然多元。

从全球实践来看,各厂商的切入路径各有侧重:谷歌强调数据平台的智能体化,亚马逊聚焦模型无关的开放编排,微软在安全治理层建立了较完整的体系,国内厂商则在全栈垂直整合方面走在前列。这种多路径并行探索的格局,为我国实现云计算产业的弯道超车提供了历史机遇。未来,随着企业全栈AI云能力的持续成熟,Agentic Cloud将逐步规模化落地,深度渗透制造、金融、医疗、政务等各行各业,推动生产方式与生产力水平的质变。面向Agentic Cloud这一全新范式,中国信通院持续深耕全栈AI云能力研究,围绕“芯、云、模、用”四位一体协同机制,构建覆盖全栈的标准化度量体系与评估框架,打造企业全栈AI云竞争力象限。推动云计算从算力赋能到智力赋能,从资源交付到能力交付,让人工智能成为普惠化、常态化的核心生产力,为全球数字经济高质量发展持续注入新动能。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容