通信世界网消息(CWW)从OpenClaw“龙虾热”席卷全国到“利爪浩劫”敲响安全警钟,2026年上半年的智能体产业图景浓缩了机遇与挑战的双重面貌。
什么是智能体,为什么是现在?
智能体的产品形态:不只是聊天,还能自主执行
智能体是当前AI技术演进的核心形态,其本质在于:以大语言模型(LLM)为推理核心,通过“感知—规划—行动”(Perception-Planning-Action)闭环实现目标驱动的自主执行,而非被动响应单次输入。智能体应用与传统LLM聊天的根本区别体现在以下三个维度:其一,行动维度——智能体具备调用外部工具、操控系统环境的执行能力,能够将自然语言意图转化为可验证的现实结果;其二,持续性维度——智能体在多轮交互中维护工作状态,跨任务积累记忆,而非每次对话后重新归零;其三,自主性维度——智能体能够自主分解复杂目标为子任务序列,在执行过程中根据环境反馈动态调整策略,体现出一定程度的目标导向自主决策能力。
以2026年初在全球快速普及的开源智能体平台OpenClaw为例,该系统并非问答界面,而是常驻运行的自主执行程序:连接微信、飞书、WhatsApp等即时通信平台,将其作为交互入口,经自然语言理解模块解析用户意图后,驱动任务分解引擎将高层目标拆解为可执行子任务序列;继而通过MCP协议调用浏览器控制、文件系统操作、代码执行等工具完成任务,并基于执行结果持续进行反思与策略优化。典型场景如接受“预订明日上海高铁靠窗席位”任务后,系统可自主完成“信息查询—座位筛选—支付确认”的完整流程,全程无需人工介入。这一特征标志着AI应用范式实现从“信息生成”向“任务执行”的根本性跃迁。
OpenClaw的市场扩散轨迹为智能体的产品化进程提供了重要参照。该平台由奥地利开发者Peter Steinberger独立开发,2026年2月上线后一周内即积累GitHub星标超10万个、网站访客逾200万人,随后被百度、腾讯、阿里巴巴、字节跳动等主要互联网厂商在数周内全面接入。深圳龙岗区设立最高1000万元专项补贴用以支持本地OpenClaw生态开发,民间自发形成的低成本装机服务市场进一步推动了终端侧渗透,其间一度引发Apple Mac Mini等适配硬件的区域性供货紧张。这一扩散路径揭示了当前智能体产品化的两大关键特征:一是开源生态的爆发式溢出效应——单一开源项目可在极短周期内形成完整产业链条;二是智能体的用户群体已从技术开发者向普通消费者快速下沉,产品形态的普惠化趋势明显。中国信通院《AI Agent智能体产业图谱1.0》所梳理的约200家代表性企业,正是这一产业化进程的系统性体现。智能体的普及窗口已经开启,其产业渗透的速度与广度将在相当程度上取决于生态基础设施的成熟程度。
技术架构:四层基座如何支撑自主执行
智能体的技术实现涉及多个相互耦合的子系统,当前学术界与产业界已就其核心架构达成相对共识,这可以从以下四个维度加以解析。
第一,推理引擎层。大语言模型作为智能体的认知核心,承担意图理解、推理规划与响应生成等功能。2025年以来,专用推理模型(如DeepSeek-R1、OpenAI o3/o4系列)通过基于过程奖励的强化学习训练范式,在多步推理与长链任务规划能力上实现了显著跃升,为智能体处理复杂、动态任务提供了更可靠的认知基础。
第二,工具调用层。智能体需要借助标准化接口与外部工具、数据源及服务进行交互。Anthropic于2024年发布的模型上下文协议(MCP)以JSON-RPC为传输层,定义了智能体与工具服务之间的统一通信规范,其月SDK下载量已超9700万次,正在成为业界事实标准;谷歌提出的A2A(Agent-to-Agent)协议则进一步定义了智能体间横向协作的通信模式。
第三,记忆系统层。有效的记忆机制是智能体实现跨任务连续性的关键。主流实现通常采用三级记忆架构:基于上下文窗口的工作记忆(短期)、基于向量数据库的语义检索记忆(中期),以及基于结构化存储的情景记忆(长期)。OpenClaw采用本地Markdown与JSONL文件作为持久化记忆存储,支持通过Git进行版本管理,其设计哲学是记忆的透明性和可控性优先于检索效率。
第四,规划推理层。ReAct(Reasoning+Acting)框架交替推理与执行的迭代机制仍是主流规划范式,辅以思维链(CoT)和思维树(ToT)策略处理分支决策场景。
上述四层架构的系统化集成,使智能体从单点语言能力进化为具备持续自主行动能力的系统级实体。以OpenClaw的消息处理管线为例,可以清晰观察上述架构在工程层面的具体实现:用户消息依次经由平台适配层(统一多平台输入格式)、通道适配层(处理协议差异)、网关路由层(鉴权与流量分发)、运行器上下文组装层(构建包含记忆、工具列表和系统提示在内的完整推理上下文)、智能体推理循环层(执行ReAct迭代直至任务完成或达到停止条件),最终经响应交付层返回结果。此六阶段消息处理管线清晰体现了智能体系统设计的核心工程挑战:每一层次的延迟积累、错误传播与状态一致性维护,都直接影响端到端的任务可靠性。值得关注的是,智能体架构的复杂性不仅体现在单智能体内部的子系统耦合,更体现在多智能体协作场景下的编排复杂度——协调失败与推理幻觉的级联放大,是制约当前智能体规模化落地的主要技术瓶颈之一。
市场规模与资本动向
从市场规模看,目前全球智能体市场正处于高速扩张阶段。2025年市场规模约为76亿美元,主流机构预测,2026年将突破100亿美元,年复合增长率维持在44%~50%,21世纪30年代初有望达到500亿至1800亿美元。资本市场对这一赛道的看好体现在持续攀升的估值水平:2025年智能体赛道融资总额约60亿美元,同比增长近60%,Sierra(估值100亿美元)、Cognition/Devin(估值102亿美元)等头部企业已具备“独角兽”乃至“十角兽”量级。企业侧应用进程同样显著提速,Gartner预测2026年底集成任务型智能体的企业应用比例将从2025年的不足5%跃升至40%,这一预测若实现,意味着智能体将在约两年内完成从边缘试验到主流应用的跨越。然而需要指出的是,市场规模的快速增长掩盖了投资回报验证层面的结构性分化——当前产业进入以实际价值交付为核心评判标准的关键阶段,能否在具体业务场景中实现可量化的效率提升或成本节约,将决定智能体厂商的最终分化格局。
全球竞争格局:巨头布局与平台之争
智能体竞争的本质是AI时代的入口之争
智能体并非单一功能模块,而是继浏览器、应用商店之后,新一代计算入口的核心载体。OpenAI在GPTs商店的基础上,进一步推出Operator浏览器智能体、Agents SDK和Codex编码智能体,年化收入突破250亿美元;其创始人在邀请OpenClaw创始人Steinberger加入公司时,称他为“在智能体协作方面拥有惊人想法的天才”。Anthropic凭借MCP协议确立智能体与工具连接的事实标准,Claude Code六个月年化收入即达10亿美元。谷歌推出的A2A协议获150余家机构支持。
OpenAI应用CEO Fidji Simo预判:“一年后,回答问题将是AI最不重要的能力。我们将拥有主动运行的AI助手,预判需求并代我们采取行动。”微软CEO Nadella宣称“SaaS将瓦解为基于CRUD数据库的智能体”,并在2026年3月完成组织架构重组,将Copilot统一到“智能体革命”战略下,微软365 Copilot已有1500万个付费席位,“世界500强”中超80%的企业通过Copilot Studio构建智能体。
中国“龙虾热”引爆全民智能体时代
2026年初的OpenClaw“龙虾热”是中国智能体产业最具标志性的事件。主要科技公司均在数周内作出回应:腾讯推出Workbuddy并整合微信14亿用户生态,在深圳总部线下设置安装服务点,现场排队人数超800人;阿里推出“悟空”企业AI平台,阿里云提供一键部署;百度推出DuMate(桌面)、RedClaw(移动)、DuClaw(云端)系列产品;字节跳动旗下产品依托火山引擎云服务支撑;MiniMax推出MaxClaw后股价从IPO算起飙升约640%,市值高达490亿美元,一度超越百度。
与海外市场不同,中国大厂围绕“超级应用入口”展开差异化角逐:字节Coze平台超100万活跃开发者深度绑定抖音/飞书生态,阿里通义App发布两个月后MAU(月活跃用户数量)破亿,百度以“芯、云、模、智能体应用协同发展”重构全栈AI战略,腾讯以微信智能体打通小程序与支付环节。OpenClaw的爆发进一步加速了这一进程——它证明了智能体不仅是开发者的工具,更是一个“从修车师傅到退休老人”都能使用的通用产品形态。
开源力量重塑全球AI产业的价值分配
中国开源大模型在2025年实现历史性突破。斯坦福分析显示,中国在开放权重AI开发领域取得全球领先地位,Qwen衍生模型占Hugging Face新增微调模型40%以上,DeepSeek以传统方案约1%的成本实现同级性能。在智能体平台层,Dify(GitHub 11.1万个星)、Coze(已开源)、OpenClaw(24.7万个星,成为GitHub历史上增长最快的开源项目之一)形成中国主导的全球开源智能体生态。OpenClaw上中国模型消耗量占OpenRouter前十模型的61%(5.3万亿token),表明中国开源模型与开源智能体平台正在形成“协同飞轮”。
垂直行业智能体已越过“概念验证”,进入规模化落地阶段
编码智能体是最先爆发的品类,预计2026年Vibe Coding将贡献约40%企业软件产出,Cursor估值293亿美元,GitHub Copilot拥有470万付费用户。客服智能体紧随其后:Salesforce Agentforce以每次对话2美元的价格服务1.2万家客户,实现46%案例偏转率。金融智能体占全球AI支出增量的20%,医疗AI辅助记录2025年收入达6亿美元,同比增长2.4倍。百度发布的“伐谋”超级智能体在产业端验证了降低物流成本18%、提升药物研发效率300%的实效。
2026年是“亮出真金白银”的价值检验年
EY全球技术负责人James Brundage直言:“2026年董事会将不再数token和试点数量,而是数美元。”然而McKinsey发现仅6%的组织是AI“高绩效者”,关键差距在于是否进行了根本性的工作流重塑。Gartner同时警告超40%的智能体项目将在2027年前被取消,数千家厂商中仅约130家是“真正的”智能体公司。Box CEO Aaron Levie的判断或许最为中肯:“我们将一直处于这场持续不断的竞赛中。”
技术架构与演进方向
通信协议融合正在催生智能体的“TCP/IP时刻”
智能体互操作已形成三层协议体系,即MCP(纵向:智能体到工具)、A2A(横向:智能体到智能体,遵循“不透明执行”原则)、OASF(智能体能力描述与发现)。三者已陆续捐赠至Linux基金会旗下的AAIF(Agentic AI Foundation),OpenAI、Anthropic、谷歌联合参与治理。OpenClaw是目前最大的MCP兼容平台之一,其技能市场ClawHub承载3200余个MCP技能,接入1.3万余个MCP服务器。ITU-T SG17主席Arnaud Taddei称此项工作“堪比四十年前OSI模型的规模”。谁主导协议,谁就定义生态。
开发框架生态呈现“平台化+低代码化”双轨演进
专业开发者一侧,LangChain/LangGraph、CrewAI、OpenAI Agents SDK、谷歌ADK、亚马逊Bedrock AgentCore构成主流生态;低代码一侧,Dify、Coze、百度千帆等平台以可视化开发大幅降低创建门槛。微软副总裁Jared Spataro直言“智能体就是AI时代的App”,Nadella进一步类比“构建智能体应该像做Excel表格一样简单”。OpenClaw的爆发印证了这一判断——用户无需任何编程知识,通过消息对话即可配置和训练自己的智能体。框架竞争的终局不是技术深度,而是开发者覆盖广度。
多智能体编排是下一个技术制高点,但规模化仍是难题
多智能体系统咨询量从2024年第一季度到2025年第二季度激增1445%(Gartner数据),可实现3倍任务加速和60%精度提升,但真正实现规模化编排的企业不足10%。李彦宏形象地类比:“复杂任务可以通过多个智能体协作完成,就像公司里有CEO、财务、技术、销售主管协作一样。”Salesforce Agentforce(1.2万家客户,70%自主解决率)是当前最成功的商业验证。多智能体协作的核心瓶颈在于协调失败和“通信幻觉”的级联放大。OpenClaw采用父子通信的多智能体路由架构,但有意限制了子智能体的递归生成,这一设计选择反映了业界对多智能体系统复杂性风险的审慎态度。
自进化能力逐渐成为智能体的核心竞争力
2025年以来,“自进化”(Self-Evolution)逐渐成为智能体技术演进的重要方向,训练智能体或将成为训练模型的下一个阶段。与传统软件不同,新一代智能体具备通过与环境交互持续学习和优化自身行为的能力。自进化能力的技术基础包括三个层面:一是基于情景记忆的经验积累——智能体从过往交互中提取模式,并用于优化后续决策;二是基于强化学习的策略进化——推理模型(如DeepSeek-R1、OpenAI o3)通过试错和奖励信号持续改进多步规划能力;三是基于工具生态的能力扩展——智能体通过发现和学习使用新的MCP工具不断拓展行动边界。OpenClaw的SOUL.md(个性定义文件)和本地记忆系统使每个智能体实例都能基于用户交互独立进化,形成高度个性化的行为模式。这一趋势意味着,未来智能体的核心竞争力将不仅取决于底层模型能力,更取决于其在特定场景中持续自我优化的速度和质量。
软件智能体正向物理世界延伸
计算机操控智能体性能飞速提升——Claude Computer Use在OSWorld基准测试中的表现从2024年的22%跃升至2026年2月的72.5%。“视觉—语言—动作”模型(VLAM)正统一感知、推理和物理控制,代表性成果包括Physical Intelligence的π₀.₅、NVIDIA GR00T N1和谷歌Gemini Robotics。Gartner预测,2029年智能体从物理环境生成的数据量将达数字AI应用的10倍。谷歌CEO Sundar Pichai坦言“未来AI可能取代我自己”,Meta CEO Zuckerberg正在打造AI“CEO助手”和“第二大脑”系统。工业和信息化部人工智能标准化技术委员会已发布具身智能基准测试方法,ITU-T SG21设立了具身智能未来方向特设组(AHG-EAI),以推动国际标准化进程。
标准化与治理进展
国际标准化多线并进
ITU-T于2025年3月通过F.748.46建议书《人工智能智能体的要求和评估方法》,由中国信通院牵头推动;SG21提出智能体互操作技术要求新工作项,SG17推进智能体信任治理与数字身份标准。美国NIST于2026年2月发起“AI智能体标准化倡议”,聚焦互操作、安全和身份认证。当前五大关键标准化缺口为互操作性、安全框架、身份认证、工具调用接口规范和能力描述发现机制,这些缺口既是标准化机构的紧迫议题,也是我国参与全球标准制定的战略窗口。
中国标准化体系加速构建
工业和信息化部于2024年12月设立首个AI标准化技术委员会(TC1),中国信通院承担秘书处工作。2025年4月,中国信通院联合约60家单位发布国内首个智能体标准《智能体技术要求与评估方法》。2026年3月,OpenClaw安全危机爆发后,中国信通院拟启动面向OpenClaw的AI智能体可信标准试评测。国家互联网应急中心(CNCERT)和中国网络空间安全协会先后发布OpenClaw安全风险预警和安全使用实践指南。这一系列快速响应表明,我国标准化体系具备对新兴技术风险的敏捷治理能力。国务院发布实施的“人工智能+”行动设定了2027年70%、2030年90%的智能体渗透率目标,是全球最明确的量化部署指引。
面临的关键挑战
可靠性:幻觉在多步骤执行中的误差累积
可靠性是智能体规模化落地的首要障碍。单一大模型平均幻觉率约9.2%,在多智能体协作中通过“通信幻觉”级联放大。代码领域SWE-bench Pro最优模型得分仅约23%(策展集70%以上),凸显开放环境可靠性差距。2024年47%的企业用户承认基于幻觉内容作出过重大商业决策。McKinsey发现仅6%的组织是AI“高绩效者”——真正的价值创造需要根本性的工作流重塑,而非简单叠加智能体。
安全:OpenClaw“利爪浩劫”敲响供应链安全警钟
2026年1月底爆发的OpenClaw“利爪浩劫”(ClawHavoc)事件,是迄今已知最大规模的AI智能体供应链攻击,深刻暴露了智能体生态安全的脆弱性。攻击者利用ClawHub技能市场近乎“零门槛”的发布机制(仅需注册一周以上的GitHub账号),在一周内通过12个账号上传了1184个恶意技能包。安天CERT确认约20%的技能包为恶意,国家网络安全通报中心在3016个技能中发现336个恶意技能。攻击手法包括利用AI生成的500至700行专业文档诱导用户下载恶意软件(macOS信息窃取器AMOS)、反向shell远程控制以及窃取.env配置文件中的付费API密钥。SecurityScorecard统计,截至2026年3月,全球已有超27万个OpenClaw实例暴露在互联网上,其中中国约有2.3万个,其中85%使用默认配置。
提示注入位居OWASP 2025年LLM十大风险之首。安全专家Simon Willison提出“致命三角”概念:当智能体同时具备私有数据访问、不可信内容处理和外部通信能力时,它在设计上就是可以被利用的,而大多数已部署的MCP智能体恰好满足这三个条件。安天CERT在分析报告中一针见血地指出:“AI安全不应狭隘定义为算法风险和数据投毒,AI应用带来的扩展攻击面才是最紧迫的现实威胁。”仅14.4%的智能体经过完整安全审批后上线,86%的组织对AI数据流向缺乏预见性。
治理:自主性分级与责任归属的深层矛盾
智能体的自主行动引发前所未有的治理难题。学术界提出L1(操作者)到L5(观察者)五级自主性框架,但责任归属尚无共识方案。加州AB 316法案(2026年1月生效)开创性地规定不得以AI自主运行为由免责,Gartner预测相关法律索赔到2026年底将超过2000起。MIT AI Agent Index发现中国智能体在安全框架文档化方面得分偏低(1/5),这值得国内产业界高度重视。Dario Amodei在其长文中发出更深层的警告:“AI的回报如此巨大——每年数万亿美元,以至于人类文明很难对其施加任何约束,这就是陷阱。”
未来趋势:智能体经济与新计算范式
从“智能体试点”到“智能体优先”的组织转型
Gartner预测,到2028年33%的企业软件将嵌入智能体AI,15%的日常工作决策将由智能体自主完成;到2035年智能体AI可能占企业应用收入的30%以上(超4500亿美元)。此外,IDC预计到2026年全球2000强企业中40%的岗位将涉及与智能体协作,微软预测2028年AI智能体数量将达13亿个。OpenClaw“龙虾热”的意义在于,它将智能体从开发者圈层推向了全民使用——这一产品形态的普惠化,是智能体从“技术探索”走向“产业基础设施”的关键拐点。
商业模式颠覆:从按席位到按结果收费
传统SaaS按席位订阅模式正被按用量(token/计算量)、按结果(如Salesforce Agentforce每次对话2美元)、按角色(“数字员工”月薪制)的混合定价模式所颠覆。谷歌通用商务协议(UCP)联合Shopify建立开放交易框架,预计2030年智能体将为总金额高达5万亿美元的全球商务活动提供中介服务。AWS、Oracle、Salesforce等平台已上架900余款智能体产品,智能体市场正成为新的分发渠道。2026年百度将智能体应用与芯片、云、模型并列为商业化核心支柱,明确进入价值兑现期。
自进化智能体与标准化路线图
自进化智能体的兴起使得标准化工作更加紧迫。当智能体能够通过交互持续改变自身行为模式时,传统的静态合规审查机制将面临根本性挑战——“通过认证时”的智能体与“运行三个月后”的智能体已是截然不同的系统。这一特性要求标准化框架从“上市前评估”转向“全生命周期动态监测”。中国信通院牵头的ITU-T F.748.46建议书和国内首个智能体标准,为这一方向提供了重要基础。标准化路线图正在遵循清晰的路径进行演进:从厂商主导协议(MCP 2024、A2A 2025),到中立治理(Linux基金会/AAIF 2025),再到正式国际标准出台(ITU-T/ISO/IEC,预计2026至2028年)。未来12至24个月,将决定当前协议融合能否转化为全球互操作标准,抑或走向区域化标准分裂。
结语
目前,智能体正从技术概念加速走向产业实践,成为AI赋能千行百业的关键载体。自进化能力的涌现使智能体不再是静态的工具,而是能够持续学习和成长的“数字员工”。这既放大了其创造价值的潜力,也对安全治理和标准化提出了更高要求。面对可靠性、安全性与治理等系统性挑战,标准化既是建立产业信任的基石,也是构建国际话语权的战略支撑。中国信通院将持续发挥技术研究和标准引领作用,推动构建开放、安全、可信的智能体产业生态,为全球AI治理贡献“中国方案”与“中国智慧”。


