从“龙虾”热潮到监管红线：智能体的安全风险与治理之策

责任编辑：朱文凤 2026.05.28 09:20 来源：天翼智库

通信世界网消息（CWW）当前，智能体产品加速涌现，呈现规模化应用态势。2026年初，开源智能体OpenClaw（俗称“龙虾）凭借其“一键部署、全栈自主、工具互联”的能力引爆全球。伴随着“养龙虾”热潮的兴起，其背后的安全风险不断显现，集中表现为权限失控、提示词注入被劫持、无视指令自主操作、隐私泄露等风险。据国家互联网应急中心监测，截至3月10日，已发现超过1.2万起针对“龙虾”的“提示词注入”攻击，出现“龙虾”风险集中爆发现象。5月8日，国家网信办、发改委、工信部三部门联合印发《智能体规范应用与创新发展实施意见》，为智能体划下“安全红线”并提出安全治理的指导原则。从“龙虾”热潮到监管红线，智能体产业参与者包括电信运营商需要高度重视智能体安全风险与治理并提出应对策略。

从“龙虾”热潮看智能体的安全风险

一是权限失控与越权操作，是智能体最致命的普遍性风险。智能体为完成复杂任务，初始即被授予高权限，而其“长期运行、自主迭代”的特性，导致权限“只增不减、持续扩散”，从文件读取逐步升级为系统命令执行、数据库访问、硬件操控，最终形成 “权限失控”。例如“龙虾”具备过多权限，给黑客更多破坏机会。为了让“龙虾”更好干活，它可能会获得查看所有文件、打开任何软件、自由连接网络等“超级权限”，相当于用户把自己电脑的“万能钥匙”交给了“龙虾”。目前全球已有超过3.7万用户，因“龙虾”权限被滥用，导致自己的设备被黑客远程控制，其中20%用户遇到了文件被篡改、电脑被锁，甚至被黑客索要赎金的情况。

二是目标被篡改与自主决策偏移，让智能体执行恶意指令。攻击者通过提示词注入、上下文篡改、任务误导等手段，可彻底篡改智能体任务目标，使其从“服务用户”变为“执行恶意指令”。例如“龙虾”存在被恶意操纵风险，容易泄露敏感信息。黑客可以在文档里夹杂推送欺骗性的错误提示指令，诱导智能体忽略安全规则。如果智能体鉴别能力不足，就有可能泄露用户信息。黑客也可以在网页、邮件里隐藏植入向外发送文件等指令，当AI智能体去处理这些内容时，就会被“骗”着泄露信息但用户可能毫无察觉。

三是多智能体级联失控，风险从单点扩散变为系统性蔓延。随着多智能体协作成为主流，智能体间通过协议互联互通，单一节点的漏洞会通过信任网络快速传导，形成连锁效应。一个被劫持的智能体，可利用默认信任关系入侵整个集群；一个存在漏洞的智能体，可成为攻破系统的突破口。随着多智能体交互复杂度快速增加，传统监控无法追踪、审计、管控其复杂行为，导致风险发生后无法定位根源、阻断传播、评估损失。OpenClaw事件中，由于缺乏安全的通信与权限隔离，多智能体协同未构建严格的通信鉴权机制，部分企业多智能体集群因一个节点沦陷，导致智能体全集群被接管，正是级联风险的体现。

从监管红线看智能体的安全治理之策

面对智能体安全的系统性风险，中国率先构建“发展与安全并重” 的治理框架。2026年5月8日，国家网信办、发改委、工信部联合印发《智能体规范应用与创新发展实施意见》，首次从国家层面为智能体划定“监管红线”，提出安全治理的指导原则：坚持安全可控，将智能体安全、可靠、可信作为发展的底线要求，贯穿智能体技术研发、应用部署与推广的全过程，切实防范系统性风险。坚持规范有序，适应智能体技术演进规律，构建与现有政策法规衔接顺畅、行业自律自治、底线红线清晰的治理体系，有序推进智能体落地应用。

根据国家为智能体发展划定的监管红线和原则要求，智能体产业界需要提出并落实智能体安全治理之策。智能体的安全治理，需要构建内生安全设计、外部强制管控、全生命周期治理三位一体的系统性防护体系，实施从“被动补救”到“主动防御”、从“单点防护”到“体系化治理”的安全治理之策。

一是坚持安全内生设计，从底层架构筑牢安全根基。智能体内生安全设计的关键是把可信执行环境、加密算力、安全协议内嵌智能体底层架构，不再依赖外挂防护，从硬件与框架层面筑牢安全基座。内生安全以源头设防、全程赋能、自主免疫为核心逻辑，从智能体架构设计、模型训练、指令交互、决策执行到迭代演化各环节，植入安全基因。在底层架构上融入可信算力、安全算法与隐私保护模块；从底层架构进行风险隔离，通过引入智能沙箱、硬件隔离及命名空间隔离等技术，从源头封装风险，确保智能体在调用插件、跨域操作或处理敏感业务时，始终处于可控的隔离环境中，防止底层架构被恶意篡改。

二是建立风险外部管控体系，构建难以突破的安全屏障。针对智能体可能突破内部约束的风险，建立独立于智能体的外部管控体系。一方面实施监控审计，绕过应用层，实现全流程、无死角、不可篡改的行为记录与风险检测；另一方面实时拦截与应急终止，对越权、异常、恶意行为秒级阻断，所有智能体必须配备“一键终止” 开关。采用零信任机制，默认不信任任何智能体，每次工具调用、数据访问、跨智能体协作都需重新认证、授权、审计，打破默认信任，阻断级联风险；设置人工审查阈值，高风险操作、多步骤长流程强制触发人工审核，防止自主决策失控。

三是实施全生命周期安全治理，实现全程闭环管理。智能体的全生命周期安全治理需覆盖设计、部署、运行、退出阶段，形成闭环管理体系。设计阶段实施安全需求前置分析，将内生安全要求纳入架构设计，确保核心模块的安全性；同步建立训练数据溯源机制，标注数据来源、质量等级与授权边界，防范数据投毒与偏见植入。部署阶段执行分级准入评估，依据智能体自主等级与应用场景敏感度实施差异化安全测试，达标后方可接入生产环境。运行阶段构建动态监控体系，实时追踪智能体决策链路、工具调用与行为偏差，设置异常阈值自动触发熔断隔离；退出阶段制定数据资产处置规范，对智能体存储的敏感信息、学习记忆实施安全擦除或脱敏归档，保留审计日志满足追溯问责需求。全周期贯穿版本管理与变更控制，确保智能体迭代演进的安全连续性。

从电信运营商看智能体安全治理

一是建立面向智能体的“云、网、边、端”的主动防御体系。运营商能够利用自身的云网资源，为企业和个人提供从终端到云端的全方位智能体安全产品，构建“云、网、边、端”的主动防御体系。通过“本地安全网关+云端安全运营”的架构，帮助企业实现全网一键盘点、收敛互联网暴露面，并实时拦截漏洞导致的攻击行为。运营商可以利用独特的网络与数据优势，利用自身掌控的全流量和信令数据捕捉智能体异常交互情况，为投入生产的智能体定义其正常的操作轨迹，一旦检测到偏离，网络内置的安全探针立即阻断其指令执行，并触发冗余备份智能体接管，避免单点失控引发大面积故障。

二是构建智能体安全底层能力，打造智能体内生安全底座。首先，筑牢物理基础设施防线，为智能体提供安全的物理运行环境，引入量子安全技术保障底层传输与身份认证的绝对安全。其次，夯实数据与模型根基，通过建设高质量的安全垂类语料库和研发大模型基础护栏、自动化安全扫描器，从源头提升对提示词注入、敏感信息泄露等原生风险的识别与防御能力，构建智能体安全底层能力，打造智能体内生安全底座。此外，运营商需积极联合政府、高校及头部科技企业，推动智能体安全治理的标准化和规范化发展。具体来说，积极主导IEEE等国际标准制定，积极参与国家及国际的智能体安全治理框架与规则制定，推动统一的数据输入与指令输出标准，打破跨系统的安全壁垒，消除智能体安全落地的障碍，促进行业健康有序发展。

三是牵头构建跨域多智能体安全治理与应急协同体系。不同区域的单个智能体的弱点可能被用来攻击整个网络设备，而不同厂商、不同区域的智能体缺乏统一安全语言。电信运营商可以利用自身作为通信中枢的地位，实现安全风险特征的快速共享与联动封堵漏洞。运营商可以建立行业级的智能体安全态势平台，实时收集来自各省公司或合作伙伴的智能体异常行为轨迹，并下发至所有边缘智能体作为前置规则，推动形成通信行业统一的智能体安全认证标准，防范多智能体的级联失控风险。同时，多智能体协同生成的安全防御策略会通过运营商覆盖全国的安全能力池，实现快速的跨区域、跨系统自动下发。无论是阻断异常API接口、隔离受感染的边缘节点，还是对特定智能体进行临时权限降级调整，都能实现多智能体应急协同自动化执行。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动