信通院张蔚敏:大模型时代的具身智能:智机融合价值、现状与挑战

责任编辑:王鹤迦 2025.09.30 08:55 来源:中国信通院

通信世界网消息(CWW)随着“具身智能”“智能机器人”于2025年首次写入政府工作报告,具身智能、智能机器人、人形机器人等诸多新概念、新名词越来越多地出现在大众面前。这些看起来晦涩难懂的科技热词,或许很快就将走入商业场景,甚至我们的家庭。它们的定义是什么,相互之间有怎样的关联,未来发展前景如何?中国信息通信研究院(简称“中国信通院”)《专家谈》栏目开辟“机器人”系列专题,邀请多位业界资深专家多视角探讨我国人工智能+机器人的发展形势。本期邀请到中国信通院人工智能研究所安全与具身智能部副主任张蔚敏,围绕如何理解具身智能、具身智能赋能新型工业化的核心价值、具身智能的智能水平所处阶段以及在迈向大规模应用中的技术瓶颈和破解路径等展开深度解读。

一、如何理解具身智能?

具身智能是一种智能理论和范式,强调智能行为依赖于身体和环境的互动,具有鲜明的身体性和情境性。而机器人则是这一理论在工程实践中的载体和试验田。智能机器人和人形机器人都是具身智能的分支。

二、具身智能如何重塑制造业核心环节?

先前,机器人已经借助人工智能技术逐渐摆脱固定机械操作的束缚,提升了自动化作业能力。但主要适用于结构化、确定性的场景,在面对复杂、变化多的生产环境时,柔性不足、适应性差的问题依然突出。具身智能的发展,让机器人等物理实体能够自主感知、计划和执行任务,具备了多功能、多任务的灵活作业能力。可以说,具身智能为解决工业生产中“柔性不足、频繁换线”两大难题,提供了新的解决方案,也契合我国制造业小批量、多品种的新制造形态发展需求。

三、具身智能的智能水平处于什么阶段?

智能水平主要由模型能力决定。端到端视觉语言动作模型(VLA)是作为大家重点探索的方向,还处于“幼儿园”阶段。拆解来看VLA的三个重要能力,一是用视觉看世界的能力,仅能识别有什么物品,但无法理解何处施力,施多大的力。二是用语言和人类沟通的能力,更支持明确、具体、结构化的任务指令,例如能理解“拿起一个苹果”,但很难理解“给我一个水果”。三是用动作执行任务的能力,现在会做的是移动、抓取和放置等简单技能的组合,且操作对象以刚性物品为主。本体性能、网络通信等决定了智能在实际任务表现的上限。一方面,本体技术还需进一步收敛。以人形机器人为例,目前的技术成熟度还处于早期,完赛率30%的人形机器人马拉松暴露出了电机发热、关节可靠性、本体结构稳定性等硬件限制。另一方面,从执行固定程序到自适应场景执行任务,需要综合机器人的算力、网络、成本、能耗等各因素。构建分布式、可泛化具身智能,需要均衡硬件、网络、算力三要素供给代价,才能有望破茧工业线,进入百姓家。

四、具身智能机器人在迈向大规模应用时,面临的技术瓶颈是什么?

一是模型Scalability面临不确定性。目前还没有足够证据能证明,扩展数据对提升模型的泛化性绝对有用。而且,要让模型具备泛化性,又足够可靠,是系统性工程,涉及数据、训练方法、模型架构等。二是实际可用的动作数据还远远不够。现有具身智能数据集无论是开源的、合成的还是真机采集的,都很难规模化使用。数据和本体强绑定、和生产环境强相关,存在严重的数据孤岛现象。在一个数据集上训练好的模型部署到不同的本体型号时,性能表现会大打折扣,即使同一型号本体,在不同实验室或搭建环境下的性能表现也完全不同。三是要解决全身运动控制问题。全身关节的协同控制需要在几十毫秒内完成高维动作空间的复杂计算,对关节电机控制性能、运动控制模型的精度和实时性都有较高的要求。另外目前在处理需要精确力控、丰富接触的操作任务时,如整理线束、塑料袋打包等,仍有较大挑战。

五、如何破解具身智能产业化问题?

具身智能的发展特别是人形机器人更需要对其进行有耐心的长期投入和关键布局,建议:

一是注重多学科交叉研究,包括计算机科学、控制科学、认知科学、机器人学等。只有加强多学科之间的交流与合作、整合各学科的优势资源,才能共同攻克具身智能领域的关键科学问题和技术难题。中国人工智能产业发展联盟(AIIA)已成立具身智能工作组,以搭建各方合作交流平台为目标,围绕评估规范、产业生态建设、应用推广供需对接、以赛促用等工作任务,推动具身智能产业生态各方协作,加速我国具身智能产业化进程。

二是重视标准研制和评估反馈机制明确智能能力升级方向。通过科学、高效、准确的标准化研究,可以有效推动产业技术升级和规模应用。MIIT TC1(工业和信息化部全智能标准化技术委员会) WG6具身智能工作组,从系统研发支撑、系统智能技术、系统集成和系统应用四方面统筹推进国内具身智能产业标准体系建设工作,围绕具身智能智能化分级、数据集质量、接口、训练场、基准测试和重点产品如人形机器人等体系化推进标准化工作。

三是与产业链上下游协同。一是推动实现“数据—模型—本体”的闭环,通过本体沉淀数据,驱动模型迭代升级,进一步强化本体性能跃迁。二是形成“需求牵引—应用验证—反馈迭代”的闭环,面向制造、物流、医疗、家庭等重点行业半结构化场景,推动具身智能试点示范。三是加深生态协作机制,构建“基础设施—技术服务—产品服务—行业应用”闭环,通过行业联盟、标准化组织等,建立产业链协作机制,推动技术、标准、应用的同步演进。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容