通信世界网消息(CWW)工业和信息化部近日批准发布《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》,为具身智能领域首份行业标准,将于6月1日正式实施,标志着具身智能评测迈入“有标可依”的新阶段。
该标准为具身智能领域构建了统一基准测试框架,规范了在仿真环境和真实环境下,开展具身智能基准测试的环境设置、任务库构建、测试过程和指标计算方法。目前该标准已同步推进国际标准立项。
中国信通院有关专家表示,可信的评测体系是连接技术研究与大规模产业应用的桥梁和标尺,该标准将为行业提供统一的技术规范框架、建立互信基础。在技术研发层面,为具身智能的能力评估提供统一的度量依据,指引技术迭代方向,帮助行业及早识别并收敛于高价值技术路线,减少研发资源的无效投入;在应用落地层面,为行业用户开展产品选型与应用验证提供标准规范支撑,避免市场出现“劣币驱逐良币”现象;在产业发展层面,将加速具身智能从实验室走向真实场景,促进具身智能技术成果的工程化落地和产业化应用。

图1 《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》
《YD/T 6770-2026 人工智能 关键基础技术 具身智能基准测试方法》概述如图1,描述了在仿真环境和真实环境下面向具身智能系统的基准测试框架、指标和方法,包括基准测试的环境设置、任务库构建、测试过程和指标计算方法,适用于单个具身智能系统“感知-决策-执行”全链路能力的基准测试。
该标准构建了统一的具身智能基准测试框架(如图2所示),包括环境设置、测试任务库、测试过程和指标计算四部分。测试环境方面,规定了仿真测试环境和真实测试环境的构建要求,确保环境设置能反映现实环境的复杂性。测试任务方面,提出了测试任务库构建方法和泛化评估基准,支撑评估被测对象在不同任务复杂性、不同能力维度上的性能表现和泛化性。测试过程方面,主要面向模型和部署模型的整机系统两类测试对象开展测试,测试方法包括静态仿真测试、动态仿真测试、真实环境测试和组合式测试等。测试指标方面,主要包括任务执行效率、任务成功率、人工干预率、场景扰动衰减率和平均任务能耗等五个指标。

图 2 具身智能基准测试框架图
该份行业标准的制定,对具身智能产业各方推动技术进步、产业应用和标准化建设具有重要意义。对研发侧,为具身智能的能力评估提供了统一的度量依据,指引技术迭代方向,帮助行业及早识别并收敛于高价值技术路线,减少研发资源的无效投入。对应用侧,为行业用户开展产品选型与应用验证提供标准规范支撑,避免市场出现“劣币驱逐良币”的现象。对产业侧,加速具身智能从实验室走向真实场景,促进具身智能技术成果的工程化落地和产业化应用。


