通信世界网消息(CWW)人形机器人产业正由从通过自然语言口令被动执行任务向主动学习和寻找任务过渡,工业制造领域有望成为人形机器人最先实现商业化落地的领域。
人形机器人工业制造场景应用现状和趋势
工业人形机器人产品行业已探索部分标准。行业已初步探索了适用于工业制造场景的人形机器人的性能要求,重点在机器人视觉感知、负载能力、本体结构和故障率上强化了相关标准。如在视觉方面,机器人的工作距离要介于300~1,200mm,全视野帧率≥20帧/s,定位精度<0.5mm,支持RGBD深度相机技术,需抗强光与抗反光,可支持室内外场景≥50万流明下实现精准识别。在灵巧手方面,机器人每个手指承载能力>1.5KG,上肢连手承载能力>8KG。在本体结构方面,可自动升降身体高度,手臂可延展的高度范围不小于2米。另外,工业型人形机器人平均无故障作业时间也不能低于2,000小时左右。
人形机器人在工业制造场景进入小规模量产阶段,批量进入制造工厂。当前工业人形机器人较为成熟的场景多集中在物流分拣、焊接及装配质检、基础组装(如打螺丝)等。随着供需规模不断扩大,正从过去小规模进工厂试点探索应用场景阶段进入一定数量规模的量产作业阶段。近期东风柳汽与优必选签署战略协议,优必选20台Walker S1机器人将在东风柳汽的汽车制造工厂完成部署并用于整车制造过程中的如安全带检测、车门锁检测、车身质检、标签打印和搬运等工作,致力于提升工厂的智能化和无人化水平及作业效率,这是全球首次人形机器人批量进入汽车制造工厂。
人形机器人视觉感知需求不断提升,高精度3D视觉产业将迎来高速发展。当前3D视觉相机正大规模应用于人形机器人,提高了机器人空间建模准确性和对周边环境深度信息的理解能力。如优必选Walker S型工业机器人,配备多目视觉、全向听觉等全方位感知系统,结合360°多模态感知技术。据高工数据显示,2024年中国机器视觉市场规模约为181.47亿元人民币,3D视觉市场约为28.15亿元人民币,同比增长19.18%,预计2025年中国机器视觉市场规模有望突破210亿元人民币,同比增速超过14%,另外国内头部机器人视觉企业奥比中光,2025年1-5月较上年同期增加了8,643.86万元人民币,实现同比增长117.18%。因此在操作精细度高、动作较为复杂的工业制造场景3D视觉系统将成为人形机器人的标配。
人形机器人在工业制造场景落地问题和挑战
人形机器人存在维护困难,行业缺乏对工业人形机器人相关的产品设计和维护的标准。当前主流厂商人形机器人本体结构均较为复杂,其本体设计很多尚不具备工业制造过程中需要的高可靠和易维护等的特点,仍需要专业技术人员定期巡检和维修,在一定程度上限制了中小企业规模应用人形机器人作业的可行性。
短期内人形机器人仍较难突破部分工业制造场景,大模型仍有较大的局限性。受限于软件算法本身和与硬件适配的能力,机器人动作操作精度,手眼协同能力仍较差,当前机器人厂商需突破视觉和手臂操作可准确对齐的软件。再者当前人形机器人对于有较高柔性化组装需求的如精密且易碎的产品零件组装等任务仍较难达到相关的行业要求,如为零件提供恰当的扭矩、保持较好的严密性等。另外,人形机器人工作效率仍较低。在拆垛码垛的搬运场景中,机器人的平均搬运效率为普通工人的30%-40%,若实现规模化应用需达到约70%左右的工作效率。最后大模型和智能体的智能化程度和推理速度仍满足不了部分场景需求,如工厂制造过程中对产品的瑕疵检测场景等。
3D相机产品可靠性仍有待于提高。3D相机在遇到室外极强光环境、操作目标特殊几何形状所形成的多次光反射等易造成对距离判断的失真,导致感知出现误差。再者工厂作业一般排期紧张,制造工艺复杂且同一型号产品生产周期短,可供机器人实操训练的数据少,感知误差大、可靠性差、实操数据少将深度影响机器人模型的动作精度和泛化能力,因此未来制造工厂对机器人感知精度和可靠性将有较高的要求,当前各大厂商仍需继续升级机器人感知系统的可靠性和安全性。
人形机器人在工业制造场景应用启示和建议
一是探索和设计适用于工业制造的高可靠和易维护的人形机器人。相关部门应积极改善机器人本体结构,提高易损部件强度,优化各组件之间的连接方式,进而实现无需专业人员,机器人之间可相互快速维修的方案并缩短维修周期。二是多模态感知系统将解锁更多的工业场景,助力机器人实现柔性化操作生产。视觉+触觉的方式将有效推动人形机器人落地柔性化组装场景。由于大模型能力有限,短期内相关的精准力触和视觉动作对齐的软件仍需要定制且有一定的开发难度,可联合高校、央企与机器人厂商合作联合开发此类软件。三是工业人形机器人需不断提升感知系统的可靠性。工业场景环境相对复杂,对机器人感知能力要求高,一方面,机器人在部署3D相机的同时,可冗余部署三维激光雷达。另一方面,在提升感知深度和精度的同时,也可通过升级相关的软件技术改善感知的可靠性,如机器人下一步可在加持双目3D立体视觉系统的基础上,引入OCC(Occupancy Network)占用网格技术,进一步提升复杂场景环境下识别物体的鲁棒性。