一位特别的“打菜师傅”亮相北京理工大学食堂,立刻引来师生的围观。它拥有白色外壳组成的机械臂。随着同学的点菜指令移动旋转,动作灵活而精准,仿佛拥有智慧一般。
会打饭的机器人?原来,这是由北京理工大学自动化学院组合导航与智能导航研究室师生团队自主研发的“巧手灵心——具身智能机器人服务系统”。“巧手灵心”机器人名副其实,既有灵活的“巧手”,能完成平移转动等多种动作组合,也有一颗“灵心”,会根据菜量、菜品质地、餐盘位置等因素的改变而自适应调整动作,甚至会在盛菜后沥去多余汤汁,“像是真人一样”是现场师生对它的一致评价。
“巧手灵心”动作灵活,交互性强,是AI领域前沿研究方向“具身智能”的先进成果。研究团队由自动化学院教授杨毅和岳裕丰指导,主要组成人员是本科生。
不同于常规不变的操作对象,菜品是具有流动性的。在采用菜盆作为刚体匹配的基础之上,研发团队又新增深度相机,将盆内菜量信息引入到操作行为框架中,实现行为对象由刚体到流体的转变,从而使机器人能根据菜量变化时时更换打菜点。
不同的菜品所需力度也是不一样的,为了让机器人“不用打鸡块的力去打豆腐”,团队为机械臂增加力反馈能力,使之在接触菜品时可根据反馈去控制力度,调整动作和方式。更为智能的是,即使餐盘移动,机器人的随动跟踪能力也能让它准确识别到正确摆放位置,与环境空间保持交互。
受限于机器人操作数据集规模和算力,研发团队无法完全依赖数据驱动的方式来进行模型训练,他们创新性地采用了视觉模仿学习方式。
“我们先去找食堂师傅学习打饭的动作和标准,然后在实验室录制视频作为原始数据给人工智能学习,”团队学生周天行介绍道,“这种方法对机器人学习来说难度更大,就像是人不靠教练指导、只通过视频学习游泳一样,对于基础模型理解多模态信息的能力带来了更大的挑战。”
为了给机器人提供丰富、真实的训练数据集,团队学生录制了多条多角度示范视频,使机器人能够充分得到打饭每一个步骤所需要的动作素材。通过提取和抽象视频中的操作,机器人逐渐掌握了复杂的打菜技巧。
岳裕丰表示,具身智能是基于物理实体进行感知和行动的智能系统,通过在物理世界和数字世界的学习和进化,理解世界、互动交互并达成目标。不同于传统的编程机器人,具身机器人搭载了先进的大模型与深度学习算法,能轻松实现从“机械完成指令”到“主动适应环境”的跨越。
正是有了这项能力,“巧手灵心”不但可以成为打饭师傅,还可以化身厨师制作美味的披萨,甚至能成为实验室小助手……
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的全部作品,网站转载,请在正文上面注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:。
共建数智新时代的科研诚信 —— 威立(Wiley)参与首届玉渊潭科研诚信论坛