翻车,才是斯坦福炒菜机器人学习人类的常态
机器之心Pro
2024-01-10 19:12:15
0

原标题:翻车,才是斯坦福炒菜机器人学习人类的常态

机器之心报道

作者:大盘鸡、陈萍

Mobile ALOHA 也有翻车时刻。

电视剧中角色的惊艳亮相不一定能打动你的心,但斯坦福全职管家兼御用大厨一定能拿下你对机器人的期待。

你还记得斯坦福 Mobile ALOHA 的神操作吗?备菜、翻炒、出锅,洗衣、逗猫、浇花它是样样精通。不过它也并非一直如此优秀。人有失足,马有失蹄,ALOHA 也有翻车时刻。我们一起品鉴一下 ALOHA 的「报错」操作。

原本是为了擦酒杯下的酒渍,或许是怕观众老爷看不出,只能多洒出来一点来引起注意。

每个物品都是独立的个体,锅、油、虾、碟都将有属于自己的归宿。

抓走物品旁边的空气,四舍五入也算是抓走了物品。

别人炒菜用时五分钟,机器人大厨先用一分钟炒一炒锅。

看到这样的行动表现,打破了我们对 Mobile ALOHA 的美好期待,坐等机器人为我们养老只能是「阳光下的泡沫,一触就破」。

96%

实际上,在最初两个 Mobile ALOHA 火爆的视频中,不少读者对于它的行为方式就有些错误的认知。比如在帮男生刮胡子这项任务中,可能大家都误以为这是机器人自主完成的,然而事实并非如此,这是通过人类远程控制完成的:

来自英伟达的研究科学家 Jim Fan 对此发布了推文,提醒大家别因为视频的惊艳程度就忽略了其中技术真相。他提到,应该将 Mobile ALOHA 看作是一辆制造精良的跑车,而它仍需要人类驾驶才能表现出自己的能力。现在的水平与能够完全自主的厨师还有较大的差距。

其实,研究团队在发布 Demo 时的项目页面中就对 Mobile ALOHA 的工作进行了明确分类。其中包括 Mobile ALOHA 能够自主完成的任务以及需要远程操作完成的任务。

研究团队在介绍时表示,对于一些简单的任务,Mobile ALOHA 可以在 50 次学习之后达到 90% 的行动成功率。对于一些简单的任务,如炒一只虾仁(有且只有一只)、拿块抹布、摆放好椅子,Mobile ALOHA 无需人类指点,还是可以自己 hold 住的。

Mobile ALOHA 可以自己完成的任务

不过,更加复杂的任务,如像炒虾仁滑蛋、打蛋、装盘等复杂操作,它依旧需要人类远程操控,而且有些视频还做了 10 倍加速处理。

依旧需要远程操控才能完成的任务

在机器人技术领域,从人类示范中进行的模仿学习已经取得了令人瞩目的成绩。其实训练 Mobile ALOHA 的过程就是像是在玩游戏 —— 操作机器人直到动作通关。Mobile ALOHA 之所以能够让人发出惊叹,是因为它所展示的任务不局限于桌面操作。这些复杂且灵活的动作源于研究者开发的一套系统,用于模仿需要全身控制的双臂移动操作任务。利用 Mobile ALOHA 收集的数据,进行有监督的行为克隆。

在上一篇文章中,我们已经分享了 Mobile ALOHA 具体的技术细节,但是并不直观。

图(左)展示了操作机器人最简单的方法就是将操作员的腰部与移动底座系在一起的。

加州大学圣地亚哥分校学生梁力天在 X 上发布了 Mobile ALOHA 的体验视频,他操纵 ALOHA 拿取箱子上的物品。简单来讲,如果你现在拥有了 Mobile ALOHA,最重要的一步就是需要你与 Mobile ALOHA「合二为一」。

虽然梁力天没有体验炒虾这样的高难度任务,但是依旧对 Mobile ALOHA 的技术表示了认可:它的直接关节映射使用起来非常直观,这使它成为比 VR 控制器更好的解决方案。这样的能力,只要 3.2 万美元的预算真的太值了。

图源:https://twitter.com/litian_liang/status/1744555501860638921

https://twitter.com/DrJimFan/status/1744786506810900679

在这个体验视频发出后,大家都很好奇,远程操控的原理到底是什么?Jim Fan 是这样解释的:

训练机器人就像在真实世界中玩游戏,一个人操作一个操纵杆来执行任务和收集数据,在遇到安全问题时进行及时的干预。

远程操控可以通过不同的方式完成,这里有一些其他选择:

  • 动作捕捉(MoCap):应用动捕系统来捕捉手部关节的细粒度运动。例如,演示者可以佩戴 CyberGlove 并操纵对象。CyberGlove 会实时捕捉运动信号和触觉反馈,然后将其重新定位到人形机器人上。
  • 另一种比较笨拙的方法是佩戴专用手套以及进行一些标记(markers)。NVIDIA 的 DexPilot 可实现无标记且无需戴手套的数据收集。人类操作员只需徒手即可执行任务。
  • VR 头显:将训练室视为虚拟现实游戏,并扮演机器人,这样做的优势是可以进行可扩展的远程数据收集。

最后,Jim Fan 说道,「我相信,只要有好的硬件,到 2024 年底,我们就能大幅提升自主技能。」

参考链接:

https://twitter.com/DrJimFan/status/1744786506810900679

https://twitter.com/tonyzzhao/status/1743378437174366715

https://mobile-aloha.github.io/resources/mobile-aloha.pdf

https://mobile-aloha.github.io/

https://twitter.com/litian_liang/status/1744555501860638921

相关内容

热门资讯

聚力同生·共创未来 中国电信国... 2025年6月19日,以“聚力同生·共创未来”为主题的中国电信国际全球合作伙伴大会在上海隆重举行。本...
物美黄村店完成自主调改 今日焕... 北京商报讯(记者 王维祎)6月20日,物美超市黄村店完成“学习胖东来自主调改”后焕新开业,成为继北京...
原创 中... 随着新能源汽车市场的飞速发展,电池技术的革新已成为决定未来出行格局的关键。近日,中国固态电池技术迎来...
电梯储能的“智慧大脑”:实时数... 安科瑞 王晶淼 Acrel-wjm 电梯储能是一种节能技术,它利用电梯运行中固有的重力势能转换(特别...
大漠大11787架无人机点亮重... 2025年6月17日,一项新的吉尼斯世界纪录在重庆夜空中诞生。大漠大11787架无人机成功挑战“最多...
泉州创新成果亮相第二十三届海创... 6月18日,以“科技创新赋能产业创新”为主题的第二十三届中国·海峡创新项目成果交易会在福州开幕。我市...
扎克伯格AI人才争夺战升级 挖... 【环球网科技综合报道】据外媒6月20日报道,Meta首席执行官马克·扎克伯格在人工智能领域的布局再次...
高效·便民·安全:中国电信全方... (记者 叶菁) 在数字经济浪潮中,中国电信作为央企主力军,正以"云网融合"为核心引擎,构建起覆盖消费...
打造空天地一体智能服务新生态​... 上证报中国证券网讯(记者 宋薇萍)近日,中国移动在2025年上海世界移动通信大会期间发布了“万象时空...
绿色金融、AI赋能……陆家嘴论... 普惠金融是实现社会公平与经济包容性发展的重要途径。在6月18日至19日举行的2025陆家嘴论坛上,与...
数聚西安,智造未来 | 广州数... 西安网讯(记者韩涛)6月19日,第六届西部数字经济博览会盛大启幕,西安国际会展中心内热潮涌动。广州数...
岚县AI项目技能培训助力妇女绽... 在数字化浪潮席卷万物的今天,岚县正积极行动,为广大妇女打开了一扇通往新世界的大门。近日,岚县妇联委托...
杭晋协作探路智慧矿山 具身智能... 一场聚焦“具身智能技术保障煤矿井下安全”的高效供需对接活动,日前在杭州“中国数谷”大厦举行。活动由杭...
先进封装牵引,PCB龙头加速布... 先进封装成为后摩尔时代提升芯片性能的主要途径,作为先进封装成本占比最高的ABF载板,其主要市场份额被...
科达阀门取得高稳定性三通球阀专... 金融界2025年6月20日消息,国家知识产权局信息显示,温州市科达阀门有限公司取得一项名为“一种高稳...
虎标智能取得便于上下料激光切割... 金融界2025年6月20日消息,国家知识产权局信息显示,广东虎标智能科技有限公司取得一项名为“一种便...
华为开发者大会HDC 2025... 今日,华为开发者大会(HDC 2025)在东莞松山湖科学城正式拉开帷幕。本次大会以“鸿蒙生态与AI技...
美科技巨头砸重金争抢稀缺AI人... (环球时报)本报记者 丁雅栀 随着人工智能领域竞争日益激烈,美国科技巨头们正不惜重金争夺人才。据美国...
暗物质真的存在不?这台望远镜拍... 家人们,今天咱来聊聊宇宙里一个超级神秘的话题 —— 暗物质。你们说,暗物质真的存在吗?最近啊,一台望...
车载显示迎来三大革命丨“抬头”... 挡风玻璃变身全息显示屏成为驾驶员的“第二视野”,隐藏式生物识别感应显示屏化身乘客的“安全卫士”,侧窗...