“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
金融界
2024-01-07 16:28:26
0

原标题:“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元

一个便宜、好用的家用机器人或许很快将会到来。

大秀了一把厨艺后,斯坦福华人团队开发的机器人又在北京时间今日凌晨发布了新视频《Mobile ALOHA的一天》,展示了浇花、打扫房间、煮咖啡、给主人刮胡子、洗碗、逗猫、扔垃圾、洗衣服、换被套、收纳衣物等数十种家务技能,堪称“全能家政员”。

网友热评,“最难得的是眼里有活。”

长期以来,人们深受“莫拉维克悖论”(Moravec's paradox)的困扰,这是一种和人们直觉相悖的现象,即“人类觉得容易的任务对人工智能来说却极其困难,反之亦然”。

换言之,一个会做家务的机器人,非常难得。

但别高兴得太早,Mobile ALOHA虽然“眼里有活”了,但它的动作依然由人操控(见下图),并非完全智能的自主操作。

团队负责人之一对此表示,人类操控是暂时的,他们已经在研究如何弥合人为控制和机器人自控之间的差距。团队的另一位负责人Tony Z. Zhao乐观表示,“2024年将是机器人年,这(家政机器人)仅仅是开始!”

Mobile ALOHA更大的意义在于,其运动控制能力比成本高出5-10倍的同类系统更强大,展示了通用机器人的可行性,一个便宜、好用的家用机器人或许很快将会到来。

ALOHA即A Low-cost Open-source Hardware System for Bimanual Teleoperation,是一个低成本的开源双手遥控操作硬件系统,即开源机械臂。其算法Action Chunking with Transformers (ACT)采用了神经网络模型Transformers,因此具备模仿学习能力。只需要15分钟的演示,机械臂就可以学会一个动作——直接从真实演示中执行端到端模仿学习,并通过自定义远程操作界面收集。

据上述华人团队介绍,仅用50个演示,就能让Mobile ALOHA完成各种复杂任务,其成本仅为32000美元(约22万元),软件和硬件全部开源。

该团队在论文中详细介绍了Mobile ALOHA的硬件配置——最贵的是机械臂和移动底座,其中移动底座选择了同类产品中相对便宜的一款;传感器方面配备了2个腕部摄像头和1个顶部摄像头;配有机载电源和计算,即1.26千瓦时重14公斤的电池,在数据收集和推理过程中的所有计算都在一台消费级笔记本电脑上进行,该笔记本电脑配有英伟达3070ti GPU (8gb VRAM)和英特尔i7-12800H。

物料单中高价值量的部件

英伟达“网红研究员”、OpenAI第一个实习生Jim Fan此前乐观预测,2024年将成为人工智能界全面崛起反击莫拉维克悖论的元年,“我们不会立即获胜,但我们将走上获胜之路”。

这并非一时“口嗨”,如今产业面的各种进展层出不穷,Jim列举了2023年关于未来机器人的基础模型和平台的发展:

1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;

2、弥合 System 1(负责低级控制)和 System 2(负责高级推理)之间差距的算法(使得系统能够利用高级推理进行决策和理解,并将这些决策转化为实际的操作和控制):Eureka(英伟达)、Code as Policies(谷歌)等;

3、在强大硬件方面取得的惊人进展:特斯拉擎天柱、Figure、1X、Apptronik、Sanctuary、Agility+Amazon、Unitree等;

4、数据一直是机器人技术的致命弱点,研究界正在共同策划下一个 ImageNet(人工智能深度学习取得突破的关键项目),如开放Open X-Embodiment (RT-X)数据集。虽然数据集还不够多样化,但迈出了重要的一步;

5、模拟和合成数据将在解决机器人灵巧性乃至整个计算机视觉问题上发挥关键作用;

基础正一步步被夯实,站在2024年的年头,我们有理由期待更强大的机器人惊艳亮相。

来源:科创板日报

相关内容

热门资讯

天王电子取得钟表专利,兼具电子... 金融界2025年5月6日消息,国家知识产权局信息显示,天王电子(深圳)有限公司取得一项名为“钟表”的...
创新智慧养老实训室建设方案,提... 随着老龄化社会加速推进,养老服务面临供需失衡、服务标准化不足等问题。传统养老模式依赖人力且效率较低,...
专注多模态触觉感知与操作技术,... 投资界5月6日消息,据36氪报道,千觉机器人科技(上海) 有限公司(以下简称「千觉机器人」)近日完成...
关于量子计算,我们仍不知道它到... 转载自《返朴》 撰文 | robbieking1000 翻译 | 一二三 当前,量子...
AMD锐龙9 9950X3D网... 随着近年来PC平台游戏技术的飞速发展,游戏玩家对于帧数的追求愈发狂热,尤其是网络游戏领域,百帧体验已...
为传统中医药插上数智化翅膀 工业和信息化部等7部门日前共同印发《医药工业数智化转型实施方案(2025—2030年)》,列出中医药...
调控记忆的“魔法”会走进现实吗 转自:科技日报 科技日报记者 张佳欣 在小说《哈利·波特》的世界里,轻挥魔杖即可将记忆从脑中抽出,一...
曝苹果智能功能国行版将在iOS... 【CNMO科技消息】尽管更个性化版本的Siri被推迟发布,但苹果智能功能(Apple Intelli...
探寻福建“AI+”的“智”与“... 这绝对是AI含量最高的一届数字中国建设峰会。 坐上1∶1还原的高铁驾驶舱,手握操控杆,随着屏幕里风景...
小米15 Ultra快门音效将... 5月6日消息,小米相机部产品经理Bao_小李表示,小米会把15 Ultra的快门音效下放给维护期内的...
以云为笔绘就数字城市新图景 黄浦江畔,数据洪流奔涌不息;摩天楼间,数字丝网纵横交织。在这座城市的数字脉搏中,上海电信高级专家华静...
魔乐社区Modelers理事会... 在福州市举办的第八届数字中国建设峰会期间,一场聚焦智能云生态的重要活动——“2025智能云生态大会·...
纳尔股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示纳尔股份(002825)新获得一项实用新型专利授权,专利名为“...
常州星耀申请自动化分选设备专利... 金融界2025年5月5日消息,国家知识产权局信息显示,常州星耀机器人有限公司申请一项名为“自动化分选...
思进智能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示思进智能(003025)新获得一项实用新型专利授权,专利名为“...
5G赋能中医慢病诊疗创新:破解... 近日,工业和信息化部办公厅与国家卫生健康委员会办公厅联合发布《关于公布5G+医疗健康应用试点全国优秀...
小米取得摄像头模组和电子设备专... 金融界2025年5月6日消息,国家知识产权局信息显示,北京小米移动软件有限公司取得一项名为“摄像头模...
从“卖商品”到“卖场景”, 华... 南都讯 记者林敏儿 通讯员黎津慧 2025年“五一”假期过去了,在深圳科技感与烟火气并存的城市地标—...
康力电梯获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示康力电梯(002367)新获得一项实用新型专利授权,专利名为“...