那有人就说了,既然如此,为什么宇树不一边在虚拟环境里训练机器人跳舞打拳,一边训练机器人做家务扫地擦桌子呢?
答案也好理解。
如果你只需要训练四肢与小脑,就不需要的复杂虚拟训练环境,机器人就能把高难度动作练得滚瓜烂熟。
但如果你需要让机器人做家务,要么你在虚拟环境里模拟现实中一切情况,要么让机器人有举一反三的能力,自己可以在复杂的物理世界找底层规律。
在这两种路径都打通之前,暂时机器人就只能在杂技武打的赛道上一条路走到黑。
很多人包括权威媒体资深投资机构也都是这么想的。
但AI时代最大的特点就是你永远不知道下一个突破来得有多快,你刚刚还觉得机器人不懂物理世界,但下一秒就突破了。
就比如春节前,视频AI模型Seedance2.0的横空出世,就突破了AI理解物理世界的界限,给机器人的智能进化直接打通了一条新的高速公路,这就是“世界模型”。
以前的ai视频,都是ai在迎合人类眼中的画面,像一个ps把画面画的像那么回事就行了,不回去管真实世界的运转规律,所以视频总会有一种梦游一样的失真感,但Seedance2.0解决了物理规律遵循及长效一致性的难题,AI先理解物理世界的光影、运动、因果关系和时间序列,才能在视频中精准把握那些连人类都难以注意到的细节。
随着“世界模型”越来越聪明,他就能根据少量样本和规律,实时生成大量符合现实物理的模型及动态,帮助AI智能体快速进化,实现“举一反三”,机器人才能真正开始干活打螺丝。
这就是为什么在Seedance 2.0刷屏海内外的时候,黄仁勋也投资了一家从AI视频转向做世界模型的公司runway。
英伟达机器人总监直接说了,ChatGPT再聪明,也只是在预测下一个词。真正的智能应该是什么?是看到一个杯子,知道倒水时它会溅出来,是捡起一根螺丝刀,知道它能拧下螺丝。这叫物理直觉。你把杯子倾倒,它就能预测杯子倾斜,水流出,溅到桌子上的全过程。
这种操作其实是在训练物理引擎。通过看数十亿小时的真实视频,让AI自己琢磨出万有引力,摩擦力,碰撞这些规律。不需要人类手工编程复杂的物理规律算法,AI直接从像素里领悟出来,进而举一反三。
其实王兴兴一直就非常清楚这个问题,机器人只能玩杂耍练武术的原因,是驱动机器人大脑的AI大模型不够,相比之下,他个人非常看好基于视频生成的世界模型驱动机器人控制。
之所以不去追求让机器人现在就干活,不是因为技术落后,而是一种脚踏实地的态度。
因为产业周期规律并没有变,在机器人彻底解锁“世界模型”这个新一代大脑之前,现在最重要的就是把眼前的小脑技术基础打好,否则就像波士顿动力一样,就算你提前研究液压机器人抢跑三十年,也一样宇树的电驱机器人甩在后面。
未来世界模型的成熟与否,也将同样决定中美谁的机器人能够更加迅速进入千家万户。
不争一时谁能讨好资本,而是打好下一个核心技术爆发前的技术根基。
今天美国人没想到,彻底杀死ai视频竞赛是来自中国的Seedance2.0,当年也一样。
波士顿动力之所以搞内燃机液压机械路线,主要是当时全球电池电控与电驱技术都不成熟,可谁也没有想到,近十年里,中国新能源汽车发展那么快,不但锂电池技术迅速成熟,连电机、电控技术也是一日千里,大扭矩的关节电机,不但爆发力高,弹跳爆发还比液压机器人更好,还不会延迟,最后又赶上AI爆发,所以从电驱机器人到电动车的智能化水平,一夜就超过了机械机构+内燃机时代欧美上百年的积累。
从这次春晚就能看出来,中国机器人产业是以一种生态爆发的方式在迅速进化,只要跨过技术临界点,未来就会以超乎所有人想象的速度变成现实。
最后用一句智元机器创始人“稚辉君”的话结束今天的讨论。
“总有人说人形机器人是浪漫主义陷阱,但是莱特兄弟的飞机远比空气重,图灵的计算机也曾占满整个房间。事实是,大家总会高估一个技术的短期价值,而往往低估它的长期价值。