还记得今年春晚上
盘核桃、串烤肠的
具身智能机器人“小盖”吗?
来自海淀企业银河通用的它
又迎来新突破!
近日
银河通用正式发布
全球首个人形机器人通用小脑GPT
(生成式预训练模型)基础模型
——AstraBrain-WBC 0.5
据官方介绍,作为“银河星脑(AstraBrain)”技术体系的重要一环,该模型基于2万小时人类动作数据训练,打造出行业最大规模人形机器人运动语料库,参数规模达8040万,是 全球首个达到GPT-1量级的人形机器人全身实时运控大模型。
这一突破
首次在 机器人运动控制领域
验证了类似GPT的规模化扩展规律
被业界视为人形机器人“小脑”的
GPT时刻已经到来
首次验证运控领域的
“规模化定律”
如果说“大脑”决定机器人如何理解世界,那么“小脑”则决定机器人如何在真实世界中行动。
在具身智能领域,长期以来,人形机器人运动控制主要依赖针对单一技能的专门训练,难以适应未见过的新动作和新场景。
AstraBrain-WBC 0.5的出现
直击这一核心难题
它首次证明,机器人运动控制同样能够像GPT一样,通过数据、模型和训练体系的持续扩展,不断学习更通用的运动规律。机器人不再只是记忆具体动作,而是能够理解动作背后的运动逻辑,并将能力泛化到从未见过的新动作和新场景中,实现真正意义上的零样本泛化。
论文数据清晰地展现了这种规模效应的威力:随着训练数据规模从200万帧扩展至20亿帧,模型成功率 由83.26%显著提升至92.58%,零样本跟踪误差持续下降。
研究团队指出,这意味着人形机器人运动控制正开始摆脱“学一个动作、会一个动作”的传统模式,走向能够 持续泛化、持续进化的基础模型路线。
“过去机器人是学一个动作、会一个动作,遇到没见过的场景就束手无策。”银河通用相关负责人表示,“我们希望通过AstraBrain-WBC 0.5,让机器人真正理解动作背后的运动逻辑,实现从‘记忆动作’到‘理解运动’的跨越。”
GPT式架构颠覆传统运控模型
据介绍,在技术路径上,AstraBrain-WBC 0.5彻底改变了人形机器人运控模型多采用浅层MLP网络的思路。这类传统模型虽然结构简单,但容量有限,很难随着数据规模增长持续获得性能提升。
研究团队首次采用GPT风格的因果Transformer架构,将机器人全身控制重新定义为一个连续序列预测问题。简单来说,该模型不再只关注当前时刻应该如何运动,而是能够结合过去连续动作历史,对未来动作趋势进行实时预测和控制。这种能力与GPT理解语言序列的方式高度类似,机器人看到的不再是孤立动作,而是一段连续的运动“语义”。
与此同时,团队还构建了由384个动作专家组成的运动先验库,并通过蒸馏训练将其融合为统一控制模型,实现从“专家技能集合”到“通用运动基础模型”的跃迁。
更重要的是,该工作首次验证了机器人运动控制领域同样存在类似GPT的发展规律:随着模型规模和数据规模的持续增长,性能持续提升,没有出现传统运控模型常见的性能瓶颈。
零样本泛化执行复杂动作
规模化带来的价值最终体现在能力上。在真实机器人测试中,AstraBrain-WBC 0.5实现了大量训练集中从未出现过的高动态动作零样本执行,包括篮球、拳击、舞蹈、翻身起立、协作搬运等复杂任务,均无需针对单个任务重新训练。
“这意味着,给机器人一个它从没见过的动作指令,它也能直接完成,不用再从头训练。”该负责人表示,搭载AstraBrain-WBC 0.5后,在面对外力猛踹等干扰条件下,机器人仍能保持稳定控制,展现出极强的鲁棒性。
在实时性方面,模型经过工程优化后,在单张RTX 4090显卡上实现低于1.5毫秒的端到端推理延迟,整套动捕链路设备延迟小于20毫秒,可满足50Hz实时闭环控制需求。在29自由度机器人上,全身协同控制实现手脚联动、重心切换等复杂动作流畅自然。
模型全面开源共建生态
目前,AstraBrain-WBC 0.5相关论文、代码与技术成果已全面开源。该负责人表示:“我们期待与全球研究机构、高校和开发者一起,共同推动机器人运动基础模型的发展,让更多创新应用加速落地。”
据悉,作为运控基座模型,AstraBrain-WBC 0.5可为研究机构、开发者及数据采集团队提供覆盖海量动作模式的运动基础模型,大幅降低人形机器人全身控制模型训练门槛。在应急救援、危险环境处置、创意内容生成等场景,其应用潜力正逐步显现。
对于“银河星脑”体系而言,这一突破意味着具身智能从认知到执行的关键闭环正在被补齐。业内人士表示,正如GPT证明了认知智能可以通过基础模型持续进化,AstraBrain-WBC 0.5则首次证明运动智能同样能够沿着基础模型路线不断成长——这被视为人形机器人“小脑”的GPT时刻。
记者:王萌
编辑:旭日
实习编辑:黄羽婕
图片来源:银河通用机器人
来源:北京号
作者: 北京海淀官方发布