生数科技发布通用世界模型战略 加速物理AI布局
创始人
2026-04-01 19:38:50

本报讯 (记者贾丽)近日,由海淀区人民政府与北京国有资本运营管理有限公司联合主办的2026中关村论坛年会“人工智能主题日”特色主题论坛“AI未来论坛:跃迁·投资·共生”在中关村国际创新中心成功举办。论坛汇聚全球顶级投资人、产业领袖与前沿创新者,围绕人工智能从技术突破迈向产业价值的关键路径展开深入探讨。

在“前沿Tech Show”环节,北京生数科技有限公司(以下简称“生数科技”)创始人、清华大学人工智能研究院副院长朱军教授发表题为《通用世界模型:连接数字世界与物理世界的桥梁》的主题演讲,系统阐述了生数科技在通用世界模型方向的战略布局与技术路径。

通用世界模型战略布局越发清晰

在长期的视频大模型的技术积累上,生数科技逐步构建起一条清晰的通用世界模型的战略布局:以基座世界模型为核心底层,向上延展出贯通数字空间与物理空间的双轨体系,形成面向通用智能的核心基础架构。

在底层能力上,该基座世界模型基于全球首创的U-ViT架构,积累视觉、听觉、触觉等多模态信息,构建对世界的统一认知与建模能力,为上层应用提供统一的智能底座。

在数字空间,生数科技基于世界生成模型(WGM)打造视频大模型产品Vidu。Vidu生成模型聚焦单时点模拟世界,赋能AI在数字世界的生产力。流式生成模型,聚焦多时点模拟世界,实现实时陪伴和交互。Vidu显著提升了数字内容的生产效率,最终实现数字世界的AGI。

在物理空间,生数科技基于世界行动模型(WAM)构建统一世界模型产品Motus。Motus作为真实世界具身智能的“大脑”,致力于解决传统具身智能链路割裂、数据稀缺、泛化能力弱等核心痛点,可实现真实世界下的零样本泛化与跨本体适配,推动机器人从“模块化执行”向“统一智能体”跃迁,最终实现物理世界的AGI。

由此,生数科技构建起贯通理解世界、生成世界与行动于世界的完整技术闭环,使通用世界模型真正成为连接数字世界与物理世界的桥梁。

通用世界模型正成为通向AGI的重要方向

而当前的AI系统,虽然在单点能力上取得了突破,但整体上仍然是“割裂”的。有的擅长生成,有的擅长理解,有的用于执行,但很少有系统能够统一完成这三件事。如果机器要真正具备智能,就必须具备类似人类的世界模型能力。

在此基础上,朱军指出,通用世界模型正在成为通向AGI的重要方向。

长期以来,具身智能面临“数据墙”:真实世界的轨迹数据成本高、规模小,难以支撑模型泛化。对此,朱军提出一个关键判断:视频,是当前最接近真实世界的数据形态。

基于这一判断,生数科技构建了以视频为核心的数据体系——从海量互联网视频,到第一视角操作视频,再到机器人数据,形成一个可扩展的数据金字塔。在这一体系下,即使缺乏大量标注数据,模型依然能够学习到有效的行动能力。

业内人士认为,在数据利用与规模扩展方面,Motus展现出显著优势。在数据规模扩展实验中,相较国际领先的VLA模型Pi0.5,Motus能够从更广泛的异构数据中学习,并有效融合预训练基座模型中的多模态先验能力。在长程、多步骤的复杂真机任务中,Motus进一步呈现出接近人类水平的决策逻辑与执行稳定性。

面向未来,生数科技将继续坚持以原创技术为底座,围绕通用世界模型持续推进底层架构、数据体系与应用场景的协同突破。

从视频模型到世界模型,从数字空间到物理空间,生数科技正在探索一条更完整的通用智能路径。随着相关技术持续演进,通用世界模型也将加快走向真实产业场景,释放更大的技术价值与应用潜力。

(编辑 张伟)

相关内容

热门资讯

WOD制造业数智化博览会在沪启... 来源:滚动播报 (来源:上观新闻) 6月3日至5日,2026 WOD制造业数智化博览会(上海)暨W...
上海太阳能取得低功耗全光谱智能... 国家知识产权局信息显示,上海太阳能工程技术研究中心有限公司取得一项名为“一种低功耗兼容的全光谱智能护...
智能验核让上海离境退税服务更高... “这台设备太先进了,不仅能视频通话,还能看到英文译文。”日前,来自加拿大的旅客戴维在上海浦东国际机场...
不到一万即可入手,人形机器人价... 2026年以来,国内人形机器人市场迎来历史性价格拐点,曾经动辄数十万、上百万元的产品开始变得亲民,甚...