图片由AI生成
12月17日下午,腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,强化其大模型的研发体系与核心能力。
Vincesyao(姚顺雨)出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。
姚顺雨出生于1998年,本科毕业于清华大学姚班,普林斯顿大学计算机科学博士,是OpenAI前研究员,于2024年8月加入OpenAI。
在学术上,姚顺雨主要研究智能体,在OpenAI研究用于数字自动化(WebShop、SWE-bench、tau-bench)的语言代理(ReAct、Reflexion、思维树、SWE-agent、CoALA)。
截至9月12日,谷歌学术显示,其研究在ReAct和思维树引用次数已过4千次,个人总引用次数已过1万5千次。
今年9月,有传言称,姚顺雨离职OpenAI,以年薪1亿入职腾讯,引发AI圈轰动,随后,该消息被腾讯方面辟谣。
据腾讯介绍,作为腾讯大模型体系的重要一环,此次新成立的AI Infra部,将负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术能力,构建大模型AI Infra核心竞争力,为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务。
架构升级后的AI Data部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。
王迪继续担任大语言模型部副总经理,向姚顺雨汇报。刘煜宏担任AI Data部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。
AI大模型研究与工程技术紧密相关。在过往混元大模型训练以及海量业务场景的深度实践中,腾讯已经积累了系统化的工程能力;此次大模型研发架构升级,在进一步强化腾讯工程化优势同时,旨在提升AI大模型研究能力,聚焦公司AI战略布局,提升AI大模型的研发效率。
过去一年,混元大模型发布超过30个新模型。12月5日发布的混元2.0,显著改进了预训练数据和强化学习策略,在复杂推理与文本生成场景表现国内领先。混元3D模型甚至保持着全球领先的水准,开源社区下载量超过300万。
在产品和服务层面,腾讯元宝上线初期,甚至保持了每天一个版本的迭代频率,目前用户规模稳居国内AI应用前三。腾讯也将元宝的AI能力融入微信、QQ、音乐、会议等国民级产品中。