华为缘何开源盘古大模型?
创始人
2025-07-01 01:02:01
0

6月30日消息,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

华为官方表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

目前,盘古Pro MoE 72B模型权重、基础推理代码,已正式上线开源平台。基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。盘古7B相关模型权重与推理代码将于近期上线开源平台。

这也是华为首度宣布开源盘古大模型,大模型开源的本质是以开放换生态,以生态养技术。

对于华为而言,本次并不是全面开源,而是选择了两款用量相对较多的模型,70亿参数的稠密模型参数量适中、性能均衡、部署门槛较低,在智能客服、知识库等多种场景中均可应用;盘古Pro MoE 720亿参数的混合专家模型凭借其稀疏激活、动态路由和多专家协作的特性,更适合处理相对复杂的任务。

不排除华为未来继续开源的可能性,一般而言,华为在做好技术稳定性等优化的基础上,先用两款模型试验开发者和市场反应,在可用性和易用性方面持续优化,再进一步开源。开源只是第一步,如何持续运营开源生态,远比开源本身更重要。

其中值得关注的是,本次华为还开源了基于昇腾的模型推理技术,国产AI之难,难在芯片,更难在生态,如果要让开发者更好地调用盘古等国产模型,就要让底层的AI基础设施实现更优适配,这也是华为开源基于昇腾的模型推理技术的意义。

同时,盘古大模型加昇腾推理技术的开源,开放了国产AI技术栈,类比DeepSeek的开源策略,在MoE架构成为主流时,其他厂商都无法复现DeepSeek同样的性能和成本,因此DeepSeek又开源了自己的代码仓库,进一步推动DeepSeek的普及,盘古和昇腾的搭配也能起到同样的效用。

此外,华为不止在模型和工具层有产品,昇腾这一层级对应的是目前更大的AI算力市场。在近日举办的华为开发者大会上,华为云CEO张平安宣布,基于CloudMatrix 384超节点架构的新一代昇腾AI云服务全面上线,以及盘古大模型5.5正式发布。

盘古大模型从训练到推理均深度依赖昇腾芯片,就像英伟达CUDA生态适合大模型,华为开源盘古大模型的本质,是通过技术普惠 + 生态友好将昇腾硬件嵌入 AI 产业链的核心环节。开发者使用盘古模型时,需依赖昇腾芯片的算力支持;企业落地行业应用时,需采购昇腾服务器或云服务;政企客户推动自主创新时,昇腾加开源盘古也更有竞争力。

而从华为开源了大量推理技术也可看出,华为希望在大模型快速落地的阶段,让盘古有更多的调用,更广阔的落地市场,如此这种从模型到硬件再到场景的闭环,才能使华为的全栈AI能力得以正向循环。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

相关内容

热门资讯

“武汉造”激光装备、无人机卖全... 长江网讯(记者万凌李沁雪通讯员韩珊胡一洲)6月26日下午,武汉市“建设支点当好龙头”系列形势政策宣传...
古尔曼:苹果正考虑放弃自研AI... IT之家 7 月 1 日消息,彭博社记者马克・古尔曼(Mark Gurman)今日发文称:苹果正在考...
何小鹏下单小米YU7“催”交付... 6月30日,小鹏汽车CEO何小鹏发文称,自己也下单了小米YU7。随后,“何小鹏也下单了YU7”登上新...
原创 天... 在户外照明行业的广阔星空中,河南天禹照明科技股份有限公司宛如一颗极为耀眼的恒星,凭借其卓越的综合实力...
原创 马... 如果人人都可以把自己的大脑开放接口,和AI助手对接,理论上,人人都可以把唐诗宋词、新华字典、圆周率背...
“搭上”脑机接口,一个卖豆腐的... 当地时间6月27日,马斯克和脑机接口公司Neuralink团队开了一场持续1个小时的会议,重点谈及了...
知乎直答新升级 知识库可共享订... 据介绍,升级后的知乎直答知识库,支持用户通过上传文档、添加知乎创作、添加网页来创建主题知识库,并面向...
苹果向Vision Pro用户... IT之家 7 月 1 日消息,苹果今天向部分 Vision Pro 用户发放了调查问卷,主要对自家产...
5G赋能农机行业:农友机械集团... 在农机行业的智能化进程中,一个里程碑式的项目——5G+工业互联网工厂,近日成功完成了验收工作。这一项...
亿纬锂能公布固态电池量产时间表... 服务异常,请稍后重试 经观汽车 第二届锂电池大会暨亿纬锂能24周年庆近日在惠州举行。活动中,亿纬锂...
原创 唐... 古代王朝的世袭制皇位继承,强调血统的重要性。这个血统不仅仅是指皇帝的儿子,还要考量皇子母家的出身、血...
Robotaxi大战,Lyft... 作者 / 莫 莉 编辑 / 张 南 设计 / 张 萌 在自动驾驶逐步渗透出行行业的2025年,Ly...
臭氧的“双面人生”:从高空保护... 一、臭氧:高空保护伞,近地“健康杀手” 距离地球表面20—50千米的平流层中,臭氧(分子式O₃)如同...
中国商业航天全景图:高频发射、... 作者 | 刘卓然 2025年6月6日凌晨,陕西西安的多位市民捕捉到了震撼人心的一幕:一个“不明飞行物...
翔宇医疗获得外观设计专利授权:... 证券之星消息,根据天眼查APP数据显示翔宇医疗(688626)新获得一项外观设计专利授权,专利名为“...
“没有传统的行业,只有传统的思... □ 本报记者 晏培娟 钱飞 通讯员 丁艺 孙薇 6月17日,中电电气(江苏)变压器制造有限公司为北美...
顺丰科技申请物流地址数据处理相... 金融界2025年6月30日消息,国家知识产权局信息显示,顺丰科技有限公司申请一项名为“物流地址数据处...
我科学家揭示阿尔茨海默病早期病... 【医线传真】 科技日报讯 (记者赵汉斌)6月26日,记者从中国科学院昆明动物研究所获悉,该所研究员姚...
海河观察丨在天津,遇见生物医药... 日前,一场会聚生物医药产业精英的专场交流会,在天津港保税区举办。300多位嘉宾围绕放射性药物、生物制...
越疆科技面向全球批量交付人形机... 中证报中证网讯(记者 王辉)6月27日,越疆科技在日本制造业重要城市名古屋举办新品发布会,面向全球正...