华为缘何开源盘古大模型?
创始人
2025-07-01 01:02:01
0

6月30日消息,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

华为官方表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

目前,盘古Pro MoE 72B模型权重、基础推理代码,已正式上线开源平台。基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。盘古7B相关模型权重与推理代码将于近期上线开源平台。

这也是华为首度宣布开源盘古大模型,大模型开源的本质是以开放换生态,以生态养技术。

对于华为而言,本次并不是全面开源,而是选择了两款用量相对较多的模型,70亿参数的稠密模型参数量适中、性能均衡、部署门槛较低,在智能客服、知识库等多种场景中均可应用;盘古Pro MoE 720亿参数的混合专家模型凭借其稀疏激活、动态路由和多专家协作的特性,更适合处理相对复杂的任务。

不排除华为未来继续开源的可能性,一般而言,华为在做好技术稳定性等优化的基础上,先用两款模型试验开发者和市场反应,在可用性和易用性方面持续优化,再进一步开源。开源只是第一步,如何持续运营开源生态,远比开源本身更重要。

其中值得关注的是,本次华为还开源了基于昇腾的模型推理技术,国产AI之难,难在芯片,更难在生态,如果要让开发者更好地调用盘古等国产模型,就要让底层的AI基础设施实现更优适配,这也是华为开源基于昇腾的模型推理技术的意义。

同时,盘古大模型加昇腾推理技术的开源,开放了国产AI技术栈,类比DeepSeek的开源策略,在MoE架构成为主流时,其他厂商都无法复现DeepSeek同样的性能和成本,因此DeepSeek又开源了自己的代码仓库,进一步推动DeepSeek的普及,盘古和昇腾的搭配也能起到同样的效用。

此外,华为不止在模型和工具层有产品,昇腾这一层级对应的是目前更大的AI算力市场。在近日举办的华为开发者大会上,华为云CEO张平安宣布,基于CloudMatrix 384超节点架构的新一代昇腾AI云服务全面上线,以及盘古大模型5.5正式发布。

盘古大模型从训练到推理均深度依赖昇腾芯片,就像英伟达CUDA生态适合大模型,华为开源盘古大模型的本质,是通过技术普惠 + 生态友好将昇腾硬件嵌入 AI 产业链的核心环节。开发者使用盘古模型时,需依赖昇腾芯片的算力支持;企业落地行业应用时,需采购昇腾服务器或云服务;政企客户推动自主创新时,昇腾加开源盘古也更有竞争力。

而从华为开源了大量推理技术也可看出,华为希望在大模型快速落地的阶段,让盘古有更多的调用,更广阔的落地市场,如此这种从模型到硬件再到场景的闭环,才能使华为的全栈AI能力得以正向循环。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

相关内容

热门资讯

原创 5... 近日,根据多家科技媒体的消息,国内手机评测机构安兔兔公布了2025年5月份安卓手机好评榜。和前面的榜...
工业智能体崛起:AI赋能下的数... 在当前的工业领域,智能体(Agent)技术的运用正处于初步探索和基础构建的关键阶段,鼎捷数智的执行副...
中信银行构建全链路金融产品矩阵 “启航计划”聚焦人工智能、生物医药、高端制造等科技前沿领域,通过构建全链条金融服务体系,未来3年计划...
京东加码“AI人才争夺战” 大模型技术的爆发式发展,让所有的互联网应用,都值得用AI重做一遍。因此,优秀的AI人才成为科技企业的...
无人机生产线变成教学线,5G研... 当2025年高考录取分数线揭晓,深圳高校招生版图再次成为焦点。深大人工智能学院首次亮相,南科大新增口...
南A中心孵化基地举行首批入驻企... 6月30日,中国—东盟人工智能创新合作中心(以下简称南A中心)举行孵化基地首批入驻企业交钥匙仪式,标...
嘉园社区: 庆“七一”文艺进社... 为庆祝中国共产党成立104周年,丰富居民精神文化生活,由巨野县政协、县妇联联合举办的“巾帼心向党 筑...
宁德时代取得电池单体、电池及用... 金融界2025年7月1日消息,国家知识产权局信息显示,宁德时代新能源科技股份有限公司取得一项名为“电...
知乎周源:AI浪潮之下,开发者... 封面新闻记者 欧阳宏宇 “随着AI浪潮奔涌,属于开发者的黄金时代正在发生。”6月30日,知乎创始人、...
著名光谱学家、分析化学家和教育... 据厦门大学发布的讣告,我国原子光谱分析的奠基者之一,著名光谱学家、分析化学家和教育家,中国科学院院士...
500v电动叉车充电机_agv... 山东科嘉电气的 500V 电动叉车充电机 和 AGV 机器人搬运车蓄电池充电机模块 是针对工业场景需...
史上变化最大iPhone!曝i... 站长之家(ChinaZ.com)6月30日 消息:近日,博主MaJin Bu在社交平台爆料了关于iP...
AI味,越来越让人受不了了 本文来自微信公众号:,作者:小金牙,编辑:肖阳,原文标题:《DeepSeek式的AI味,越来越让人受...
在广东,华为云让“AI+”跑进... “AI+”连续两年被写入政府工作报告后,大模型相关的新技术正在快速蜕变,加速走出实验室,融入企业的核...
大疆新款无人机最大载重80千克 【深圳商报讯】(首席记者 袁静娴)6月30日,大疆发布全新旗舰级民用运载无人机DJI FlyCart...
原创 5... 你是否还记得上一次换手机是什么时候?随着科技的飞速发展,智能手机的迭代速度越来越快,但大多数人的换机...
南京站广场智慧公厕:革新如厕体... 南京,这座承载着厚重历史与现代活力的城市,在公共服务创新领域再次迈出坚实步伐。南京站广场的智慧公厕项...
一家店十个摄像头,被拍不知情?... 近日,北京市网信办对部分网络摄像头设备开展远程技术排查发现,仅未授权访问漏洞类问题就发现200余个,...
天问二号在轨获取的地月影像图发... 记者从国家航天局获悉,7月1日,该局发布行星探测工程天问二号探测器在轨获取的地月影像图。目前,天问二...
上班族副业:一个每天能操作的携... 本文将拆解一个已被验证可行的携程内容项目。近期实测数据显示,一个仅有三百多播放量的作品,可以结算0....