AI工厂炸场!摩尔线程提速150%,国产算力硬刚英伟达
创始人
2025-07-28 00:00:59
0

来源:倪卫涛

现在的AI圈比娱乐圈还能整活!一边是大模型智商半年暴涨50%,马斯克靠20万张GPU卡让Grok 4直接封神;另一边,国产GPU玩家摩尔线程突然甩出"AI工厂"王炸,号称能让DeepSeek模型推理速度飙1.5倍。这哪是技术发布会?分明是算力军备竞赛的冲锋号!要知道,英伟达黄仁勋刚说自家AI工厂能提效50倍,这边张建中就带着"平湖"架构杀过来了——当国产GPU开始对标H100,当"智能晶圆厂"要量产AI,咱们普通人该兴奋还是该慌?

一、大模型"卷疯了":没有20万张GPU,都不好意思说自己搞AI

这年头搞大模型,比的不是算法多牛,是显卡有多少。张建中在WAIC上一句话戳破真相:"Grok 4能当世界第一,马斯克就一个秘诀——买了20万张GPU卡。" 这话听着扎心,但你不得不服:DeepSeek V3发布才半年,"智力"直接涨了50%,人类进化几万年都没这速度。更可怕的是,这还只是开始。

现在的AI圈已经卷成了"算力军备竞赛"。你用1万张卡,我就上10万张;你训3个月,我就压缩到1个月。为啥?因为模型能力的增长曲线比火箭还陡。张建中说得实在:"别跟模型斗,它是你的Agent,你不能变成它的Agent。" 意思就是,普通人别想着跟AI比智商了,赶紧学会用AI才是正事——但问题来了,用AI的前提是有算力,而算力的核心,还得看GPU。

这里就得说到摩尔线程的野心了。这家成立才5年的公司,硬是从"国产游戏第一卡"MTT S80,一路干到对标英伟达H100的MTT S5000。最新的"平湖"架构更是放了个大招:用Triton-MUSA编译器+MUSA Graph一优化,DeepSeek R1推理速度直接拉到1.5倍。听起来像参数党炫技?但对企业来说,这意味着同样的算力成本,能多跑50%的活儿——在AI训练按秒烧钱的时代,这就是真金白银。

二、从"芯片厂"到"智能厂":英伟达和摩尔线程,谁在重新定义AI?

"AI工厂"这词儿,英伟达黄仁勋先喊出来的。老黄说,传统数据中心是"存数据的仓库",AI工厂是"造智能的流水线",用GB300 NVL72机架能提效50倍。听着挺玄乎,但核心就一个:把AI从"实验室项目"变成"工业化生产"。

但摩尔线程偏要换个词,叫"AI Foundry"(智能铸造厂)。一字之差,差别大了去了。英伟达的"Factory"讲究全栈垄断,从芯片到软件层层锁死,你想用?就得买我的卡、装我的系统、用我的生态。而摩尔线程的"Foundry",更像开放代工模式——用自主MUSA架构当"生产线",让企业能自己定制"智能零件"。

张建中说了五个底气:全功能GPU保证通用性,MUSA架构提升有效算力,全栈软件榨干单节点效率,KUAE集群优化多机协作,零中断容错技术扛住稳定性。这堆技术名词翻译成人话就是:既要算力强,又要省成本;既要单机猛,又要集群稳。数据能说明问题:GEMM算子利用率98%,Flash Attention算子95%,RDMA网络带宽利用率97%——这些数字意味着,别人买100张卡跑的活儿,用摩尔线程的方案,可能70张就够了。

最关键的是那个"零中断容错技术"。搞过AI训练的都知道,集群里一张卡崩了,整个任务可能就得重来,几天几夜白干。摩尔线程说能把百GB级备份恢复时间从"数分钟"压到"1秒",这可不是小进步——相当于工厂生产线永远不停机,效率直接拉满。

三、四年四代架构:国产GPU的"逆袭剧本"怎么写?

摩尔线程的故事,得从张建中这个人说起。前英伟达全球副总裁、中国区总经理,在GPU圈摸爬滚打二十年,出来创业时已经40多岁。2020年6月公司成立,正好赶上全球芯片荒,一边是国外巨头技术封锁,一边是国内算力需求井喷,这开局简直是"地狱难度"。

但你猜怎么着?四年时间,这公司硬是啃下了四代GPU架构:2021年"苏堤"、2022年"春晓"、2023年"曲院"、2024年"平湖"。从最初对标RTX 3060的游戏卡,到现在能跟H100叫板的AI加速卡,这迭代速度比手机厂商发新机还快。融资40亿、投前估值246亿,背后是中国移动、深创投这些国家队真金白银的押注——他们赌的,就是中国不能永远没有自主GPU。

有人可能会说:"不就是跟着英伟达抄作业吗?" 这话只说对了一半。GPU这行当,专利壁垒比城墙还厚,想绕开人家的技术陷阱,比登天还难。摩尔线程的聪明之处在于,不硬碰硬搞完全自研,而是在关键节点"换道超车"。比如MUSA架构,没有死磕CUDA生态,而是搞了套兼容又独立的编译器和图形系统;再比如集群技术,没有照搬英伟达的NVLink,而是用MTLink2.0把带宽干到国内平均水平的1.6倍。

现在回头看,2022年发布的MTT S80显卡,当时被骂"性能拉胯",但两年24次驱动更新后,硬是兼容了近千款游戏——这背后是工程能力的体现。做GPU,从来不是画个电路图就行,得软硬协同、生态共建,这活儿,急不来。

四、AI工厂不是"科幻概念":普通人能等来什么?

别以为"AI工厂"跟咱们没关系,它离生活比你想的近。现在你用的AI聊天机器人、刷到的AI生成视频、甚至导航里的语音助手,背后都是算力堆出来的。当AI工厂把模型生产效率提上去,最直接的变化就是:AI服务更便宜、响应更快、功能更强。

举个例子,以前训练一个专业领域大模型,可能要花几千万、等半年;有了AI工厂,成本砍一半、时间缩三分之二,中小企业也能用得起。到时候,你开个小公司,也能定制自己的AI客服、AI设计师、AI分析师——这才是真正的"普惠AI"。

当然,挑战也不小。英伟达已经把"AI工厂"做成了闭环生态,就像当年英特尔+微软的Wintel联盟,想打破它难如登天。摩尔线程的机会在哪?在于中国市场的特殊性。政务、国企、关键行业对"自主可控"的需求,就是国产GPU的护城河。张建中说"AI Foundry要生产智能",其实潜台词是:不能让别人卡我们的算力脖子。

现在MTT S5000已经能跑DeepSeek-V3/R1 MoE大模型训练,推理加速1.5倍只是开始。按照这个节奏,明年说不定就能看到国产AI工厂跑出"中国版GB300"——到时候,马斯克用20万张卡堆出来的优势,咱们用10万张国产卡就能追上。

五、算力即国力:这场仗,中国芯必须赢

最后说句掏心窝子的话:AI工厂的本质,是算力主权的争夺。黄仁勋敢说"AI工厂提效50倍",是因为英伟达垄断了全球80%以上的AI算力;张建中敢提"AI Foundry",是因为摩尔线程已经摸到了通用GPU的门槛。这不再是简单的商业竞争,而是技术话语权的较量。

看看融资名单就知道:中国移动、深创投、上海国盛……这些投资方哪个不是国家队?他们投的不是一家公司,是中国在AI时代的"算力保险"。当大模型智商增速远超人类,当算力决定AI进化速度,没有自主GPU,就像打游戏没有显卡——别人能开4K光追,你只能看幻灯片。

当然,现在就喊"国产GPU超越英伟达"还太早。但至少,摩尔线程让我们看到了可能性:四年四代架构,从游戏卡到AI加速卡,从追赶者到规则制定者。张建中说"不要跟模型斗,要把它用好",但他没说的是:要想用好模型,先得有造模型的"工厂";要想有工厂,先得有自己的"机床"——而GPU,就是AI时代的"智能机床"。

所以,当MTT S5000的指示灯亮起,当DeepSeek模型在国产算力上狂飙,这不仅仅是一次技术突破,更是一个信号:中国芯,正在AI工厂的赛道上,加速超车。至于最后能不能跑到第一?咱走着瞧——但至少,这场仗,咱们没缺席。

相关内容

热门资讯

天津人民出版社《征途:走向现代... 天津北方网讯:日前,由天津人民出版社主办的《征途:走向现代化》新书分享会在重庆国际博览中心举行。天津...
东菱测试取得冲击试验台专利,提... 金融界2025年7月26日消息,国家知识产权局信息显示,苏州东菱测试设备有限公司;苏州东菱振动试验仪...
云手机平台:便宜好用且流畅的云... **一、云手机的便捷性——远程控制手机** 云手机为用户带来了前所未有的便捷体验。通过远程控制手...
西安国联取得金属材料检测夹具专... 金融界2025年7月26日消息,国家知识产权局信息显示,西安国联信息科技有限责任公司取得一项名为“一...
原创 说... 2025年7月,一则震撼性的科学推测在全球网络发酵——今年7月1日发现的星际天体3I/ATLAS可能...
京东在2025世界人工智能大会... 在2025世界人工智能大会(WAIC)期间,京东携重大成果亮相,正式宣布旗下言犀大模型品牌升级为Jo...
主播说联播丨从18到80+,新... 7月26日,2025世界人工智能大会在上海开幕。今年的展会现场,有一个明显的新变化——随处可见机器人...
重庆谱视达取得大量程光谱共焦色... 金融界2025年7月26日消息,国家知识产权局信息显示,重庆谱视达科技有限公司取得一项名为“一种大量...
在WAIC 2025看到AI的... 记者 周悦 2025世界人工智能大会(WAIC 2025)于7月26日至28日在上海举行,汇聚了80...
农机添“新”种植含“智” 山东... 中新网 济南7月27日电(周艺伟)盛夏时节的齐鲁大地,高效农业的生动实践在田野间徐徐铺展。从新能源农...
富维股份携手月泉仿生布局仿生智... 中证报中证网讯(王珞)7月26日,“仿生机器人与仿生智能大会暨国际仿生科学院成立大会”在北京昌平未来...
商汤科技发布“悟能”具身智能平... 中证报中证网讯(记者 乔翔)7月27日,在“大爱无疆·模塑未来”WAIC 2025大模型论坛上,商汤...
AI工厂炸场!摩尔线程提速15... 来源:倪卫涛 现在的AI圈比娱乐圈还能整活!一边是大模型智商半年暴涨50%,马斯克靠20万张GPU卡...
闪电快讯|号称帮HR节省70%... 7月27日,2025世界人工智能大会(WAIC)召开期间,智联招聘官宣发布“智联招聘AI版”,将AI...
欧航局成功发射一箭五星 本文转自【新华网】; 新华社巴黎7月26日电(记者罗毓)欧洲航天局26日说,当地时间25日夜,该机构...
金山办公发布原生Office智... IT之家 7 月 27 日消息,今日在世界人工智能大会上,金山办公发布了 WPS AI 3.0 版本...
“留学归国人才创新创业基地——... 7月27日,在2025世界人工智能大会分论坛“归潮新声:青年海归科技对话”场上,“留学归国人才创新创...
【2025WAIC】蚂蚁密算开... 【环球网科技报道 记者 李文瑶】大模型在专业领域的应用成为业界关注焦点之一。7月27日下午,在202...
数据要素综合试验区建设取得积极... 国家数据局积极推进数据要素综合试验区建设,支持地方在数据产权、市场生态培育等8方面重点推进35项试验...
Steam注册人机验证难关?五... Steam,这一由Valve公司于2003年推出的电子游戏分发平台,已成为全球游戏爱好者的首选之地。...