阿里“破芯”之路:一场不能输的科技突围战
创始人
2025-09-06 01:21:37
0

来源:市场资讯

(来源:每日经济新闻)

在大模型时代,拥有的AI(人工智能)芯片数量,决定了一家AI厂商的竞争力。

如今,阿里也被曝出正自研AI芯片。显然,在这一轮科技产业变革中,AI芯片已经成为大型AI厂商的“必答题”。

没有足够的AI芯片,就无法为未来海量增长的大模型应用提供算力支持;没有足够的AI芯片,也就难以通过规模定律,在大模型训练中占据有利位置;没有足够的AI芯片,无论是大模型还是云计算,都将成为没有根基的“无本之木”。

阿里选择“破局”AI芯片,恰逢其时。算力不够,数量来凑。目前,国产算力厂商、云基础设施厂商普遍通过“通信”来弥补单卡算力的不足,从而实现两颗乃至多颗国产算力卡达到英伟达一颗算力卡的效果,即“两卡打一卡”。

在这场不能输的科技突围战中,阿里凭借国内诸多厂商的努力,已占得先机。

大模型需求爆发,呼唤AI算力支持

在云计算时代,阿里云是国内市场的绝对领导者。进入大模型时代,阿里又迅速以“通义千问”系列产品跻身第一梯队。

国际市场调研机构沙利文报告显示,2025年上半年,中国企业级市场大模型的日均总消耗量为10.2万亿Tokens(文本处理的最小单位),其中,阿里通义占比17.7%位列第一,成为目前中国企业选择最多的大模型。

然而,大模型的竞赛远未到终局。当大模型从文本大模型走向多模态,决定未来市场格局的关键,正从算法层面向更底层的硬件基础设施下沉。

目前,Scaling Law(规模定律)仍在生效,拥有更多的AI算力,将有助于在大模型训练中占据优势。此外,在推理侧,大模型应用已经开始爆发。

阿里云收入的大增即证明了这一点。根据阿里巴巴财务报告,2025年4月至6月,阿里云实现超预期增长,季度收入同比涨26%至333.98亿元,增速创3年新高。

而为了应对未来的训练、推理需求增长,各大厂商都在加大AI算力的“军备竞赛”。据中邮证券研报,微软2025年第二季度(2025财年第四财季)资本开支为242亿美元,同比增长27%,目前,微软正在加速建设数据中心,以满足对AI训练和工具激增的市场需求。公司预计,2026财年第一财季有望将资本开支提升至300亿美元以上。

谷歌原本预计2025年资本开支为750亿美元,由于云产品和服务的需求强劲且不断增长,其将2025年资本开支上调至850亿美元。

8月29日,阿里发布2026财年第一财季报告,该季度资本开支为386.76亿元,同比增长220%,超市场预期,创历史新高,并重申未来三年持续投入3800亿元用于AI资本开支的计划。

而这些资本开支很大程度上用于AI算力。根据头豹研究院数据,2020年至2027年,中国智能算力呈现爆发式增长,预计将从75EFLOPS(每秒浮点运算次数)跃升至1117EFLOPS,年均复合增速超60%,成为推动整体算力扩张的核心力量。

契机:定制化大潮、以通信弥补单卡算力短板

近期,A股最为火热的股票,当属DSA(专用微架构)芯片厂商寒武纪,以及光模块厂商“易中天”(指新易盛、中际旭创和天孚通信)。

而这些股票受到资本市场青睐的本质,一方面是DSA更适合定制化,推理的单位成本更低;另一方面,是以通信弥补单卡算力不足。简单说,由于制程工艺等因素影响,国内厂商在单卡算力上难以追上英伟达H100。不过,AI算力从来都不是单打独斗,可以通过增加通信投入来弥补单卡算力不足的缺陷。

如今,阿里自研芯片,也赶上了这波风潮。

随着大模型的发展,推理需求的增加,定制化较强的DSA是否更受欢迎呢?

PPIO派欧云工作人员告诉《每日经济新闻》记者:“LLM(大语言模型)推理,大家更愿意为‘单模型专用’DSA买单;只要编译器透明、能跑PyTorch2.1,就算只能干编码或推荐两件事,1.8至2.3倍能效比即可。”

云服务厂商优刻得架构技术中心总监刘华对《每日经济新闻》记者表示:“这是肯定的。准确地说是分工演化,最近很⽕的一件事,就是字节采购国内某厂商加速卡⽤来推理,⽽且这个路径已经有⼤⼚验证过了,⽐如谷歌的TPU在BERT和DeepMind模型推理,AWS的Inferentia在Alexa上的推理。”

刘华具体解释:“DSA的优势在于特定任务极致的效率和极低的功耗,其设计⾥就舍弃通⽤性,专⻔针对AI训练和推理,DSA只会选择训练和推理的关键算⼦(例如:矩阵乘GEMM、卷积Conv、Attention)做硬件电路级优化。因此,⽬前做训练⻔槛会稍微⾼⼀些。”

可以看出,定制化的DSA相较于GPGPU(通用图形处理器),在推理领域效率更高、功耗更低。而未来AI算力市场主要看推理,在优刻得看来,随着AI的⼴泛应⽤,推理和训练的⽐例⼤概是7:3,甚⾄是9:1。

另外,随着大模型的发展,对算力密度有着更高的要求。为此,有Scale up(纵向拓展)和Scale out(横向拓展)两种方式。国产厂商正在通过Scale out来弥补单卡算力的不足。

PPIO派欧云工作人员告诉记者:“英伟达NVLink5把576卡拼成‘一台大机’,训练带宽14.4TB/s;国产卡单芯弱30%至50%,靠1.6Tbps以太网Scale out可弥补,达到128卡约等于64卡H100的水平。”

其认为,当国产算力芯片达到英伟达单卡性能一半时,还可以通过(通信)网络弥补。当性能不足一半时,网络也救不了,还得卷单卡性能。

不过,Scale out也增加了对光模块的需求。华为昇腾384超节点就需要6912个光模块。

刘华表示:“英伟达发现Scale up会面临越来越多的挑战,比如散热、距离墙等,因此在2025年CES(国际消费类电子产品展览会)上,英伟达提出CPO(共封装光学)的概念,就是要解决Scale out的问题。不过,Scale out也存在‘通信墙’的问题,对于训练参数数量巨大的基础模型,内部数据通信量是天文数字,通信开销会急剧增加,有效计算时间占比下降。”

利刃——达摩院平头哥,RISC-V阵营的“中国旗手”

大模型对AI算力的庞大需求,DSA的发展和Scale out的进步,降低了国产AI算力的供给难度。阿里此时推出AI推理芯片,可谓恰逢其时。

事实上,阿里在AI算力芯片领域已经筹划多年,且正在打造开源生态系统。

2017年,阿里成立达摩院。2018年,达摩院建立玄铁团队,并于2019年推出基于RISC-V架构的玄铁处理系列产品。

如今,玄铁已经打造了多款基于RISC-V架构的芯片产品。

业内人士对《每日经济新闻》记者表示:“服务器芯片中,除算力芯片,CPU物料成本占比约8%至10%,其次DDR5内存,占比为6%~8%,而NVMe SSD (NVMe标准的固态硬盘)4%~6%,400/800G网卡+交换合计5%;电源散热液冷再分5%~7%,CPU+内存+存储仍是BOM(物料清单)三座大山。”

刘华也对记者表示:“服务器芯片中,除了算力芯片外,CPU(中央处理器)、内存、存储占比最高。在没有GPU(图形处理器)的服务器⾥,CPU占到总成本的20%至60%,特别是HPC(高性能计算)的⾼密集计算⾥甚⾄能占到60%。其次就是内存和存储了,在内存密集型应⽤(如⼤型数据库、内存计算)的服务器中,内存的成本甚⾄能超过CPU,⽽在存储服务器中,⼤量SSD(固态硬盘)或全闪存储是主要的成本构成部分。”

阿里开始从这些芯片入手,逐渐增加服务器芯片自研比例。CPU芯片方面,2019年,达摩院推出玄铁C910,主频达2.5GHz;2023年11月,玄铁推出迭代版本C920,主频提升至3GHz;2025年2月,玄铁又推出其首款服务器级CPU玄铁C930,并于3月份开始交付。

内存方面,国内有长鑫;存储颗粒方面,国内有长存。因此,阿里又把自研的方向对准了SSD主控。

据达摩院旗下平头哥半导体透露,2025年3月,镇岳510已经在阿里云的EBS(块级存储解决方案)规模化上线。该产品能够在同等资源条件下,帮助阿里云EBS客户承载更多访问量,间接实现降本增效。

北京得瑞领新科技有限公司也依托镇岳510开发了其首款支持PCIe5.0接口的高性能NVMe SSD——D8000系列。借助镇岳510带来的提升,D8000系列产品性能功耗比较得瑞的上一代产品(PCIe4.0)提升70%以上,可满足AI训练、实时数据分析等需求。

镇岳510,正是采用平头哥自研的芯片架构,内置玄铁R910 RISC-V多核CPU系统,最高频率1.6GHz。

阿里基于RISC-V架构,逐渐覆盖服务器级CPU和SSD主控。但其真正目标,仍是AI服务器皇冠上的宝石——AI算力芯片。

在2025玄铁RISC-V生态大会上,达摩院首席科学家、知合计算CEO(首席执行官)孟建熠就表示,当前算力基础是以GPGPU(CUDA)为代表的传统闭源硬件与生态,随着DeepSeek、Llama、Grok等开源大模型不断涌现,给算力架构带来了新机会。

孟建熠认为,随着开源RISC-V架构快速发展,重新自研架构已意义不大,以RISC-V为基础构建处理芯片是未来的主流。RISC-V在AI领域具备很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核产品或者近内存计算。

而达摩院已经准备推出基于RISC-V架构的多款芯片产品,并在2025年2月公布了C908X、R908A和XL200等玄铁处理器家族新成员的研发计划。其中,C908X针对AI加速;R908A针对车载;而XL200提供更大规模、更高性能的多簇一致性互联。

可以看出,从服务器CPU到SSD主控,从AI加速到车载芯片、互联芯片,阿里正在基于RISC-V架构构建AI硬件底层竞争力。

AI推理可分为云侧推理和边缘侧推理。与云侧追求算力规模不同,边缘侧更加追求算力与需求适配,而这正符合RISC-V的特性。

与非研究院资深行业分析师张慧娟对记者表示:“RISC-V指令集非常精简、高效,它是模块化的,又具有扩展性。”

特普斯微电子市场总监杜云海认为:“RISC-V的崛起并非偶然,其开源指令集架构的特性早已为边缘AI的爆发埋下伏笔。作为一种可扩展、模块化的架构,并在专用微架构(DSA)等技术支持下,可支持厂商根据具体AI工作负载定制指令集,例如通过向量扩展提升并行计算能力,这恰恰契合了边缘设备对算力‘按需分配’的核心诉求。”

阿里的挑战及产业链机会

不过,利用RISC-V架构研发推理芯片也存在不少挑战,而最大的挑战莫过于生态。

正如蓉和半导体咨询CEO吴梓豪所言:“RISC-V关键是没有生态,不是说设计出一颗芯片,就能使用起来。它需要匹配的生态、驱动。”

而阿里也正在补上RISC-V生态方面的短板。2024年3月,达摩院宣布发起成立“无剑联盟”,通过构建开放、协同、普惠的RISC-V芯片服务体系,加速RISC-V产业化进程。据悉,成员将基于玄铁处理器紧密推进IP(网际互连协议)协同、工具链优化、操作系统适配、解决方案拓展、应用推广等工作。

若阿里自研的推理芯片得到大规模应用,国产芯片制造及光模块厂商或将得到大发展。

目前,国内晶圆代工领域主要厂商为中芯国际、华虹公司和晶合集成,而拥有先进制程代工能力的,唯有中芯国际。

相关内容

热门资讯

头条推荐!金花房卡代理零售天神... 天神联盟房卡更多详情添加微:33549083、 2、在商城页面中选择房卡选项。 3、根...
玩家攻略,金花房卡出售皇豪互娱... 微信游戏中心:皇豪互娱房卡在哪里买打开微信,添加客服微信【88355042】,进入游戏中心或相关小程...
推荐一款!斗牛房卡充值玄龙大厅... 推荐一款!斗牛房卡充值玄龙大厅/微信链接房卡从哪里购得Sa9Ix苹果iPhone 17手机即将进入量...
一分钟了解!如何购买金花房卡海... 您好!微信海草众厅大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(海草众厅)大厅介绍:...
IA解析/金花微信链接市场价格... 微信游戏中心:玄灵大厅房卡在哪里买打开微信,添加客服微信【88355042】,进入游戏中心或相关小程...
头条推荐!游戏微信牛牛房卡雷霆... 头条推荐!游戏微信牛牛房卡雷霆大厅/房卡官方正版房卡代理Sa9Ix苹果iPhone 17手机即将进入...
正版授权!牛牛房卡怎么获得西兵... 您好!微信西兵互娱/随意玩大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(西兵互娱/随...
科技实测!牛牛充值房卡新老夫子... 今 日消息,新老夫子房卡添加微信33549083 苹果今日发布了 iOS 16.1 正式版更新,简单...
科技实测!牛牛房卡怎么购买玫天... 微信游戏中心:玫天爱玩房卡在哪里买打开微信,添加客服微信【88355042】,进入游戏中心或相关小程...
头条推荐!牛牛房卡怎么购买亚金... 亚金方乐是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:【3329006910】或QQ:332900...
我来教你/牛牛房卡怎么购买鲨鱼... 我来教你/牛牛房卡怎么购买鲨鱼众娱/微信链接房间卡怎么购买Sa9Ix苹果iPhone 17手机即将进...
推荐一款!牛牛房卡制作链接芙蓉... 您好!微信芙蓉大厅大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(芙蓉大厅)大厅介绍:...
玩家攻略,牛牛房卡怎么获得海豚... 海豚大厅房卡更多详情添加微:33549083、 2、在商城页面中选择房卡选项。 3、根...
IA解析/金花房间怎么创建人人... IA解析/金花房间怎么创建人人大厅/正规房卡找谁买人人大厅是一款非常受欢迎的游戏,咨询房/卡添加微信...
IA解析/牛牛房卡制作链接天王... IA解析/牛牛房卡制作链接天王大厅/新天道/房卡链接在哪购买Sa9Ix苹果iPhone 17手机即将...
IA解析/金花充值房卡新大海/... 今 日消息,新大海房卡添加微信33549083 苹果今日发布了 iOS 16.1 正式版更新,简单介...
{2025年9月谷神星一号遥十... 9月5日晚间,酒泉卫星发射中心迎来重要航天时刻。星河动力航天公司成功发射谷神星一号(遥十五)运载火箭...
正规平台有哪些,牛牛房卡出售番... 番茄大厅是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:【3329006910】或QQ:332900...
IA解析/金花充值房卡旺旺大厅... 您好!微信旺旺大厅大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(旺旺大厅)大厅介绍:...
科技实测!斗牛房间怎么创建的天... 天蝎大厅房卡更多详情添加微:33549083、 2、在商城页面中选择房卡选项。 3、根...