9月18日,在华为全联接大会2025上,华为轮值董事长徐直军公布了最新的昇腾AI芯片路线图。根据路线图显示,华为在今年一季度已经推出了昇腾910C。后续将在2026年第一季度推出全新的昇腾950PR芯片,四季度推出昇腾950DT。2027年四季度,华为将推出昇腾960芯片,2028年四季度推出昇腾970芯片。
从具体的技术指标来看,昇腾910C基于SIMD架构,算力高达800TFLOPS(FP16)支持FP32/HF32/FP16/BF16/INT8等数据格式,互联带宽784GB/s,HBM容量为128GB、内存带宽为3.2TB/s。
昇腾950PR/DT微架构将升级为SIMD/SIMT,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s。内存容量和带宽上,昇腾950PR为144GB、4TB/s,昇腾950PR为128GB、1.6TB。
昇腾960微架构还是SIMD/SIMT,算力翻倍提高到2PFLOPS(FP8) /4PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8/ HiF8/MXFP4/HiF4等数据格式,互联带宽为2.2TB/s。HBM内存容量也翻倍到288GB、带宽达到9.6TB/s。
昇腾970微架构也是SIMD/SIMT,算力再度翻倍到4PFLOPS(FP8) /8PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8/ HiF8/MXFP4/HiF4等数据格式,互联带宽提高到4TB/s。HBM内存容量虽然维持到288GB,但是带宽会提高到14.4TB/s。
需要指出的,自昇腾950PR开始,昇腾AI芯片将采用华为自研的HBM。其中,昇腾950搭载自研的HBM HiBL 1.0;昇腾950DT升级至HBM HiZQ 2.0。
作为对比,英伟达Blackwell Ultra GB300的算力为15PFLOPS(FP4),配备是的288GB HBM3e,带宽为8TB/s。
徐直军指出,“由于我们受到美国的制裁,不能到台积电去投片,我们单颗芯片的算力相比英伟达是有差距的。但是华为有三十多年联人、联机器的积累,所以我们在联接技术上强力投资、实现突破,使得我们能够做到万卡级的超节点,从而一直能够做到世界上算力最强!”
算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。徐直军认为,超节点将成为AI基础设施建设新常态。目前CloudMatrix 384超节点累计部署300+套,服务20+客户。
华为还将推出全球最强超节点Atlas 950 SuperPoD,算力规模8192卡,预计于今年四季度上市。此外新一代产品Atlas 960 SuperPoD ,算力规模15488卡,预计2027年四季度上市。
徐直军还在会上发布了全球首个通算超节点TaiShan950 SuperPoD,基于鲲鹏 950 开发,最大 16 节点(32P)、最大内存 48 TB、支持内存 / SSD / DPU 池化,计划2026年一季度上市。徐直军称,其将成为大型机、小型机终结者。
“华为愿与产业界一起继续努力,构筑起支撑我国乃至全世界AI算力需求的坚实底座。”徐直军总结说道。
编辑:芯智讯-浪客剑