阿里云第八代企业级实例g8i算力升级:整机性能提升85% AI推理最高提速7倍
央广网
2024-01-11 17:51:04
0

原标题:阿里云第八代企业级实例g8i算力升级:整机性能提升85% AI推理最高提速7倍

1月11日,全球领先的云计算厂商阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,国内首发代号Emerald Rapids的第五代英特尔至强可扩展处理器,依托阿里云自研的「飞天+CIPU」架构体系,ECS g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑高达72B参数的大语言模型,帮助中小规模模型起建成本降低50%。同时新实例还提供了端到端安全防护,为企业构建可信AI应用提供强有力的隐私增强算力支撑。

阿里云弹性计算产品线总经理张献涛表示,“阿里云ECS g8i实例的强劲表现,证明了以CPU为中心的计算体系同样具备加速AI推理的巨大潜力,公共云不仅可胜任超大规模的AI模型,也为AI应用加速落地开辟了新路径。”

英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东表示:“最新上市的第五代英特尔至强可扩展处理器每个内核均内置AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其AI训练性能提升多达29%,AI推理能力提升高达42%。我们希望借由阿里云第八代企业级实例(ECS g8i)共同助力开发者实现技术普惠,让AI技术无处不在。”

通用算力再提升,整机性能提升85%

作为企业级通用计算实例,ECS g8i实例在计算、存储、网络和安全等能力得到了全方位提升。从关键参数上看,ECS g8i实例的L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%;存储方面,ESSD云盘提供100万IOPS,全面搭载NVMe,存储延迟低至百微秒;网络方面,PPS高达3000万,标配阿里云自研eRDMA大规模加速能力,时延低至8微秒;安全方面,ECS g8i实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机TDX技术,构建了全面的安全防护。

在E2E场景下,ECS g8i实例可将MySQL性能提升最高达60%,Redis和Nginx的性能分别提升40%和24%,面向游戏、视频直播、电商、金融、医疗、企业服务等行业提供强劲的算力支持,满足其在数据库、大数据、AI推理等应用场景下对性能的严苛要求。

此外,ECS g8i实例还提供了多种硬件原生加速能力,包括QAT和IAA等加速器。阿里云通过自研技术,将硬件加速能力更细颗粒度透传至实例虚拟机,小规格的ECS g8i实例也同样具备加速能力。其中,依托于QAT原生加解密加速器,ECS g8i实例在压缩/解压缩场景下性能最大可提升70倍,加解密性能提升4倍以上。

为AI提速,可支撑72B参数的大语言模型

生成式AI掀起的技术革命,正在推动计算范式发生根本性的变化。当前,AI大模型推理在算力上依然面临诸多挑战,例如首包延迟受限于并行处理能力与浮点运算能力,吞吐性能则受限于内存带宽和网络延迟。

阿里云ECS g8i实例针对这些难题都进行了相当程度的优化,包括内置指令集从AVX512升级到了Intel AMX高级矩阵扩展加速技术,可让生成式AI更快地运行。相对于AVX512指令集,启用AMX AI加速后,ECS g8i 实例在int 8矩阵计算的性能最高提升7倍。

基于AMX AI加速能力,g8i可更迅速地响应中小规模参数模型,运行知识检索、问答系统及摘要生成等AI工作负载时,起建成本相比A10 GPU云服务器下降50%。此外,配合阿里云平台的Spot抢占式实例,成本优势将进一步凸显,进一步降低AI推理成本。

与此同时,基于自研eRDMA超低延时弹性网络,阿里云g8i实例集群拥有超低延时网络和高弹性优势,可轻松支撑72B参数级别的大语言模型分布式推理,推理性能随集群规模接近线性加速,并可支持超过32batchsize的超大参数规模的AI模型负载,运行文生图、AI生成代码、虚拟助手以及创意辅助工具等AI工作负载。

以阿里云通义千问开源的Qwen-72B大模型为例,可在g8i实例eRDMA网络构建的集群实现高效运行,在输入小于500字情况下,首包延时小于3秒,每秒可生成7个Token。

为安全加码,助力企业构建可信AI应用

安全方面,阿里云在全产品线构建了端到端的安全防护,可保障数据存储、数据传输、数据计算的全流程安全。在最底层,基于CIPU的安全架构搭载安全芯片TPM作为硬件可信根,实现服务器的可信启动,确保零篡改;虚拟化层面,支持虚拟可信能力vTPM,提供实例启动过程核心组件的校验能力;在实例可信的基础上支持不同平台的机密计算能力,实现了运行态的内存数据隔离和加密的保护。

值得一提的是,此次升级的ECS g8i实例全量支持Trust Domain Extension TDX 技术能力,业务应用无需更改,即可部署到TEE之中,极大降低了技术门槛,并以极低的性能损耗为大模型等AI应用提供隐私增强算力,护航大模型的云上数据安全。

以Qwen-Chat-7B模型为例,启用TDX后,既确保了模型推理的安全可信,也保护了数据的机密性和完整性。

“阿里云将不断深耕技术、持续产品创新,为企业提供更加稳定、强大、安全、弹性的计算服务,推动各行业的AI应用进入全量爆发时代。”张献涛表示。

相关内容

热门资讯

千方科技:双智路口解决方案涵盖... 证券之星消息,千方科技(002373)08月05日在投资者关系平台上答复投资者关心的问题。 投资者:...
北京亦庄:8月8日至13日期间... 北京经济技术开发区管理委员会关于北人亦创国际会展中心周边道路临时交通管控通告 为保障2025世界机器...
原创 俄... 国际空间站对于全人类都有着重要意义,代表人类探索太空建造在轨科研站点的水平。美国为首协同多个国家,建...
台积电2nm机密曝“内鬼”!3... 芯东西(公众号:aichip001) 编译 | ZeR0 编辑 | 漠影 芯东西8月6日消息,全球最...
阿里新模型Qwen-Image... 每经杭州8月5日电(记者叶晓丹)8月5日,阿里开源全新的文生图模型Qwen-Image,当天即登上全...
美高官在亚洲搞离间:别用中国的... 【文/观察者网 张菁娟】频繁对中国芯片和人工智能产业进行恶意打压的美国,又动起了小心思。 综合《日...
暑期焕新季性价比王者登场 荣耀... 7月28日上午10:08,荣耀平板GT2 Pro正式开启全渠道首销,国补优惠价2124.15元起,购...
电池储能系统能否解决数据中心电... 近期的能源危机加速了全球可再生能源投资,同时也暴露了其潜力与脆弱性。最紧迫的挑战是风能和太阳能等间歇...
国网济宁供电公司创新突破:无人... 近日,国网济宁供电公司在配电线路故障指示器安装领域取得了重大突破。该公司成功利用小型无人机在10千伏...
新品种迭出,新科技加持……江苏... 新品种迭出,新科技加持……“江苏制造”外贸出口产品的含“新”量不断提升。 集装箱制造企业出口正从“价...
海康机器人斩获多项专利,为行业... 近期,杭州海康机器人股份有限公司在专利领域成绩斐然,接连取得多项发明专利,彰显了其在智能制造技术研发...
高盛:AI 已开始重塑劳动力市... IT之家 8 月 6 日消息,据《商业内幕》5 日报道,人工智能正在重塑美国就业市场,年轻的科技从业...
浙江鼎港科技取得一种立式球角阀... 金融界2025年8月5日消息,国家知识产权局信息显示,浙江鼎港科技有限公司取得一项名为“一种立式球角...
星星云苹果云手机:高性价比之选... 在科技日新月异的今天,云手机技术作为一种创新解决方案,正逐步被广大用户所接受和喜爱。无论是日常应用还...
联影医疗自研光子计数CT进入临... 近日,由联影医疗自主研发的光子计数能谱CT正式入驻中山医院及瑞金医院,开启临床测试和临床医学研究。据...
宇树机器人给周杰伦伴舞?王兴兴... 文 | 源媒汇,作者 | 谢春生,编辑 | 苏淮 被指秀跳舞和拳击没有开发意义的宇树科技,用一次合...
上海巧旭高压磁力泵广泛应用 化... 来源:商媒在线 在高压液体输送系统中,密封性能与系统安全性是设备选型的核心。上海巧旭特种磁力泵有限公...
大语言推理模型效果不佳:数十亿... 尽管投入了数十亿资金,大型推理模型仍表现不佳 今年6月初,苹果公司发布了一篇具有重大影响力的论文《思...
又“上新”了!宇树科技最新发布... 宇树科技又发布新款。 新款人形机器人R1发布后不久,8月5日,宇树科技宣布发布新一代四足机器狗Uni...
木林森电子取得一种聚光SMD灯... 金融界2025年8月5日消息,国家知识产权局信息显示,吉安市木林森电子有限公司取得一项名为“一种聚光...