高通推出AI200与AI250芯片:为数据中心AI推理带来机架级性能与能效提升
创始人
2025-10-29 13:01:28

高通公司近日正式发布针对数据中心领域的全新AI推理加速方案,该方案基于Qualcomm AI200与AI250芯片组构建,涵盖加速卡及机架级系统产品。通过优化总体拥有成本(TCO),该系列解决方案可为高算力数据中心提供机架级生成式AI推理性能,同时配备大容量内存支持复杂模型运行。

作为机架级AI推理专用产品,Qualcomm AI200加速卡单卡配置768GB LPDDR内存,在保持低TCO优势的同时,为大型语言模型(LLM)和多模态模型(LMM)提供优化的推理性能。其内存架构设计兼顾高扩展性与成本效益,支持数据中心灵活部署不同规模的AI工作负载。

更值得关注的是Qualcomm AI250机架系统,该产品首次采用近存计算(Near-Memory Computing)内存架构。通过将计算单元与存储单元深度整合,系统有效内存带宽实现超10倍提升,同时功耗显著降低。这种创新架构支持解耦式AI推理模式,可动态分配硬件资源,在满足性能需求的同时控制运营成本。

两款产品均配备先进的散热与扩展设计:支持直接液冷技术提升能效比,提供PCIe纵向扩展和以太网横向扩展能力,并内置机密计算模块保障数据安全。整机架设计功耗控制在160千瓦,兼顾高性能与节能需求。

根据技术路线图,Qualcomm AI200将于2026年进入商用阶段,AI250则计划在2027年推向市场。这两款产品的推出,预计将推动数据中心AI推理领域实现技术架构与商业模式的双重突破。

相关内容

热门资讯

中冶赛迪申请高温煤气碳迁移在线... 国家知识产权局信息显示,中冶赛迪工程技术股份有限公司申请一项名为“基于氩气内标的高温煤气碳迁移在线定...
和讯投顾陆顺姣:25年最后一天... 2026年作为十五五规划的开局之年,政策面已经定调A股,元旦后的投资主线也越来越清晰,核心就是围绕新...
中国移动申请计算任务的分配方法... 国家知识产权局信息显示,中国移动通信集团设计院有限公司、中国移动通信集团有限公司申请一项名为“计算任...
壁仞科技申请算子执行方法专利,... 国家知识产权局信息显示,上海壁仞科技股份有限公司申请一项名为“算子的执行方法、装置、设备、存储介质及...
“AI+核技术”上新 海南自贸... 自12月18日海南自由贸易港启动全岛封关运作以来,近半个月来,海南自由贸易港跨境人流量和物流量大幅增...