智谱发布Agent大模型 使用价格再降
创始人
2025-07-30 17:01:53
0

《科创板日报》7月30日讯(记者 李明明)近日,智谱带来新一代旗舰模型GLM-4.5。这是专为智能体应用打造的基础模型,Hugging Face与ModelScope平台同步开源,模型权重遵循MIT License。

据悉,GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿。

GLM-4.5在包含推理、代码、智能体的综合能力达到开源SOTA。智谱方面有关人士对《科创板日报》记者表示,衡量 AGI的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,“GLM-4.5 是对此理念的首次完整呈现。GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。”

关于GLM-4.5的真实效果,《科创板日报》记者进行了实测,发现其能够胜任全栈开发任务,可一次性生成15页PPT、并可编写较为复杂的应用、游戏、交互网页。不管是对需求的理解精准度,还是最终输出内容的完成度,都较为出色。

同时,也有业内人士告诉《科创板日报》记者,在已公布的 “原生智能体” 或Agent专用模型中,GLM-4.5目前价格最低,这一低价策略将对市场产生一定冲击,可能会促使其他厂商做出一定的调整以保持竞争力。

实测GLM-4.5

首先,《科创板日报》记者进入Z.ai,让GLM-4.5生成一份2025年世界人工智能大会(WAIC)简报,十几分钟过后,GLM-4.5生成了一份15页包含12项内容的简报,内容翔实丰富,包括大会概述、大模型展区、人形机器人展区、重要发布与成果、未来展望等。

据介绍,GLM-4.5 在制作PPT过程中会自主搜索资料、寻找配图,根据材料以HTML形式编写图文,使信息更准确、排版更灵活。除了16:9的PPT,也可以制作长图、小红书、社交媒体封面或简历等多比例图片。

接着,《科创板日报》记者为测试其PPT制作能力,又输入了一条以“人工智能未来”为主题制作PPT的要求,GLM-4.5依然完成得较为流畅。

智谱方面有关人士对《科创板日报》记者介绍, GLM-4.5有两种模式:用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。

在智能体任务基准测试中,GLM -4.5拿下了媲美Claude 4 Sonnet的成绩,GLM-4.5系列能够胜任全栈开发任务,编写较为复杂的应用、游戏、交互网页。这得益于模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。

《科创板日报》记者据此也升级了实测要求,让GLM-4.5做一个“能发弹幕的B站”,提示词如是:开发一个包含UI的bilibili网页端Demo,页面包括首页与视频详情页,首页需还原bilibili首页的主要设计元素,如顶部导航栏、横幅轮播、推荐视频瀑布流布局、hover时播放预览、视频封面与标题展示等基础交互;无需支持真实播放,仅需模拟播放行为与基础交互;整体风格参考bilibili现有布局,适配PC浏览器展示。

很快,GLM-4.5按照提示词做出一个以假乱真的B站。

智谱方面表示,为综合衡量模型的通用能力,选择了最具有代表性的12个评测基准,包括MMLU Pro、AIME 24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3 和BrowseComp等。根据最后的综合平均分,GLM-4.5取得了全球模型第三、国产模型第一,开源模型第一。

大模型厂商价格战来临?

在参数量上来看,GLM-4.5参数量为DeepSeek-R1的1/2,但在多项标准基准测试中表现得更为突出,这得益于GLM模型的更高参数效率。

据智谱方面介绍,在性能优化之外,GLM-4.5系列在成本和效率上实现突破,由此带来远低于主流模型定价:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。

同时,高速版本实测生成速度最高可至100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。

基于2025-07-29官方最新报价(单位为元/百万tokens),《科创板日报》记者对比了GLM-4.5与当前主流“原生智能体”或 Agent 大模型的公开API价格。

在输入成本上,GLM-4.5最低,为DeepSeek-R1的80%,约为GPT-4的 1/12;

输出成本上,GLM-4.5亦最低,约为DeepSeek-R1的1/8, GPT-4的1/15;

在已公布的 “原生智能体” 或Agent专用模型中,GLM-4.5目前价格最低,且开源可商用 。

那么,GLM-4.5的定价策略是否会引发国产大模型领域的新一轮价格战?

北京计算机学会AI专委会秘书长、北大人工智能博士张有鱼告诉《科创板日报》记者,智谱AI的GLM-4.5输入价为0.8元 / 百万 tokens,输出价为2元 / 百万tokens。 这一价格在国产大模型中处于较低水平,其低价策略将对市场产生一定冲击,可能会促使其他厂商做出一定的调整以保持竞争力。

“价格战对开发者和企业也会产生一定利好,价格战使得大模型的使用成本大幅降低,更多企业和开发者能够负担得起新技术,从而催生了大量使用量。这不仅能加速技术突破,也能让大模型在各行各业快速渗透,铺开商业化布局。”

并且,价格在对行业发展将有一定推动作用,价格战促使企业更加注重技术优化和成本控制,推动了大模型技术的进一步发展。同时,低价格也吸引了更多企业和开发者进入市场,促进了大模型的应用落地。但由于目前整体市场价格也已经比较低,市场主要关注度不在价格方面,所以大规模的价格战不太可能会发生。

张有鱼进一步表示,价格战也对企业的盈利能力提出了挑战,各厂商需要在降低成本的同时,不断提升技术和服务质量,以保持竞争力。

(科创板日报记者 李明明)

相关内容

热门资讯

Qt框架现已支持华为鸿蒙Har... IT之家 7 月 31 日消息,Qt 框架今日官宣,正式支持华为 HarmonyOS(鸿蒙操作系统)...
原创 三... 近日有开发者在One UI 8系统代码中发现,即将于2026年上半年发布的Galaxy S26系列将...
台风过后菜价基本稳定,小菜场里... 随着今年第8号台风“竹节草”远离上海,今天上午阳光重返申城。早上8时许,记者来到杨浦区的双辽菜市场,...
我国成功发射巴基斯坦遥感卫星0... 7月31日10时00分,我国在西昌卫星发射中心使用快舟一号甲运载火箭,成功将巴基斯坦遥感卫星01星发...
黑龙江省首个分布式光伏配储项目... 7月23日,黑龙江省首个“分布式光伏+储能“一体化应用项目--国家电力投资集团黑龙江能源服务有限公司...
浦发银行加速推进大模型应用体系... 在数字经济浪潮下,人工智能正成为重塑金融行业的核心力量,而银行业凭借在资金、数据、场景和人才等方面的...
越兴铜业取得铜杆电阻测量装置专... 金融界2025年7月30日消息,国家知识产权局信息显示,江西省越兴铜业有限公司取得一项名为“一种铜杆...
原创 手... 有些用户换新机只考虑旗舰,也有些用户对性能不太在意,也不需要太贵,因为现在的手机性能早已经过剩,哪怕...
蚊子之恶,被长期忽视 文|侯恬 编辑|杨旭然 要说今年夏天最有存在感的东西,恐怕就是蚊子。 无论是城市高楼、地铁口外的绿化...
序轮科技:以创新之力突破垄断 ... 在镇江经开区丁岗镇中新智地(镇江)智能制造产业园,江苏序轮科技有限公司高洁净生产车间里,自动化的涂布...
智能驾驶最大的障碍,不是懂车帝 一个汽车媒体平台的测评,在网上引发了热议。 7月23日,懂车帝与央视新闻联合开展的智驾碰撞测试公布结...
5G-A再传新消息,加个“A”... 7月30日,国家互联网信息办公室发布《国家信息化发展报告(2024年)》。《报告》中提出,新一代通信...
国内首台高海拔植物油配电变压器... 青海新闻网·江源新闻客户端讯 7月29日,国内首台适用于海拔2200米以上地区的10千伏植物油变压器...
用友BIP人力五大智能体发布,... 实时见证用友BIP的每一次升级与迭代,7月17日,《用友BIP发布时刻》第13期上线,重磅发布“用友...
报道:OpenAI收入翻番,年... OpenAI收入增长超预期,用户规模持续扩张。 7月31日,据The Information报道,O...
开拓工业智能化转型广阔空间 数据显示,今年上半年,规模以上数字产品制造业增加值同比增长9.9%,智能设备制造、电子元器件及设备制...
中国首个具备整轨互联能力的太空... 7 月 31 日消息,7 月 25 日,计算卫星研制和入轨组网试验服务交付评审会在之江实验室举行。会...
Arcee推出企业级可定制AI... 专注于为商业和企业用途开发小型AI模型的初创公司Arcee.ai,现已开放其AFM-4.5B模型供小...
老黄又又又把中国车企坑了,还是... 兄弟们,最近国内车企可是被英伟达坑惨了啊。 这个英伟达的“大一统”智驾芯片 —— Thor,又又又跳...
1.7秒让老照片拥有8K画质!... 如何把一张老照片修复得又快又好呢?7月28日,中国科学院深圳先进技术研究院发布了一项名为HYPIR的...