最近,随着人工智能应用场景不断深化,有关Token消耗与使用成本的讨论也越来越多。Token也叫词元,所谓词元,是大模型处理信息的最小信息单元,日常工作生活中每一次向AI提问、使用AI生成内容,都是在调用词元。特别是,今年以来“龙虾”等智能体的爆发,带动词元消耗量显著增长。那么,真实开销究竟如何?
“龙虾”智能体普及
深度使用成本逐步显现
记者调查发现,随着智能体产品广泛落地,日常简单交互时,成本变化并不明显;可一旦进入深度使用,Token消耗就会显著增加,相关支出也随之上升。
用户 秦先生:稍微多用一点成本就上来了,消耗Token数量会随着任务难度指数性上涨,使用成本确实有点超预期。
采访中,不少消费者告诉记者,个人用户对成本上升的感受直接;而在一些已经实现规模化部署并将AI真正应用到生产一线的企业,Token的消耗体量更为突出。
中交AI中心首席科学家 王晶:从设计、施工、养护到运营,已经开发了数千个智能体都会对大模型进行调用,日均Token消耗已经达到上百亿,相当于十万元左右的成本。
持续增长的Token消耗,也给算力系统带来不小压力。
MiniMax稀宇科技副总裁 严奕骏:每个礼拜都要进行算力扩容,算力相对来说是“紧平衡”的状态。
中国电信北京公司AI技术负责人 陈哲诗:随着大模型技术的演进,对应用层的需求拉动非常大,算力租赁量也非常大。客户对成本的担忧目前还是存在的,我们也需要去优化基础设施效率,降低Token的成本。
Token不是流量
成本逻辑不一样
为什么越深度使用,花费越明显?很多人习惯把Token和手机流量放在一起比较,其实两者的计费逻辑并不一样。
手机流量主要用于数据传输,购买后按使用量扣除,缓存内容还能重复使用,消耗相对清晰可控。
Token是AI处理信息的基本计量单位,用户不仅需要占用模型空间、选择服务套餐,每执行一条指令、完成一项任务,都会实时产生消耗。如果需要扩展功能、开放更多权限,还会带来额外支出。
成本居高不下
Token降价之路如何走?
AI用得越深,Token花费越高,这让不少普通用户和中小企业倍感压力。即便对大型企业而言,这也是一笔不容忽视的开支。早年手机流量资费曾一路下降,那么Token的成本未来能不能降、又该如何降呢?
采访中,业内专家告诉记者,Token成本具备下降空间,也必然会逐步下降。当前成本偏高,主要是行业仍处在发展初期,高端算力硬件成本较高、资源利用不充分等多重因素叠加。随着技术不断成熟、算力供给持续优化,单位Token的使用成本将会逐步走低。
中国信息通信研究院云计算与数字化研究所云计算部主任 马飞:随着算力技术越来越成熟,单位Token成本会越来越低,需求爆发也会倒逼产业加速技术迭代、扩大供给、提升使用效率。
在记者走访的多家企业中可以看到,不少企业正通过优化模型结构、提升运行效率等方式缓解成本压力。与此同时,也有企业加快算力扩容,积极与更多硬件厂商开展适配,拓宽算力供给渠道。
月之暗面Kimi企业业务负责人 黄震昕:努力把我们的模型效率做提升,通过底层模型架构的创新,来达到Token成本下降。
阶跃星辰首席技术官 朱亦博:我们现在对模型关注的一个指标叫“智价比”,也就是说模型达到一定智力,成本越低越好。
在Token的全流程使用中,云端部署、云上存储和统一调度同样至关重要。不少云服务机构也在通过优化资源配置、提升调度效率,来降低使用成本、提升服务稳定性。
天翼云智算平台事业部产品专家 王曼:模型的效果、成本、性能以及安全各个方面都是用户非常关心的。结合我们的算电协同、算网融合调度优势,我们在持续降低Token的成本。
着眼长远布局
算力一体促普惠
要让人工智能真正用得起、用得长久,还需要从长远层面系统谋划。目前,国家正大力推进算力一体化布局,为AI产业实现普惠可持续发展提供支撑。
不久前,中国信息通信研究院发布的《算力互联网体系架构研究报告》显示,我国算力基础设施需求正持续增长。针对Token经济,相关专家组也已启动多个专题研究。
中国信息通信研究院云计算与数字化研究所副所长 栗蔚:Token已经成为AI产业的重要度量衡,Token的消耗总量体现了智能体等创新AI应用的运用深度和广度,Token成本则体现了算法算力的效率。
一边是算力需求持续攀升,另一边从中央到地方,一系列支持政策也在密集出台落地。
总台央视记者 张丛婧:今年以来出台的算力相关政策,从建设国家算力互联互通节点,到各地发放算力券、建设算力枢纽等,尤其是今年政府工作报告首次把算电协同纳入国家新基建。可以看到,各地都在推动算力互联互通、绿色发展与场景落地。
统计数据显示,截至2025年12月,我国智能算力总规模位居全球第二,全国算力供需比总体合理,但在高端算力、核心算法方面仍存在一定外部依赖。当前,国家正加快推进全国一体化算力网络布局,通过统一调度、优化资源配置,让算力服务更加普惠。
中国信息通信研究院云计算与数字化研究所副所长 栗蔚:依托国家算力互联网服务节点,加快推动区域和行业节点建设,构建形成具备智能感知、实时发现、随需获取的算力互联一张网。
与此同时,我国也在加快发展轻量化、低功耗、高性价比的本土大模型,让更多普通用户能用得上、用得起、用得长久。
中国信息通信研究院云计算与数字化研究所副所长 栗蔚:要想让Token成为普惠公共服务,要构建优质高效的算法,持续推进模型优化,降低单Token算力消耗,搭建随时随地、随需接入的算力节点,让AI服务触达更多用户。
Token降本增效
让用户用得起 不心疼
AI好用不假,可Token花钱快的问题也着实让人头疼。说到底,成本能不能降下来,既要靠国家把算力这盘大棋统筹好,也需要企业在技术上多精打细算。
让用户用得起、不心疼,AI才算是真正走进了普通人的生活。
责编:王时丹 | 审核:李震 | 监审:古筝
(来源:央视新闻客户端)