刘云:词元供给,如何“用得起”“用得好”
创始人
2026-04-09 10:07:44

智能经济新业态正加速发展,词元(Token)已成为最基础且普遍的需求。数据显示,今年3月,我国日均词元(Token)调用量已经超过140万亿,两年间增幅超过1400倍。这一爆发式增长表明,词元正从技术概念走向商业现实,成为智能时代的重要基础资源。词元经济的兴起也意味着大模型(LLM)产业化进入实质阶段,应用形态由简单问答走向以智能体为代表的复杂系统性应用。在这样的背景下,供给端的稳定性与成本问题,将是影响中小企业与个人用户使用信心的关键要素。

过去,词元主要用于聊天窗口中的“一问一答”。随着OpenClaw、LangChain等智能体开发工具的普及,构建个性化智能体的门槛显著降低。当前,企业正将大量人工流程转化为可自动执行的智能体,广泛应用于客服、制造、零售等领域,其运行依赖海量词元的输入与输出。这就使词元成为关键生产要素,嵌入各类智能系统之中。

然而,词元需求的快速增长也暴露出供给端的瓶颈。从运行机制看,智能体的高频调用对Token消耗极大,一次任务往往触发数十次甚至上百次API调用。企业在热点应用场景中往往面临Token成本快速攀升的问题。比较典型的,比如长沙一小型AI漫剧公司为了使用更便宜的闲时算力,将上班时间从中午推迟到傍晚,最后又改到凌晨3点。不同计费模式间也各有利弊。按量计费模式下,成本难以预测且波动较大,单日支出可达千元;包月方案虽能降低门槛,但普遍存在接口不稳定、限速规则不透明等问题,很容易影响应用效果,破坏用户信任。

当前词元的供给主要存在四种模式。一是头部平台API直供模式,如Qwen、GLM等,依托云端算力与自研模型提供服务。好处是接入便捷,但高峰期容易出现限流与延迟,同时也存在数据合规与技术锁定问题。二是第三方集成分销模式,在兼容性与价格上具有优势,但高度依赖上游供给,在高并发场景下稳定性存在波动。三是本地化自主生产模式,通过部署开源或自研模型实现自主可控。这种模式在数据安全与长期成本方面优势明显,但硬件投入与运维成本高,相对更适合大企业选择。四是混合供给模式,通过多源组合实现弹性调度,能有效提升灵活性,但系统复杂度与对运维的要求较高。

总体来看,稳定性与普惠性不足,是眼下词元经济发展的核心约束。业界将词元视为智能时代的“水电煤”,一些企业开始主动为员工提供免费词元,鼓励他们尝试;工业和信息化部日前也发布通知,开展普惠算力赋能中小企业发展专项行动,以降低中小企业使用算力门槛。但客观来说,当前供给这些“水电煤”的基础设施还没有完全搭建好。因此,要推动词元经济健康发展,第一步是从供给侧系统性改进。

一方面,强化词元消费模式的规范化,提升接口稳定性与计费透明度。平台需明确限速与配额规则,同时推广“卡时”“核时”及按Token计费等多元模式,提高相关数字服务消费的透明度。此外,词元供给方也应通过缓存、智能路由等技术手段减少冗余调用,帮助用户降低无效消耗,提高使用效率,探索平衡、可持续的商业模式。

另一方面,丰富供给体系并推动成本下降。具体可通过构建多元供给格局,既依托头部平台能力,也发展第三方服务,并鼓励具备条件的主体开展本地化部署。政策层面,有关部门已开始通过探索“算力银行”“算力超市”等机制,力求实现算力资源跨区域、跨周期调度,提升供给效率和利用率,降低边际成本;市场层面,则可通过持续的技术优化与规模效应,降低单位Token价格,形成多元供给与梯度定价体系。

词元供给的市场化与普惠化,让用户们从“用得上”走向“用得起、用得好”,是打通智能体应用“最后一公里”的关键。当越来越多中小企业、科研机构能以合理成本获取稳定资源,当各类主体能够选择适配自身需求的供给模式,词元经济将更好地支撑智能时代的高质量发展。(作者是清华大学智能法治研究院院长助理)

相关内容

热门资讯

周鸿祎西安交大校庆对话青年学子... 近日,西安交通大学迎来建校130周年暨西迁70周年纪念大会。360集团创始人、西安交大杰出校友周鸿祎...
35岁程序员辞职摆摊卖肉蛋堡:... 快科技4月9日消息,近日,35岁的程序员刘先生成了网络热议的焦点。 在辞去高压的软件开发工作后,他选...
刘云:词元供给,如何“用得起”... 智能经济新业态正加速发展,词元(Token)已成为最基础且普遍的需求。数据显示,今年3月,我国日均词...
AI时代不该患上“失语症” 当下,网络信息的碎片化与快节奏传播,正在推动语言不断简化,催生出了非常流行的“夯”“拉”等网络词语。...
余承东朋友圈痛批团队有些零售设... 日前,网间曝光了一张华为常务董事、产品投资评审委员会主任、终端BG董事长 @余承东 在朋友圈转发了一...