争论不休的Token中文名要定了!
国家数据局在官方公告中,提到了Token的标准中文译名——“词元”。
2024年初,中国日均词元(Token)调用量为1000亿;至2025年底,跃升至100万亿;今年3月,已突破140万亿,两年增长超千倍。
为什么叫词元?
词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。
不过鸭鸭认真想了想,Token为什么不能叫“躺元”?
Token本来就是大模型运转里的基础单位,AI每理解一句话、生成一段内容、跑一次调用,背后都离不开它。
某种程度上,它就是智能时代最基础的“干活单位”。
那问题来了,既然都已经是干活单位了,叫“躺元”怎么了?还都是T字母开头!
毕竟现在大家对AI最大的期待,是让AI多干点活,人类就能轻松点,AI越进步,人类越应该有资格“躺”一点嘛~
有什么事不能先躺下来再说?
你觉得Token还可以叫什么?
备注:
Token,简单来说,就是大模型处理文字时的“最小工作单位”。
人类看一句话,是按整体意思理解;但AI会先把内容拆成一个个小块,再逐个处理、计算和生成。这些小块,就是Token。
你可以把它理解成AI读文字、写内容时的一粒粒“信息颗粒”,也可以理解成它干活时最基础的计量单位。