Token的中文名,看起来终于定了!
今天,中国政府网转发人民日报援引自国家数据局的文章显示,我们日均词元调用量突破140万亿。
140万亿的数据量很夸张,但这条新闻背后的Token中文命名更有意思,似乎可以平息最近业界对于Token中文名的争议。

这也意味着Token的中文名被官方定为“词元”。
国家数据局发布的数据,人民日报发布,中国政府网转发,官方政府机构与官方媒体双重发布,Token中文名这就算是定下来了。
引爆这轮命名之争的,是腾讯研究院发表的文章中,学者杨斌提出的「模元」译名。一石激起千层浪,各路AI大佬在社交平台和行业群组中纷纷给出自己中意的答案。很快,「智元」这个名字浮出水面,并迅速获得广泛认同。
新加坡国立大学校长青年教授、潞晨科技创始人尤洋:
「Token中文叫做'智元',不知道'新智元'创始人是不是时空穿梭回来的。」
自由学者、原清华大学科学史系副教授胡翌霖:
「真不如'智元'。计算机的单元是字节,Token是人类智识的计算单元。Token不是通用计算的概念,是'通用智能'的概念,'智'比'通'更切中要害。」
百川智能创始人王小川:
「叫做'智元'挺好的。」
资深开源人士陈绪:
「这几天提出了各种x元,就觉得智元能打动我,符合信达雅的要求。」
由此引发的大规模讨论,也不乏一些整活儿选手。


但最终,官方拍板,就叫“词元”!
据人民网的解释,“词元”是AI理解人类语言的最小单位,token 切分出的单位有时是字,有时是词,而词更能覆盖这种范围。






京公网安备 11011402013531号