国家数据局近日通过《人民日报》发布消息,确认大模型基础计量单位“Token”的官方中文名称为“词元”。报道显示,我国人工智能行业日均词元调用量已超过140万亿次。本次命名结束了学术界与产业界长期存在的译名争议,标志着国家层面在人工智能基础术语和技术标准上的进一步统一。官方解释指出,“词元”是AI理解语言的最小处理单位,介于字与词之间,有助于更精准地表达语义结构。统一的术语标准预计将降低行业沟通成本,并为人工智能基础设施建设和相关政策制定提供数据支撑。
国家数据局近日通过《人民日报》发布消息,确认大模型基础计量单位“Token”的官方中文名称为“词元”。报道显示,我国人工智能行业日均词元调用量已超过140万亿次。本次命名结束了学术界与产业界长期存在的译名争议,标志着国家层面在人工智能基础术语和技术标准上的进一步统一。官方解释指出,“词元”是AI理解语言的最小处理单位,介于字与词之间,有助于更精准地表达语义结构。统一的术语标准预计将降低行业沟通成本,并为人工智能基础设施建设和相关政策制定提供数据支撑。