让词元更有质量

——推动词元经济高质量发展

编者按词元(Token)正成为人工智能服务的核心计量、结算与统计单位。当前,词元经济呈现爆发式增长态势,各类应用场景层出不穷,但“有流量、无质量”“有消耗、难评价”等问题日益凸显:词元消耗量难以反映AI服务真实价值、定价机制混乱、高质量供给缺乏有效激励。

近日,国家数据局召开词元经济座谈会,明确将词元经济纳入工作体系,释放出推动行业从规模扩张转向高质量发展的强烈信号。中国经济时报社等机构的专家学者和部分知名企业代表应邀参会发言。本期《智荟月刊》以“让词元更有质量——推动词元经济高质量发展”为主题,特别邀请四位与会专家,围绕词元经济健康发展的核心议题展开深入研讨,并从政策、技术、经济与治理等维度带来前沿思考与务实建议,以飨读者。

■崔向雨

当前,人工智能正从模型驱动迈向数据—模型—应用协同演进的新阶段,词元(Token)作为智能交互最小单元与价值结算载体,正重塑AI产业价值分配逻辑与商业模式。作为深耕高质量数据集建设、数据标注服务的市场主体,海天瑞声深度参与词元经济生态构建,结合产业实践,就词元经济发展趋势、数据标注企业参与词元经济的路径提出以下思考。

词元规模化催生数据价值重估

大模型与智能体(AI Agent)的规模化应用,带动词元调用量指数级增长。国家数据局数据显示,2026年3月中国日均词元调用量已突破140万亿,两年增长超千倍。数据服务行业随之进入高速发展期。以海天瑞声为例,2025年全年营收3.77亿元(同比+59.00%),归母净利润1411.85万元(同比+24.54%);2026年第一季度营收9677.93万元(同比+38.63%),归母净利润840.30万元(同比+2161.14%)。值得注意的是,国内收入已超越海外,反映出我国AI产业链自主供给能力的持续增强。

词元经济带来三大深刻变革:其一,定价逻辑迁移。数据服务从按人工工时、数据条数计价,正逐步向按词元质量、模型效果、场景价值定价扩展。其二,商业闭环初现。词元调用量的持续增长验证了“数据加工—模型训练—推理服务”的商业可行性,但正向循环仍需高质量数据持续反哺。其三,产业位势提升。数据已从模型训练的辅助成本,升级为决定词元信息密度、推理可靠性与应用安全性的核心资源。

高质量数据集是词元经济的价值根基与定价锚点

词元经济的本质是可计量、可定价、可交易的智能服务规模化。国家数据局将推动词元经济发展纳入工作体系,以行业高质量数据集建设和全国一体化算力网建设为着力点。在词元经济的生产链条中,数据标注环节发挥基础性作用。

(一)高质量数据集是词元价值的“核心锚点”

词元价值并非简单由“数量×模型版本”决定,而是深度依赖数据采集、汇聚、清洗、标注、质检、对齐全流程专业投入。高质量数据集赋予词元准确性、知识性、逻辑性与场景适配性,直接决定模型推理效果、应用可靠性与商业价值,是词元价值评估的核心锚点。

(二)数据工厂是词元供给的“源头活水”

数据工厂提供持续、稳定、合规、多模态的高质量数据,支撑模型预训练、指令微调、强化学习、测评验证全生命周期,是词元规模化生成与稳定供给的基础设施。打造“数据加工—流通利用—模型训练”应用于一体的数据赋能工场,提升高效、专业的高质量数据供给能力,产出高价值词元。

(三)数据标注是词元经济的“筑基工程”

数据标注将行业知识、逻辑规则、人类经验注入数据,是提升数据集知识密度与模型理解能力的关键环节。面向专业领域的专家型标注、人机协同标注,直接决定垂直场景词元的可用性与竞争力,是数据要素价值化的核心抓手。

完善顶层设计,推动词元经济高质量发展

面向词元经济规模化、规范化、普惠化发展,结合数据产业实践,提出三方面政策建议。

(一)加快统一词元经济标准规范,夯实制度底座

当前词元经济在概念界定、分类认定、计量口径、定价机制、合规流程等方面尚未形成统一标准,企业实践缺乏清晰指引。建议加快构建覆盖词元定义、质量分级、定价规则、交易机制、安全合规的标准体系,形成行业共识,降低制度性交易成本,引导产业有序发展。

(二)以高质量数据集为锚,健全词元价值评估体系

词元价值评估应充分体现数据全流程价值贡献,改变“重算力、轻数据”“重模型、轻底座”的倾向。建议将高质量数据集价值认定纳入词元价值评估核心维度,建立“数据质量—模型效果—词元价值”联动评估机制,让数据价值在词元经济中得到合理体现与回报。

(三)统筹数据加工与算力布局,协同提升产业效能

算力是词元经济“动力”供给的“能量厂”,数据标注是词元经济“原料”供给的“精炼厂”,二者必须协同布局。建议在全国一体化算力网建设中,同步强化数据加工能力布局,支持数据标注、数据合成、质量测评、安全治理等环节能力提升,避免仅关注算力输出而忽视数据底座建设,形成“数据精炼—模型训练—词元生成—场景应用”全链条高效协同。

数据标注企业融入词元经济的三大方向

作为数据服务企业,海天瑞声将以三大举措深度融入词元生态,助力产业高质量发展。

一是做强数据标注核心能力。推进标注模式从人工为主向模型预标注+人工校准、人工标注+模型检验升级,发展专家型标注服务,建立行业专家参与机制,提升高知识密度、高专业性数据集供给能力,夯实词元经济产业根基。

二是扩大高质量数据集供给。聚焦人工智能重点领域与未来产业,体系化建设多模态、场景化、AI-Ready高质量数据集,推动公共数据与产业数据融合应用,强化链主协同与上下游联动,为词元生成提供持续优质“原料”。

三是构建价值共生新生态。积极探索数据要与词元价值联动机制,推动形成模型能力提升—规模扩大—价值释放—反哺高质量数据的良性循环,培育“为高质量数据付费”的市场共识,避免成本层层传导挤压数据环节利润,实现数据产业与词元经济可持续发展。

同时,支持地方依托数据资源、算力资源与产业基础,打造词元经济融合发展示范区,推动词元能力与地方产业升级、专利转化、实体经济深度结合,释放数据要素与词元经济叠加效应。

结语

词元经济是智能经济的核心形态,更是数据要素价值化的关键载体。高质量数据集作为词元经济的根基与锚点,决定产业发展高度、安全底线与价值空间。唯有坚持标准引领、质量优先、数据筑基、生态协同,才能推动词元经济行稳致远,为我国人工智能产业高质量发展、新质生产力培育与数字中国建设提供坚实支撑。

(作者系北京海天瑞声科技股份有限公司副总裁、政企事业部总经理)

leyu,rb88走地皇,

leyu乐鱼最新版下载安装相关资讯:rb88下载,