2026年5月,业界热议的Token(词元)开始被放进“话费账单”。中国移动中国联通中国电信三大运营商相继推出Token套餐产品。过去我们买通话时长、短信包、流量包;现在,运营商开始售卖Token,说明AI算力正在被包装成一种可购买、可计量、可结算的基础资源。AI时代的“流量包”来了。

  对企业来说,这意味着AI不再只是一个新工具,而是一个持续消耗预算的新账本。企业用AI写文案、生成合同摘要、回复客户、辅助写代码、运行Agent,背后都在消耗Token。过去企业管理软件,主要看账号、席位、服务器和云资源;现在,一个智能应用的真实成本,还取决于输入有多长、输出有多少、是否调用搜索、是否使用长上下文、是否启用自动化Agent。

  因此,企业不能只问“哪个模型更聪明”,还要追问:这些Token花在哪里?产生了什么价值?有没有被浪费?又带来了哪些新的风险?

  一、AI正在改变企业成本结构

  企业早期使用AI,往往带着工具思维。哪个模型效果好,就接入哪个;哪个部门需求强,就先给哪个部门试点;哪个员工会写Prompt,就让他多用一点。这种方式适合探索,却很难支撑规模化应用。

  当AI嵌入业务流程后,Token消耗就会从偶发成本变成持续成本。客服系统每一次自动回复,销售系统每一次生成客户画像,研发系统每一次写代码、跑测试、生成说明,也在消耗Token。尤其是Agent兴起之后,用户只看到一个任务完成,后台可能已经经历了多轮规划、检索、调用工具、反思和修正。

  这给企业提出了一个新的管理命题:AI不能只靠热情驱动,也不能只靠技术部门兜底。企业必须像管理现金流、库存、工时和云资源一样管理Token。

  Token管理的第一步,是让消耗可见。企业至少要知道:哪个部门用了多少Token,哪个应用消耗最多,哪个模型最贵,哪些任务反复重试,哪些Prompt导致输出冗长,哪些Agent存在异常循环。没有可见化,Token账单就会变成新的“黑箱成本”。

  不过,“可见”只是开始。真正的Token管理,要从“看账单”走向“算经营账”。一个部门用了1亿Token,不能简单判断它浪费或高效。关键要看这些Token带来了什么:客服转人工率是否下降,研发交付周期是否缩短,营销转化率是否提高,法务审查效率是否改善,员工是否从重复劳动中释放出来。Token本身只是消耗单位,管理者要把它转换成业务价值指标。

  这也是为什么企业不能简单把AI成本视为“又一笔软件费用”。传统SaaS通常按账号或模块收费,费用相对稳定。而AI的成本更像水电气,也像云计算。员工越依赖,系统越自动化,调用越频繁,费用越容易从小额试用变成持续开支。特别是在智能客服、代码助手、企业知识库、自动化营销、数据分析等场景中,AI一旦进入日常流程,就会形成稳定的Token消耗。

  二、企业Token管理的三重陷阱

  Token管理容易遇到的第一重陷阱,是“单次便宜,总量失控”。

  按Token计费有一个特点:单次调用成本看起来很低。正因为便宜,企业容易放松管理。但规模化之后,调用次数会迅速放大。AI越好用,员工越愿意用;系统越智能,后台越会自动调用;Agent越主动,Token消耗越难被人直观看见。

  最近一个极端案例很能说明问题。OpenClaw创始人Peter Steinberger披露,其仅有3人的团队在云端运行了约100个Codex实例,30天内产生了约130万美元的 OpenAI API账单,涉及约6030亿个Token 和760万次请求。这个案例提醒管理者:当 AI 代理开始自动执行任务,Token 消耗会从“人发起的一次请求”变成“系统后台连续运行的成本”。

  Token管理容易遇到的第二重陷阱,是“账单清楚,价值模糊”。

  企业可能很快建起Token看板,却很难回答一个更重要的问题:这些Token到底值不值?一个月消耗10亿Token,看起来AI应用很活跃,但这可能意味着业务效率提升,也可能意味着大量低质量生成、重复调用和无效输出。

  因此,Token管理不能停留在财务账上。它还要进入业务指标。客服场景要看单位会话成本、一次解决率、客户满意度和转人工率;研发场景要看代码通过率、缺陷率、交付周期和开发者返工时间;营销场景要看内容生产效率、转化率和品牌一致性。没有业务指标,Token管理很容易变成“为了省钱而省钱”。

  Token管理容易遇到的第三重陷阱,是“生成便宜,验证昂贵”。

  AI生成文本、代码、方案和分析报告的速度很快,但企业不能忘记后续验证。越是专业场景,验证成本越高。AI写出一段客服回复,可能只需要简单检查;AI生成一份法律意见、投资分析或安全配置建议,就必须有专业人员复核。

  这可以称为AI时代的“验证税”。生成式AI降低了产出门槛,也增加了组织内部的审核压力。企业如果只计算Token账单,不计算复核、返工、纠错和责任承担成本,就会低估AI应用的真实成本。

  三、企业需要一套Token治理体系

  很多企业把Token管理交给技术团队,认为这主要是工程问题:优化Prompt、做缓存、换模型、限速、限额。技术优化当然必要,但它无法独自解决Token管理的问题。

  Token消耗来自业务流程。客服为什么要反复调用模型?可能是知识库质量不高。销售为什么生成大量无效客户分析?可能是CRM数据不完整。研发为什么让AI读一整个代码库?可能是代码结构混乱、文档缺失。

  也就是说,Token浪费常常暴露的是组织问题,而非模型问题。企业要降低Token消耗,不能只盯着模型价格,还要改善知识管理、流程设计、数据治理和权限体系。

  一个成熟的Token管理体系,首先要有预算管理。企业需要给部门、项目和应用设置Token预算,但预算不能“撒胡椒面”。核心业务、高价值场景、增长型项目,可以获得更高额度;低价值、重复性、探索性场景,应有更严格限制。预算也不能只看历史用量,还要看业务目标。一个帮助研发缩短交付周期的AI工具,哪怕Token消耗较高,也可能值得投入;一个每天生成大量低质量营销文案的工具,即使单价便宜,也可能应该收缩。

  其次,要建立模型路由。不应让所有任务都调用最强模型。摘要、分类、格式转换可以交给低成本模型;复杂分析、代码生成、专业判断则使用更强模型;敏感数据处理可能需要私有化或本地模型。未来企业AI运营的重要能力,不是选出一个“万能模型”,而是在不同业务场景中配置合适的模型组合。

  再次,要建立权限控制。不是每个员工都需要调用高价模型,也不是每个Agent都应该访问核心系统。企业要把Token权限、数据权限、系统权限和岗位职责绑定起来。尤其在Agent场景中,要限制循环次数、工具调用范围、单次任务上限和自动执行权限。

  最后,Token管理必须进入绩效评估。每月不仅要看总账单,还要看单位业务产出的Token成本。哪些场景真正提升效率,哪些应用应该扩大,哪些应用应该优化,哪些应用应该关停。一个AI项目不能只证明“大家都在用”,还要证明“使用之后业务更好了”。

  长远来看,企业最终要从Token管理走向Token治理。管理解决的是用了多少、花了多少、怎么省的问题,治理解决的是谁能用、怎么用、为何用、谁负责的问题。这些问题已经超出了技术和财务部门的范围,需要业务、法务、安全、合规、人力和高管层共同参与。

  Token正在连接成本、数据、安全、责任和组织能力。它不再只是API账单上的数字,而是企业智能化程度的基础指标之一。这听起来像一个技术问题,其本质却是公司治理问题。因为Token背后真正需要被管理的,是企业如何分配智能资源、如何重组知识劳动、如何控制新型成本、如何避免平台依赖,以及如何把AI能力沉淀为长期竞争力。

  一句话说,Token管理不是为了让企业少用AI,而是让企业更聪明地使用AI。智能时代,真正优秀的企业不会只问“这个模型多少钱”,还会追问:“这些Token,究竟为我们创造了什么?”

  (作者王翔为复旦大学数字与移动治理实验室研究员)

  来源:王翔

责任编辑:江钰涵

华体育app官网入口,开云下载,

hth.com相关资讯:开云登录,