Uber 到 4 月就用完了 2026 年 AI coding 预算。Microsoft 给部分开发者开了 Claude Code,几个月后又撤回许可。Priceline 一名员工告诉 TechCrunch,Cursor 正常续约报价涨了 4 到 5 倍。

这几件事放在一起看,信号很直白:企业不是不想用 AI 了,而是开始问账了。

过去一年,很多团队的默认动作是“上最好模型,先跑起来”。现在 CFO 和 IT 财务开始敲门:这些 token 花在哪?产出了什么?谁批准?有没有上限?

账单先炸,热情还在

几个硬事实先摆出来。

公司 / 组织发生了什么更像说明什么
Uber4 月用完 2026 年 AI coding 预算使用强度超过原预算设计
Microsoft撤销部分开发者 Claude Code 许可大厂内部也在控制 AI 工具成本
PricelineCursor 续约报价上涨 4-5 倍订阅红利期过去,采购压力上来
Jellyfish高 token 用户约 2 倍生产力,却消耗 10 倍 tokenROI 不是线性增长
Linux Foundation准备推出 Tokenomics Foundationtoken 成本治理开始标准化

最反常的一点是:单个 token 的价格在下降,总账单却还在往上走。

原因不复杂。代理式 AI 不只是回答一次问题。它会拆任务、调模型、写代码、检查、重试。一次看似普通的开发请求,背后可能滚出很多轮调用。

再加上上下文变长、多模型调用、员工没有限额,成本就像没关紧的水管。单价便宜了,总量照样能把账单冲高。

这不是“AI 编程工具没用”。材料能支撑的判断更克制:AI 工具确实可能提高产出,但重度使用的边际收益没那么清楚,成本口径也没跟上。

Jellyfish 的数据就是一个提醒:高 token 用户大约有 2 倍生产力,却消耗 10 倍 token。管理层最头疼的不是花钱,而是不知道这 10 倍消耗里,哪些是效率,哪些是浪费。

受影响最大的,是开发负责人和 IT 财务

这轮收紧,最先打到企业开发团队。

开发负责人接下来会被迫做几件事:给个人或团队设 token 限额;把模型分级;高价模型走审批;默认任务用便宜模型;对 agent 的自动调用设边界。

这会改变开发者的日常工具选择。以前是“能用最强就用最强”。以后更可能是“日常补全用低成本模型,复杂重构再开高阶模型”。

对 CFO 和 IT 财务来说,AI 支出会从创新预算变成可审计项目。采购不会只问 seat 数,还会问 token 用量、调用链路、任务类型、产出指标。

一个现实动作是:部分企业会延后续约,或者缩小授权范围。不是因为不用了,而是要先弄清楚谁在用、怎么用、用完之后有没有产出。

对关注 AI 商业化的人,这也是一个分水岭。模型供应商不能只卖“更强”。企业买单时会追问“够不够用、能不能控、能不能解释账单”。

这对一批新公司反而是机会。Pay-i、Paid、Jellyfish、Faros AI,以及 Ramp、Datadog、New Relic 这类更靠近财务和观测的玩家,都会往管账、审计、监控、路由这一层挤。

钱不会消失,只会换入口。

token 正在变成新的云账单

Linux Foundation 准备推出 Tokenomics Foundation,目标是给 AI token 成本、计量、审计建立标准。它想做的事,接近云成本领域的 FinOps。

这一步不性感,但很关键。

从电信账单到云账单,再到 token 账单,技术扩张常常这么走:先抢速度,再补治理。铁路、电力、云计算都经历过这一轮。新东西一旦进了企业,最后总要回到采购单和损益表。

“天下熙熙,皆为利来。”放在这里不是感慨人性,而是提醒一件事:AI 再新,也逃不开企业成本纪律。

我更在意的是路由层。

以后企业未必每次都调用最强模型。系统会自动判断:这个任务用高阶模型,那个任务用中档模型,简单请求直接走便宜模型。AI 采购会从“买一个最强能力”,变成“买一套能力组合”。

模型看着更强,产品反而更需要精算。

这里也有边界。Tokenomics Foundation 还没有正式发布,首批成果也在后面。标准不是灭火器,救不了已经超预算的团队。

眼下更现实的做法只有三件事:设限额,分模型,看产出。

更具体一点:

要做的事解决什么问题现实限制
设 token 限额防止个人或 agent 无上限消耗可能压住高价值探索
做模型分级避免所有任务都跑最贵模型需要维护任务规则和路由策略
记录任务与产出把成本映射到代码、工单、交付ROI 仍然难完全量化
审查续约报价防止订阅价格突然抬升短期会增加采购和管理摩擦

Jellyfish 的判断也很实在:ROI 往往来自“广泛、适度”的采用,而不是少数人无限制燃烧 token。

这句话对开发负责人尤其有用。与其让少数重度用户一路开到最贵模型,不如让更多开发者在明确边界内稳定使用。企业要的不是炫技,是可复制的效率。

接下来最该观察四件事。

一是 Cursor、Claude Code 这类工具的续约价格会不会继续上调。二是企业会不会从全员授权转向按团队、按任务授权。三是模型路由和成本观测能不能进入开发工具链默认层。四是 Tokenomics Foundation 这类标准能不能给出可落地的计量口径。

别把这件事看成 AI 降温。Goldman Sachs 还预计全球 token 使用量到 2030 年会增长 24 倍。需求还在,账单也会更大。

真正变了的是企业心态。过去问“强不强”,现在问“值不值、控不控得住”。

一个工程师一个月花 4 万美元 token,也许是天才效率,也许是预算黑洞。没有计量体系,管理层连该奖励还是该叫停都不知道。

AI 进入企业的成人礼,不是发布会上多一个更强模型。是采购部和财务部坐上牌桌,然后要求每一次调用都能被解释。

企业不是怕 AI 贵。企业怕贵得说不清。说不清,就迟早会被关阀门。