一个反直觉的事实正在困扰越来越多的企业技术负责人:大模型API的价格明明在暴跌,公司的AI支出反而越来越高了。
这不是个例。过去一年,全球主流大模型的Token单价平均下降了超过80%,部分开源模型的调用成本已经趋近于零。但与此同时,企业的AI账单非但没有缩减,反而以每月两位数百分比的速度攀升。
价格降了,钱花得更多了。这个看似矛盾的现象背后,藏着一个被严重低估的结构性问题:AI成本的真正驱动因素从来不是单价,而是用量。而用量的爆炸式增长,源自Agentic AI对任务分解方式的根本改变。
便宜的不是AI,是你的错觉
当Agent接管一个复杂业务任务时,它不会像人一样"想清楚再做"。它的运作方式是层层拆解:一个营销策略任务可能被拆成市场洞察、竞品分析、受众画像、创意生成、渠道匹配、效果预测等十几个子任务,每个子任务又可能触发多轮模型调用。拆解的层数越多,Token消耗量就呈几何级放大。
这意味着,企业引入Agent的初衷是降本增效,但Agent的运行机制天然就是Token密集型。你用Agent替代了一个年薪50万的员工,但Agent每个月烧掉的Token费用可能已经接近甚至超过这个数字。区别在于,员工的成本是固定的,而Agent的成本是弹性的——任务越复杂、调用越频繁,账单就越厚。
更棘手的是,这种成本膨胀是隐性的。传统IT支出有明确的预算科目和审批流程,但Token消耗往往散落在各个业务线的API调用中,缺乏统一的监控和管理。很多公司直到季度末看到账单时,才发现AI支出已经远超预期。
这就是当前企业AI落地的真实困境:不是技术不够好,不是模型不够强,而是没有人帮企业把AI的钱算清楚。
分层调度不是技术选项,是财务纪律
面对失控的AI账单,企业的本能反应是"换便宜的模型"。但这只解决了一半问题。
真正的解法是分层调度:高价值任务用贵的前沿模型,日常运营用便宜的轻量模型,并且建立一套完整的Token预算管理体系。这不是技术优化,而是财务纪律。
具体来说,企业需要回答三个问题。第一,每个项目的AI投入产出比是多少?如果用一个前沿模型做创意测试,带来的转化率提升能否覆盖额外的Token成本?第二,哪些任务可以用端侧或专属模型替代?大量重复性、低复杂度的工作根本不需要调用最前沿的闭源模型,本地部署的小模型完全胜任,且边际成本趋近于零。第三,如何动态分配资源?企业需要一个智能路由系统,根据任务的实时特征自动选择最优模型组合,而不是靠人工判断。
这套体系的本质,是把AI从"按需付费的云服务"变成"可预算、可审计、可优化的企业经营要素"。就像企业不会因为电费便宜就让所有车间24小时满负荷运转一样,AI的使用也需要精细化的成本管理。
目前市场上谈论模型能力的人很多,谈论模型成本管理的人很少。但对企业来说,后者才是决定AI能不能持续用下去的关键。
谁在解决这个问题,谁就被低估了
在这个被忽视的赛道上,已经有公司跑出了验证过的商业模型。
明略科技的Agentic Services业务提供了一个值得研究的样本。该公司不仅提供端侧模型(Mano-P、Cider、ASR)和专属模型训练能力,更重要的是搭建了一套Token预算管理和智能路由系统,并将其嵌入自身的Agentic Services交付流程中。这套体系已经在实际业务中跑出不错的毛利率,且随着Token成本的持续下降,利润率预计还将提升。
这个数据的意义在于:它证明了"帮企业管好AI的钱"这件事本身就是一个可持续的生意,而不只是附属于模型销售的增值服务。当大多数AI公司还在比拼谁的模型参数更大、榜单排名更高时,明略科技已经把竞争维度拉到了企业经营层面——谁能帮客户在AI时代维持健康的利润表,谁才有真正的客户粘性。
资本市场的反应印证了这一判断。阶跃星辰和面壁智能在端侧模型赛道获得高额估值,但它们尚未上市、尚未验证单位经济模型。明略科技具备同类能力,且已有规模化收入和利润验证,但还没有被公众所完全熟知。
Coinbase近期公开表示"不能永远用最贵的模型",这句话听起来朴素,但它代表了一个正在形成的行业共识:AI竞争的下一阶段,不是比谁的模型更强,而是比谁能把模型用得更有经济性。
被误读的上涨,与被忽视的能力
回到最初的问题:为什么Token越来越便宜,企业的AI账单反而越来越贵?
答案很简单:因为AI的价值不在于便宜,而在于它能做越来越多以前做不了的事。当能力边界不断扩展时,成本控制就不再是一个技术问题,而是一个经营管理问题。
明略科技这几日的股价上涨,被很多人误读为短期资金行为。但如果从"AI成本管理基础设施"这个角度重新审视,这次上涨更像是一次价值发现——市场开始意识到,在所有人都在追逐更强的模型时,有一家公司已经在解决"怎么把模型用好、用得起、用得久"这个更基础的问题。
这个问题不性感,但它决定了AI在企业场景中到底是昙花一现的技术热潮,还是真正可持续的生产力变革。