• 最近访问:
发表于 2026-06-26 15:17:20 股吧网页版
未来智造局 | Token经济升温,AI基础服务如何“明码标价”?
来源:新华财经

  新华财经上海6月26日电 从普通用户订阅AI应用,到开发者调用大模型接口,再到企业将大模型嵌入业务流程,Token(词元)正成为人工智能时代越来越常见的计量单位。不过,用户也反映,Token在使用过程中,存在模型能力缩水“变笨”、计费不明等问题。在Token经济快速升温的背景下,AI基础服务如何实现真正意义上的“明码标价”,正成为行业关注的新问题。

  买Token,容易遭遇的三个“坑”

  国家数据局数据显示,中国日均Token调用量已突破140万亿。此外,据中国信息通信研究院监测显示,2025年我国公有云企业级Token调用量约2000万亿,而2026年仅第一季度便达到这一规模。

  “Token已经成为计量智能服务的基本单位。未来它将像水、电、煤等公共服务一样被计量和使用。”中国信通院华东分院人工智能事业部主任常永波表示。

  不过,与水、电、通信等成熟公共服务不同,Token服务虽然已有明确报价,但用户对“自己买到的到底是什么”并不总是清楚。目前,用户使用大模型服务大体有两种方式:一种是直接通过豆包、DeepSeek等平台使用;另一种则是通过云厂商、运营商以及第三方服务平台调用模型能力。

  “包括大厂和创业公司在内,目前国内已经有不少Token服务商。与用电不同,Token的售卖允许众多私营企业参与,这导致中转流通环节供应商水平和Token质量参差不齐。”常永波说。

  随着Token服务商数量增加,用户选择更加丰富,但体验差异也随之显现。

  目前来看,Token服务已经出现几个“常见坑”。

  ——“同名模型,智力却有高低”。在用户看来,各大平台上标明接入的同款明星开源模型,使用效果理应接近。但实际交互中,用户常常会感觉“有的聪明、有的笨”。

  ——“看着便宜,未必真的省钱”。市场上有的服务商每百万Token标价1元,有的标价3元,用户直觉上前者更划算。但在实际完成同一个复杂任务时,前者可能最终耗费100元,后者可能只需50元。看似更低的Token单价,最终使用成本可能反而更高。

  ——“服务体验不稳定”。有消费者反映,有些模型服务调用顺畅,响应较快;有些则会出现卡顿、延迟升高,甚至一段时间内“变笨”的情况。对普通用户而言,这意味着同样付费,体验忽好忽坏;对开发者和企业用户而言,则可能影响应用响应速度和业务连续性。

  模型会“变笨”、低价未必省钱差异到底从哪来?

  为什么表面上标准化的Token计费,会在实际落地中产生如此巨大的偏差?拆解技术与商业链路,上述乱象的根源在于大模型服务与计价仍处在“黑盒”中。

  首先,模型为何会“变笨”?隐蔽的“降维部署”是一大主因。清程极智联合创始人、产品副总裁师天麾解释称,一些服务商为了节省算力成本,会将原本以FP16或FP8精度部署的高质量模型,进一步量化压缩为INT8或INT4等低精度格式进行部署。模型量化本身是提升推理效率的常见方式,但可能会导致模型在复杂推理、长文本理解、代码生成等任务上的表现受到影响。

  然而,服务商在报价单上依然沿用原模型名称,对部署精度避而不谈,导致用户在完全不知情的情况下买到了“缩水版”模型。

  成本为何只是表面低价,实际用下来费用超标?师天麾提到一个概念——“缓存命中率”。在智能体、多轮对话、代码开发等场景中,大量请求会反复使用相同的提示词前缀。这时,“缓存命中率”会直接影响最终成本。在不少平台的计费规则中,命中缓存后的输入Token价格往往明显低于普通输入Token价格,有些可降至原价的一至两成左右。

  然而,并非所有服务商都有同样的缓存能力。一些平台虽然标价很低,但缓存命中率较低,甚至不提供缓存折扣。“客户本来能省下80%到90%的钱,最终却只能按原价全额付费,总花销反而更高。”师天麾表示。

  体验为何不稳定?常永波解释称,首Token时延、输出速度、吞吐量、调用成功率、稳定性等关键性能指标,都会影响AI应用是否流畅。但这些信息通常并不像价格一样清晰展示给用户。

  业内人士透露,即便购买的是同款模型,头部服务商与中小平台之间延迟和吞吐量差距也可能达到4到5倍;即便是同一家服务商,其在一天不同时间段内的服务质量波动也可能达到两三倍。

  构建多维标尺让AI服务价格“算得清”

  随着Token调用量持续增长,行业已经开始探索如何让AI基础服务不只是“有价格”,更能让用户看得懂、算得清、用得放心。

  可以看到,关于什么是“高质量Token服务”的评价标准正在不断完善。

  中国信通院人工智能研究所所长魏凯从三个维度定义高质量Token服务:智能密度、服务稳定性和安全性。他表示,业界对Token服务的关注视角,已经从“调用量”向高质量转变,Token服务也正在从粗放管理走向精益运营。

  前不久,由中国信通院发起建立的公有云“大模型Token服务性能监测平台”发布,对主流Token服务平台的Token吞吐率、时延等性能进行客观量化评估。

  市场化机构也在进行相关评测。清程极智联合清华大学、中国软件评测中心等机构,通过自研的Token专业评测与一站式服务平台“AI Ping”,对国内30多家正规服务商的600至700个大模型开展不间断匿名评测,相关测试结果实时发布并进行排名,为服务商改进服务和用户选择平台提供参考。

  “未来用户不会长期为调用了多少Token买单,而是会为问题被解决、流程被优化、效率被提升等实际成效买单。”师天麾说。

  当用户购买AI服务时,不再只比较每百万Token多少钱,而是能够同时看清模型能力、服务质量、计费规则和安全边界,AI基础服务的“明码标价”才算真正落到实处。对于正在快速发展的Token经济而言,建立统一、透明、可比较的服务标准,正是迈向成熟的重要一步。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500