• 最近访问:
发表于 2026-05-29 23:44:30 股吧网页版
价格分化 用量猛增“词元经济”进入定价博弈期
来源:经济参考报

  近日,小米公司旗下大模型MiMo-V2.5宣布调价,相比原始API定价,新定价最高降幅可达99%,其词元套餐加量不加价,用量提升至原来的5到8倍。经历一季度词元“涨价潮”,小米成为少数在价格上跟进DeepSeek调降的大模型厂商。

  随着AI智能体应用的不断推广,词元消耗量将保持高速增长。短期内算力紧张难以缓解,降价主要来自软件层面的技术进步和算法优化。长期来看,词元将成为和手机流量一样的基础供应。

  大模型价格走势分化

  在本轮小米降价之前,DeepSeek以其开源和普惠成为大模型中独一档的存在。自发布以来,DeepSeek模型多次调价,先是从4月26日开始将输入缓存命中的价格降至首发价格的1/10,后是5月份推出DeepSeek-v4-pro的2.5折优惠活动;近日,又宣布将这项原本限时的优惠活动常态化。

  截至5月28日,DeepSeek-v4-flash缓存命中和缓存未命中的百万词元输入价分别为0.02元和1元,百万词元输出价格为2元;DeepSeek-v4-pro的缓存命中和缓存未命中的百万词元输入价为0.025元和3元,百万词元输出价为6元。

  记者5月份体验发现,在DeepSeek-v4-pro月消耗4.75亿词元、DeepSeek-v4-flash月消耗24.33亿词元的情况下,累计消费约为375元。相比之下,多款国产大模型每月299元套餐仅包含3.2亿词元。

  随着小米MiMo-V2.5降价,普惠区迎来了新供应商。根据小米公司数据,5月27日起,MiMo-V2.5的价格已与DeepSeek-v4-flash完全对齐,MiMo-V2.5pro价格也与DeepSeek-v4-pro保持一致。

  不过,两家企业官方宣传资料显示,与DeepSeek-v4两款纯文本大模型不同,MiMo-V2.5还支持图像、视频、语音处理,这意味着它除了输出文字和代码,还能读图、听音、看视频,综合能力更为全面。

  因此,小米大模型降价消息一出,吸引不少开发者抢先体验,其开放平台一度难以登录。记者连续两日体验发现,MiMo-V2.5的API响应速度会间歇性出现明显放慢甚至断联。

  记者查询其他国产旗舰大模型价格文档发现,目前DeepSeek和MiMo的价格只有其他模型的几分之一甚至几十分之一,价格差距显著。

  多位业内人士告诉记者,多家国产大模型可能在一周内跟进降价,具体价格策略仍在商讨中。

  大模型定价进入博弈区间

  仅在一个月以前,不少国产大模型还因词元消耗量骤增、成本增长过快,接连取消优惠套餐或者涨价。如今,词元降价潮信号初显。

  随着词元价格分化,大模型定价进入博弈区间,对于供需两端都会带来巨大影响。从供给端看,算力紧张短期内难以有效缓解,大模型公司的硬件投入仍将持续增加。但从需求端看,尽管大模型和智能体的进步带来明显的效率提升,但快速增长的词元成本也让用户不得不审视投入产出比。

  多位资深业内人士告诉记者,2026年国内头部互联网企业的GPU采购预算都以千亿元计算,后续还会增长。包括DeepSeek、Kimi、阶跃星辰等大模型企业的融资金额屡创新高,主要也是为了满足持续快速增长的算力需求。

  算力成本的上涨,让大模型企业涨价冲动明显。截至发稿时,阿里云按请求次数计价的CodingPlan,每天9点30开售即迅速售罄;作为替代方案,成本相对更高、词元限量的TokenPlan尚能稳定供应。同时,腾讯云的CodingPlan则“已售罄”,仅TokenPlan可正常购买。

  “这反映出外部需求正呈现爆发式增长。此轮调整基本围绕需求侧变化展开,全球头部大模型及云计算厂商,尤其是具备底座能力的企业,都在进行相应调整。”腾讯相关负责人向记者表示,一是大模型应用正向产业端持续延伸,直接带动了使用量的攀升;二是智能体(Agent)与对话机器人(Chatbot)形态存在本质差异,使得词元消耗呈指数级增长。大模型厂商销售模式的调整,也会逐步传导至云厂商及终端客户层面。

  由于算力紧张,原本免费的AI应用开始收费,原本收费的套餐则开始涨价。前不久,字节跳动旗下的豆包App针对进阶功能推出订阅计划,引发市场关注。另一款大模型Kimi早在2025年9月就推出了订阅计划。

  从需求端看,持续增加的词元用量叠加一路涨价,使得不少用户已经越来越难以承受。近日,网约车公司Uber高管公开表示,由于词元开支远超预期,该公司5000名工程师4个月便花光了全年在AI方面的预算。

  目前词元成本已经成为团队的主要开支。一位从事AI影视的创作者告诉记者,他平时和团队开玩笑说,务必要多用脑,因为这样不消耗词元,而且可以提升AI使用效率。

  市场咨询公司IDC预计,2026年中国MaaS(大模型即服务)市场的词元消耗量将达到40000万亿,较2025年进一步增长约20倍。2024年至2030年的年复合增长率约为1154.9%。这一加速增长的主要驱动因素,是多模态大模型的逐步成熟以及智能体类应用的规模化落地。市场正在从“文本生成”向“多模态理解与自动执行”扩展,每一次交互所消耗的词元量级也相应大幅提升。

  对此,IDC中国研究总监卢言霞认为,正如工业时代的企业必须预算电力成本,AI时代的企业必须学会预算词元成本。未来3年内,是否具备“词元精细化管理能力”,将成为企业AI成熟度的重要分水岭。

  词元价格下探空间在哪?

  记者采访多位业内人士了解到,作为人工智能的燃料,词元价格从源头决定了人工智能的应用深度和广度。词元价格的下探幅度,取决于算力成本、技术优化水平和大模型公司的商业策略。

  算力成本从源头决定着词元价格。对于DeepSeek在5月份的降价常态化,多位业内人士告诉记者,这一方面与DeepSeek新一轮融资有关,另一方面可能与华为昇腾芯片研发符合预期甚至超出预期有关。此前,DeepSeek官方表示,受限于高端算力,目前Pro的服务吞吐量十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

  同时,全球算力市场定价在趋于透明和有序。“GPU正在变成一种金融资产”,市场分析机构AI超维度分析师告诉记者,通过采集分析全球GPU算力市场实时数据发现,截至5月13日,同一块H100芯片最低报1.47美元/小时,最高报3.07美元/小时,相差超过一倍。所以,市场需要的不是更多供应商,而是好的价格发现机制。

  近日,芝加哥商品交易所宣布,将在2026年推出算力期货市场,目前等待监管机构审查。

  对此,AI超维度分析师认为,中国的算力更偏向于公共资源定位,短期内不太可能出现同样的期货产品,但中国AI公司面对的算力焦虑是一样的——供给紧张、价格不透明、长期成本难以预测。当算力有了公开的价格曲线,AI产业会多了一个新的参照维度,有利于行业健康可持续发展。

  此外,DeepSeek和小米的低价策略正搅动市场,或将引发行业变局。研究机构FundAI评测发现,成本是DeepSeek-v4最值得关注的变量之一。从单任务成本来看,Flash约0.007美元,Flash Thinking约0.008美元,Pro约0.10美元,Pro Thinking约0.15美元。按此数据,在不考虑前期投入的情况下,DeepSeek每次调用服务都有一定毛利空间。

  对于本次大幅降价的背后动力,小米公司表示,是小米技术团队在推理系统上的持续优化,显著提升了缓存命中率和推理效率,在保障服务质量的前提下持续降低单位词元服务成本。

  业内人士认为,尽管词元需求持续增加,但是在用户的总预算相对稳定甚至有所削减前提下,大模型企业必须综合考虑成本覆盖和市场份额,以确保行业的健康有序发展。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500