价格分化用量猛增“词元经济”进入定价博弈期_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-05-29 23:44:30 股吧网页版

价格分化用量猛增“词元经济”进入定价博弈期

来源：经济参考报

　　近日，小米公司旗下大模型MiMo-V2.5宣布调价，相比原始API定价，新定价最高降幅可达99%，其词元套餐加量不加价，用量提升至原来的5到8倍。经历一季度词元“涨价潮”，小米成为少数在价格上跟进DeepSeek调降的大模型厂商。

　　随着AI智能体应用的不断推广，词元消耗量将保持高速增长。短期内算力紧张难以缓解，降价主要来自软件层面的技术进步和算法优化。长期来看，词元将成为和手机流量一样的基础供应。

　　大模型价格走势分化

　　在本轮小米降价之前，DeepSeek以其开源和普惠成为大模型中独一档的存在。自发布以来，DeepSeek模型多次调价，先是从4月26日开始将输入缓存命中的价格降至首发价格的1/10，后是5月份推出DeepSeek-v4-pro的2.5折优惠活动；近日，又宣布将这项原本限时的优惠活动常态化。

　　截至5月28日，DeepSeek-v4-flash缓存命中和缓存未命中的百万词元输入价分别为0.02元和1元，百万词元输出价格为2元；DeepSeek-v4-pro的缓存命中和缓存未命中的百万词元输入价为0.025元和3元，百万词元输出价为6元。

　　记者5月份体验发现，在DeepSeek-v4-pro月消耗4.75亿词元、DeepSeek-v4-flash月消耗24.33亿词元的情况下，累计消费约为375元。相比之下，多款国产大模型每月299元套餐仅包含3.2亿词元。

　　随着小米MiMo-V2.5降价，普惠区迎来了新供应商。根据小米公司数据，5月27日起，MiMo-V2.5的价格已与DeepSeek-v4-flash完全对齐，MiMo-V2.5pro价格也与DeepSeek-v4-pro保持一致。

　　不过，两家企业官方宣传资料显示，与DeepSeek-v4两款纯文本大模型不同，MiMo-V2.5还支持图像、视频、语音处理，这意味着它除了输出文字和代码，还能读图、听音、看视频，综合能力更为全面。

　　因此，小米大模型降价消息一出，吸引不少开发者抢先体验，其开放平台一度难以登录。记者连续两日体验发现，MiMo-V2.5的API响应速度会间歇性出现明显放慢甚至断联。

　　记者查询其他国产旗舰大模型价格文档发现，目前DeepSeek和MiMo的价格只有其他模型的几分之一甚至几十分之一，价格差距显著。

　　多位业内人士告诉记者，多家国产大模型可能在一周内跟进降价，具体价格策略仍在商讨中。

　　大模型定价进入博弈区间

　　仅在一个月以前，不少国产大模型还因词元消耗量骤增、成本增长过快，接连取消优惠套餐或者涨价。如今，词元降价潮信号初显。

　　随着词元价格分化，大模型定价进入博弈区间，对于供需两端都会带来巨大影响。从供给端看，算力紧张短期内难以有效缓解，大模型公司的硬件投入仍将持续增加。但从需求端看，尽管大模型和智能体的进步带来明显的效率提升，但快速增长的词元成本也让用户不得不审视投入产出比。

　　多位资深业内人士告诉记者，2026年国内头部互联网企业的GPU采购预算都以千亿元计算，后续还会增长。包括DeepSeek、Kimi、阶跃星辰等大模型企业的融资金额屡创新高，主要也是为了满足持续快速增长的算力需求。

　　算力成本的上涨，让大模型企业涨价冲动明显。截至发稿时，阿里云按请求次数计价的CodingPlan，每天9点30开售即迅速售罄；作为替代方案，成本相对更高、词元限量的TokenPlan尚能稳定供应。同时，腾讯云的CodingPlan则“已售罄”，仅TokenPlan可正常购买。

　　“这反映出外部需求正呈现爆发式增长。此轮调整基本围绕需求侧变化展开，全球头部大模型及云计算厂商，尤其是具备底座能力的企业，都在进行相应调整。”腾讯相关负责人向记者表示，一是大模型应用正向产业端持续延伸，直接带动了使用量的攀升；二是智能体（Agent）与对话机器人（Chatbot）形态存在本质差异，使得词元消耗呈指数级增长。大模型厂商销售模式的调整，也会逐步传导至云厂商及终端客户层面。

　　由于算力紧张，原本免费的AI应用开始收费，原本收费的套餐则开始涨价。前不久，字节跳动旗下的豆包App针对进阶功能推出订阅计划，引发市场关注。另一款大模型Kimi早在2025年9月就推出了订阅计划。

　　从需求端看，持续增加的词元用量叠加一路涨价，使得不少用户已经越来越难以承受。近日，网约车公司Uber高管公开表示，由于词元开支远超预期，该公司5000名工程师4个月便花光了全年在AI方面的预算。

　　目前词元成本已经成为团队的主要开支。一位从事AI影视的创作者告诉记者，他平时和团队开玩笑说，务必要多用脑，因为这样不消耗词元，而且可以提升AI使用效率。

　　市场咨询公司IDC预计，2026年中国MaaS（大模型即服务）市场的词元消耗量将达到40000万亿，较2025年进一步增长约20倍。2024年至2030年的年复合增长率约为1154.9%。这一加速增长的主要驱动因素，是多模态大模型的逐步成熟以及智能体类应用的规模化落地。市场正在从“文本生成”向“多模态理解与自动执行”扩展，每一次交互所消耗的词元量级也相应大幅提升。

　　对此，IDC中国研究总监卢言霞认为，正如工业时代的企业必须预算电力成本，AI时代的企业必须学会预算词元成本。未来3年内，是否具备“词元精细化管理能力”，将成为企业AI成熟度的重要分水岭。

　　词元价格下探空间在哪？

　　记者采访多位业内人士了解到，作为人工智能的燃料，词元价格从源头决定了人工智能的应用深度和广度。词元价格的下探幅度，取决于算力成本、技术优化水平和大模型公司的商业策略。

　　算力成本从源头决定着词元价格。对于DeepSeek在5月份的降价常态化，多位业内人士告诉记者，这一方面与DeepSeek新一轮融资有关，另一方面可能与华为昇腾芯片研发符合预期甚至超出预期有关。此前，DeepSeek官方表示，受限于高端算力，目前Pro的服务吞吐量十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。

　　同时，全球算力市场定价在趋于透明和有序。“GPU正在变成一种金融资产”，市场分析机构AI超维度分析师告诉记者，通过采集分析全球GPU算力市场实时数据发现，截至5月13日，同一块H100芯片最低报1.47美元/小时，最高报3.07美元/小时，相差超过一倍。所以，市场需要的不是更多供应商，而是好的价格发现机制。

　　近日，芝加哥商品交易所宣布，将在2026年推出算力期货市场，目前等待监管机构审查。

　　对此，AI超维度分析师认为，中国的算力更偏向于公共资源定位，短期内不太可能出现同样的期货产品，但中国AI公司面对的算力焦虑是一样的——供给紧张、价格不透明、长期成本难以预测。当算力有了公开的价格曲线，AI产业会多了一个新的参照维度，有利于行业健康可持续发展。

　　此外，DeepSeek和小米的低价策略正搅动市场，或将引发行业变局。研究机构FundAI评测发现，成本是DeepSeek-v4最值得关注的变量之一。从单任务成本来看，Flash约0.007美元，Flash Thinking约0.008美元，Pro约0.10美元，Pro Thinking约0.15美元。按此数据，在不考虑前期投入的情况下，DeepSeek每次调用服务都有一定毛利空间。

　　对于本次大幅降价的背后动力，小米公司表示，是小米技术团队在推理系统上的持续优化，显著提升了缓存命中率和推理效率，在保障服务质量的前提下持续降低单位词元服务成本。

　　业内人士认为，尽管词元需求持续增加，但是在用户的总预算相对稳定甚至有所削减前提下，大模型企业必须综合考虑成本覆盖和市场份额，以确保行业的健康有序发展。

（文章来源：经济参考报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》