5月27日一早,雷军在微博宣布,小米MiMo-V2.5系列做了一次大幅度的价格调整,最高降幅达到99%,不再区分上下文窗口。

小米:MiMo-V2.5系列API永久降价
对价格体系进行永久性翻新
@小米技术表示,过往几个月,通过MiMo Orbit、百万亿Token创造者激励计划等活动,让更多人有机会体验MiMo,并解决真实的问题——这是MiMo在规模化应用道路上的第一步。而现在,随着底层技术的不断精进,终于可以做一件更彻底的事——对整个模型价格体系进行一次永久性翻新。
MiMo-V2.5系列API永久降价
相比原始API定价,新定价最高降幅可达99%,且不再区分上下文窗口长度。

本次调价于北京时间5月27日0:00正式生效,全球同步调整。
Token Plan计费体系优化
加量不加价,用量提升至原5-8倍,解锁更充沛的生产力。示例:在Agent或Code场景下,可用Token数量为:

计费规则调整,更加清晰易懂,所见即所得。

此外,无论当前套餐用量如何,所有已订阅Token Plan且当前仍在有效期的用户(包括参与百万亿Token创造者激励计划并获得Token Plan的用户,涵盖Apache软件基金会专属福利用户)的Credits额度将于北京时间5月27日0点全量重置,并按新计费规则执行。
小米技术表示,本次价格调整背后,离不开团队在推理系统上的持续优化。基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,显著提升了缓存命中率和推理效率。
同时,通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。后续将发布更加详细的推理优化技术Blog。
雷军:未来三年
在AI领域投入600亿元
值得注意的是,就在5月26日晚,雷军在微博公布了小米集团一季度业绩:
营收991亿元,经调整净利润61亿元,全球月活超7.46亿,AIoT平台连接设备数超11亿。智能电动汽车及AI等创新业务收入199亿元,当季新车交付80856台,490家汽车销售门店。
研发投入90亿元,同比增长33.4%,研发人员总数26048人,预计全年研发投入超400亿。
Xiaomi MiMo-V2.5-Pro跻身Artificial Analysis榜单综合智能指数、Agent指数全球开源模型并列第一,未来三年在AI领域投入600亿元。
每日经济新闻综合自@雷军、@小米技术