8月21日下午,深度求索正式推出新一代大模型DeepSeek-V3.1,并剑指“智能体时代”。此前8月20日晚间,DeepSeek-V3.1便已悄然上线,且在HuggingFace趋势榜排名第三。
这次升级不仅引入混合推理架构和128K上下文窗口,还同步调整API(应用程序接口)定价策略,取消夜间优惠。
在OpenAI、谷歌(GOOG)等巨头环伺的全球AI竞赛中,DeepSeek虽以技术革新抢占先机,却仍面临用户流失、市场份额下滑的挑战。
多重升级
据悉,DeepSeek-V3.1的升级聚焦三大核心能力。
一是混合推理架构,一个模型同时支持思考模式与非思考模式,用户可通过官方App或网页端的“深度思考”按钮自由切换。
相比前代DeepSeek-R1-0528模型,DeepSeek-V3.1-Think在处理复杂任务时效率提升显著,响应时间缩短,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。
DeepSeek-V3.1在编程测试中表现亮眼,在AiderPolyglot多语言编程基准测试中,V3.1得分达71.6%,超越Claude4 Opus和自家R1模型。
同时,通过Post-Training优化,V3.1在工具使用与智能体任务中的表现有较大提升,具有更强的Agent能力。
技术架构上,V3.1延续了DeepSeek系列的MLA(多语言注意力)和MoE(混合专家)设计,参数量与V3版本持平,但通过840B tokens的额外训练强化了多语言支持,现可流畅处理超过100种语言,尤其优化了亚洲语种和资源较少语种的表现。
DeepSeek API 也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文窗口均已由64k扩展为128K。
API已支持128K上下文和严格模式Function Calling,便于开发者集成工具调用能力。同时,公司新增Anthropic API格式兼容,允许用户将V3.1无缝接入Claude框架,拓展生态边界。
此外,从官方App和网页端的显示来看,DeepSeek去掉了“深度思考(R1)”中的“R1”标识。同时,与V3-base相比,DeepSeekV3.1新增了四个特殊Token。
商业转变
伴随技术升级,DeepSeek的商业策略转向更激进。
深度求索宣布自北京时间2025年9月6日起,API接口执行新价格:输入token收费0.5元/百万(缓存命中)或4元/百万(缓存未命中),输出token统一为12元/百万。这一调整还取消了此前夜间时段(00:30-08:30)的折扣优惠。
澎湃新闻称,V3.1在token使用量上较0324版本降低约13%,单次编程任务成本仅1.01美元,约为专有系统的1/60,但夜间优惠的终结可能抬高中小企业的使用门槛。
DeepSeek解释称,涨价源于服务资源扩容需求,为更好地满足用户的调用需求,已进一步扩容API服务资源。
本次发布正值深度求索深陷市场传闻漩涡。
8月15日,腾讯科技援引知情人士消息,否认了深度求索“完成7亿美元C轮融资”的传闻。更早前,所谓“DeepSeek-R2将于8月中旬发布”的消息亦被内部人士证伪。
据QuestMobile《2025Q2 AI应用价值榜》,DeepSeek月均下载量从Q1的8111.3万骤降至2258.9万,下滑超70%;活跃用户规模从3月的1936.1万降至6月的1629.5万。尽管官方流量下滑,其开源模型仍通过腾讯(00700)云、阿里(09988)云、华为云等多家平台,覆盖医疗、金融等高价值场景。
第三方机构onelittleweb分析显示,就全球市场而言,DeepSeek模型以3.96%的市场份额在全球AI聊天机器人中综合评分排名第五,年度访问量达27.4亿次。