8月21日,DeepSeek公众号宣布,正式发布DeepSeek-V3.1。据介绍,这款大模型为混合推理架构,同时支持思考模式与非思考模式。思考效率更高,相比DeepSeek-R1-0528能在更短时间给出答案。此外,新模型在工具使用与智能体任务中的表现有较大提升。
目前,DeepSeek官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可通过“深度思考”按钮,在使用中切换思考模式与非思考模式。DeepSeek API也已同步升级。
新模型在智能体能力上实现突破。官方资料显示,在代码修复测评,命令行终端环境下的复杂任务测试中,DeepSeek-V3.1有明显提高,并在多项搜索评测指标上取得较大进展。
DeepSeek在官方微信文章标题中称,DeepSeek-V3.1的发布是“迈向Agent(智能体)时代的第一步”。
中商产业研究院分析师预测,2025年中国AI智能体市场规模将达69亿元,到2030年将接近300亿元。
测试结果显示,DeepSeek-V3.1在思考模式下的效率大幅提升。V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。V3.1在非思考模式下的输出长度也得到了有效控制,这意味着新模型能帮助使用者控制成本。
同时,DeepSeek-V3.1的API接口价格变了。
DeepSeek表示,公司将于北京时间9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行调整,届时将取消此前的夜间时段优惠。调整后价格为输入每百万输入tokens 0.5元(缓存命中)/4元(缓存未命中),每百万输出tokens 12元。
此前,DeepSeek-V3的API服务价格是每百万输入tokens 0.5元(缓存命中)/ 2元(缓存未命中),每百万输出tokens 8元。
官方介绍中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官微在置顶留言中透露,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
中国信通院近日发布的对国内人工智能软硬件产品的测试结果显示,在适配支持性方面,通过软硬件协同优化,参测产品部署DeepSeek模型在语言理解、逻辑推理等典型任务中的精度已基本与国外系统持平。