9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。
据悉,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。目前,寒武纪、华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作。
DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

DeepSeek频繁升级
就在9月22日晚,DeepSeek宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方发布的测试结果显示,该版本模型单项提升幅度最大超过36%。官方API价格保持不变,百万tokens输入(缓存命中)0.5元,输出12元。
而上述更新距V3.1发布仅一个月。8月21日,DeepSeek宣布发布DeepSeek-V3.1。当日,DeepSeek概念板块火热。随后,不少国产芯片产业链企业股价大涨。
业内人士指出,在开源模型竞争趋于白热化的背景下,快速修复Bug、提升智能体能力将成为留住开发者的关键。
国盛证券金融工程团队分析师张国安在研报中分析指出,DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,同时DeepSeek提出多项算法创新,打破了海外算力堆砌的传统大模型提升路径,展示出中国在AI领域已经具备与全球顶尖水平竞争的实力。这将使全球投资者对中国科技企业的技术创新能力塑造新的认知,进而对中国科技资产重新进行价值评估。
国海证券发布研报称,大模型训推带动AI算力需求增长,GB300、Vera Rubin等新一代算力架构将推出,算力产业链中的AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节有望持续受益。