这个周末的投资圈和AI圈被一则消息搅动。曾让无数投资人吃了闭门羹的DeepSeek,传出了首次启动外部融资的风声。
有报道称,DeepSeek正在以超100亿美元(约合人民币682亿元)的估值,计划募集不少于3亿美元(约合人民币20亿元)资金。对于长期拒绝外部资本、强调独立性的DeepSeek而言,此举被视为一种战略上的重大转向。
据悉,通过引入外部资金,DeepSeek将有更多计算资源开发新模型,同时能提供更具竞争力的薪酬来防止顶尖研究员流失。分析预计潜在投资方以国内人民币资金为主,美国风险资本或心存顾虑。
截至19日上午,DeepSeek并未就此次融资消息作出官方回应。今年年初,市场曾传出阿里有意投资DeepSeek的消息,但很快被DeepSeek官方辟谣。
DeepSeek 此前多次拒绝外部投资,创始人梁文锋被认为是技术理想主义者,担心外部投资者会干预公司决策。为什么这个时候梁文锋妥协了?
一位投过大模型的投资人对第一财经记者表示,DeepSeek即便开放融资,也不是大多数人的游戏,且按照梁文锋的想法,条款也一定异常严苛。对于这次融资转向,该投资人判断大概率是为了员工期权定价和兑现,且“做得太晚了”。
DeepSeek的特殊性在于,由于长期拒绝外部资本,员工手中的期权完全依赖内部估值。在外部机构未以真金白银确认价格前,这种账面财富在顶级人才眼中缺乏足够的流通性和溢价锚点。
AI领域人才竞争激烈,DeepSeek的核心研发团队已成为各大厂和独角兽的猎头首要目标,业内估计DeepSeek的薪资并不低,但竞争对手开出的薪酬包可以翻倍甚至更多。
目前DeepSeek已出走多位核心研究员。DeepSeek-V2架构的关键贡献者罗福莉在去年11月加盟了小米;另一位核心研究员郭达雅被曝近期入职字节跳动Seed团队;DeepSeek前多模态核心研究员阮翀加盟了智能驾驶解决方案供应商元戎启行;DeepSeek-OCR 系列核心作者魏浩然传闻将入职某大厂。
近期市场流传郭达雅入职Seed团队年薪接近亿元,虽被抖音集团副总裁李亮否认,但他表示Seed团队技术人员薪资体系包括现金、字节期权和豆包期权,若业务发展良好,部分技术人员四年后收益确实可能达到数亿元。
业内人士指出,此次融资转向除了为期权体系引入市场化定价外,也存在现实的资金需求。有AI创业者对第一财经表示,“梁文锋不可能一直拿幻方的钱无限制补贴DeepSeek,独立分拆出来按市场化估值融资,是更合理的商业选择。”
DeepSeek由量化私募巨头幻方量化孵化,据私募排排网数据,2025年幻方量化平均收益率高达56.6%,管理规模超700亿元。业内人士估算,仅2025年幻方量化就为梁文锋带来了超过7亿美元的收入,这被认为是DeepSeek维持独立运转的“无限弹药”。
不过,大模型竞赛的烧钱速度正在超出行业预期。随着模型参数从千亿级迈向万亿级,算力基础设施的投入呈指数级增长,即便是DeepSeek或许也有一定压力。
值得关注的是,DeepSeek已有15个月没有大版本更新,这期间竞争对手们已迭代多轮。原计划于今年2月发布的下一代旗舰模型DeepSeek V4,因工程问题已多次跳票。导致延期的核心变量之一,或是技术路线的重大迁移。
第一财经了解到,DeepSeek V4将放弃此前基于英伟达CUDA框架的路径,全面运行于华为昇腾芯片,并完成向华为CANN框架的适配迁移。有业内人士对第一财经记者表示,DeepSeek模型此前一直基于英伟达芯片在做,因此做昇腾架构的迁移需要花费很大努力,涉及整体架构重构以及系统稳定性强化等工作。
若DeepSeek此举成功,这将是全球首个不依赖英伟达的前沿AI模型。这一转变虽然在短期内增加了研发成本与时间,但在战略层面意义深远。
在近期的访谈节目中英伟达CEO黄仁勋表示,DeepSeek V4若与华为昇腾芯片深度适配,将削弱美国在AI技术生态的壁垒,对美国是“可怕的结果”。
业内有传闻称,DeepSeek V4 将于4月下旬正式发布,该版本模型参数规模达到万亿级别,支持百万级上下文长度。就在上月,DeepSeek曾出现持续约13小时的服务中断,业内普遍将其归因于V4的灰度测试。
在当前大模型竞争日趋白热化的背景下,经历数月延期的 V4 被寄予厚望。对于梁文锋和DeepSeek而言,目前也站在一个重要的十字路口。