• 最近访问:
发表于 2026-04-24 13:38:11 股吧网页版
终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先
来源:澎湃新闻

  “不诱于誉,不恐于诽,率道而行,端然正己。”

  在DeepSeekV4预览版本上线当天,DeepSeek官方团队表示:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”

  DeepSeek表示:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

  这些表态,似乎也是对近期传言的回应。4月24日,澎湃新闻记者获悉,外界关注的全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:

  API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。

  相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在AgenticCoding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的AgenticCoding模型,据评测反馈使用体验优于Sonnet4.5,交付质量接近Opus4.6非思考模式,但仍与Opus4.6思考模式存在一定差距。

  DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

  在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

  相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

  值得注意的是,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeekSparseAttention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

  DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

  目前,DeepSeekAPI已同步上线V4-Pro与V4-Flash,支持OpenAIChatCompletions接口与Anthropic接口。访问新模型时,base_url不变,model参数需要改为deepseek-v4-pro或deepseek-v4-flash。

  DeepSeek官方提供的模型价格

  V4-Pro与V4-Flash最大上下文长度为1M,均同时支持非思考模式与思考模式,其中思考模式支持reasoning_effort参数设置思考强度(high/max)。对于复杂的Agent场景建议使用思考模式,并设置强度为max。

  DeepSeek在去年春节的现象级走红,曾一度被捧上神坛,不过,伴随国产AI的竞速加剧,来自智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正在面临激烈竞争。

  近期,DeepSeek被首次开启外部融资、人才流失等众多外界声音困扰,此前4月18日,澎湃新闻记者从多位创投圈人士处证实,DeepSeek正在开启其首次外部融资。此前据外媒报道,DeepSeek目标估值超过100亿美元,据外媒援引知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元以补充资金储备,应对成本日益高昂的AI军备大赛。

  根据澎湃新闻记者采访梳理,去年以来,DeepSeek已经流失多位核心成员,其中大部分为“95后”青年科学家:

  4月12日,自动驾驶公司元戎启行对外确认,DeepSeek多模态模型核心贡献者阮翀已加盟公司出任首席科学家,DeepSeek第一代大语言模型(LLM)核心作者王炳宣,近期宣布加盟腾讯;DeepSeek-OCR系列核心作者魏浩然也在今年春节前后离职,但尚未披露正式入职哪家大厂。4月16日,前DeepSeek核心研究员郭达雅被曝加盟字节跳动,去年11月12日,前DeepSeek核心研究员罗福莉官宣加盟小米。在基座大模型(LLM)、智能体(Agent)、文本识别(OCR)、多模态等多方面领域,DeepSeek均有核心人才流失。

  4月8日,在最新版本中,DeepSeek输入框上方新增“快速模式”与“专家模式”,网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式擅长复杂问题,这也是DeepSeek在官网页面首次引入分层模式。

  相关动态,让DeepSeek更新V4的悬念成为大家讨论的热点,当时澎湃新闻记者曾经报道,DeepSeek大概率在今年4月正式上线V4版本,DeepSeek内部人士也曾向记者表示:非常期待。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500