• 最近访问:
发表于 2025-09-23 07:23:50 股吧网页版
DeepSeek线上模型升级为DeepSeek-V3.1-Terminus
来源:上海证券报·中国证券网 作者:谭镕

  上证报中国证券网讯(记者谭镕)9月22日晚,DeepSeek小助手在官方社群中称,DeepSeek线上模型已升级,当前版本号DeepSeek-V3.1-Terminus。欢迎大家测试和反馈问题。

  DeepSeek介绍,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。

  今年年初,开源大模型DeepSeek曾掀起“开源潮”。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

  9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

  在模型升级方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。DeepSeek还宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500