DeepSeek -V3.1让国产算力迎新机遇_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-08-30 00:38:32 股吧网页版

DeepSeek -V3.1让国产算力迎新机遇

来源：中国经营报

　　近日，DeepSeek正式发布了DeepSeek-V3.1，引发了业内关注。

　　DeepSeek方面称，本次升级包含以下主要变化：混合推理架构让一个模型同时支持思考模式与非思考模式；相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案，让模型拥有更高的思考效率；通过Post-Training优化，让新模型有更强的Agent能力，在工具使用与智能体任务中的表现有较大提升。

　　据悉，官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。

　　就此，速途研究院院长丁道师告诉《中国经营报》记者，这次版本的升级，性能更强大了，更好用了。但核心还不是这些升级，而是针对国产芯片的优化，这个才是重中之重。

　　性能升级

　　DeepSeek API也已同步升级，DeepSeek-chat对应非思考模式，DeepSeek-reasoner对应思考模式，且上下文均已扩展为128K。同时，API Beta接口支持了strict模式的Function Calling，以确保输出的Function满足schema定义。

　　另外，新版本增加了对Anthropic API格式的支持，可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。

　　爱分析首席李喆告诉，360集团创始人周鸿祎对此表示，DeepSeek官网流量下降是因为DeepSeek没有花心思，但现在很多第三方云服务上都有DeepSeek的服务，用了DeepSeek的大模型流量一直很高。在中国，许多公司包括360智能体的基座模型等都使用DeepSeek来改，相当于很多公司的“武器装备”都是DeepSeek提供的。

　　比如，Kimi K2就用了MOE架构，总参数1T，激活参数32B。另外，阿里巴巴通义千问发布新版Qwen3系列模型，包括2个MoE模型和6个dense模型，参数量从0.6B到235B。

（文章来源：中国经营报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》