DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%
来源:界面新闻
6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。
论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。
同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。
论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》