瀚博半导体VA16 FP4+FP8完成适配DeepSeek-V4_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-04-27 17:27:41 股吧网页版

瀚博半导体VA16 FP4+FP8完成适配DeepSeek-V4

来源：上海证券报·中国证券网作者：郑维汉

　　上证报中国证券网讯（记者郑维汉）4月24日，DeepSeek正式开源全新系列模型DeepSeek-V4，瀚博半导体第一时间完成载天VA16加速卡的FP4+FP8混合精度适配，加速大模型高并发、低成本落地。

　　DeepSeek称，“1M上下文将是DeepSeek所有官方服务的标配”，大模型正式迈入百万长文本普惠时代。

　　据悉，DeepSeek-V4全系标配百万token上下文窗口，采用混合注意力机制，相比DeepSeek-V3.2大幅降低单token推理FLOPs和KV缓存需求。结合压缩稀疏注意力（CSA）与重度压缩注意力（HCA），显著提升长上下文处理效率。

　　在模型能力上，DeepSeek-V4-Pro性能比肩世界顶尖闭源模型。在Agentic Coding评测中已达到当前开源模型最佳水平；在数学、STEM、竞赛型代码的测评中，超越当前所有已公开评测的开源模型。DeepSeek-V4-Flash则由于模型参数和激活更小，提供更加快捷、经济的API服务，简单任务上与Pro版旗鼓相当。

　　要在部署端充分释放DeepSeek-V4的上述能力，需要硬件侧的原生支持。

　　瀚博载天VA16配备128GB超大显存，为百万token超长上下文的KV缓存提供充裕驻留空间。同时，VA16支持FP4和FP8数据精度格式，显著降低显存占用、提升推理吞吐。配合兼容vLLM等主流框架的全栈软件生态，以及最高2TB总显存的一体机私有化部署方案，开发者可快速实现从模型验证到业务上线。

　　瀚博半导体称，此次FP4+FP8混合精度成功适配DeepSeek-V4，是瀚博半导体在低精度大模型适配领域的里程碑。面向百万上下文普惠新时代，瀚博将持续携手产业伙伴，加速大模型应用的高效、安全、规模化落地。

（文章来源：上海证券报·中国证券网） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》