《科创板日报》9月30日讯(记者李明明)又一家国内大模型宣布适配国产芯片!
今日,智谱发布及开源新一代大模型GLM-4.6,并介绍其整体性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。这是继DeepSeek-V3.2-Exp与Claude Sonnet 4.5之后,国庆节前业界的又一技术发布。
值得一提的是,智谱官宣GLM-4.6在寒武纪国产芯片实现FP8+Int4混合量化部署,为首套投产的该模式芯片一体方案,其基于vLLM框架,还可在摩尔线程新一代GPU原生FP8精度稳定运行。
《科创板日报》记者注意到,近期国产大模型与国产芯片的协同发展取得了一定突破,核心是 DeepSeek-V3.2模型的发布与国产芯片的"Day 0适配"(通常指在某个新系统、新平台、新设备或新功能正式发布的第一天(Day 0)就完成适配工作) ,以及智谱GLM-4.6模型与芯片的深度融合。
这标志着标志国产GPU具备与前沿大模型协同迭代能力,国产AI生态可能正从"可用"向"好用"演进。
GLM-4.6适配寒武纪、摩尔线程
智谱方面有关人士介绍,在公开基准测试和真实编程任务中,GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为目前国内最强的Coding模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越DeepSeek最新模型DeepSeek-V3.2-Exp。
作为开源模型,GLM-4.6目前是全球开源生态中性能最强的通用大模型之一。
在适配性方面,GLM-4.6已在寒武纪的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。
另外,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的优势。
GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。
近日,DeepSeek和智谱先后宣布推出新一代大模型,并宣布适配国内芯片。
9月29日,DeepSeek-V3.2-Exp大模型发布,华为昇腾、寒武纪、海光信息等多家芯片厂商即宣布完成适配。
华为昇腾基于vLLM/SGLang等推理框架实现0day支持,并开源全部推理代码与算子实现;寒武纪宣布已完成对DeepSeek-V3.2-Exp的同步适配;海光信息表示,其DCU实现对该模型的无缝适配与深度调优,展现出优异性能,验证了高通用性、高生态兼容性及自主可控的技术优势。
截至30日收盘,寒武纪报收1325元,微涨0.11%;海光信息报收252.6元,跌1.27%。
北京计算机学会AI专委会秘书长、北大人工智能博士张有鱼告诉《科创板日报》记者,过去是模型去适配芯片,而现在,大模型的算法创新正在反向定义下一代芯片的架构。这种‘软件定义硬件’的协同进化模式,是中国AI芯片实现‘换道超车’的真正机遇所在;其次,竞争的终局将从拼算力走向拼价值。 “随着国产化方案大幅拉低AI的使用门槛,算力成本将逐渐不再是企业应用AI的核心瓶颈。竞争的主战场将彻底转移到如何利用AI创造独特业务价值上,这将真正引爆千行百业的创新浪潮。”。
1/7价格享受Claude Sonnet智能
随着GLM-4.6的发布,智谱AI同步推出了一套“GLM Coding Plan”升级方案,其核心策略直指“极致性价比”,旨在重塑开发者与企业的AI成本结构。
《科创板日报》记者注意到,该方案的竞争力体现在以下几个层面:
首先在性价比方面,智谱打出“1/7价格享受到Claude Sonnet智能”的口号。其API价格仅为Claude Sonnet 4的1/21,套餐包模式将成本压缩至1.99元/百万Tokens的行业新低,降低了开发者的准入门槛。
其次,在与国产模型的对比中,尽管价格相近,但GLM-4.6在代码生成(SWE-bench准确率超70%)、Agent工具调用等关键能力上展现了领先优势,实现了“低价且高性能”的精准卡位。
此外,其企业版套餐在提供安全合规模块的同时,成本相较于Claude同级方案降低了95%以上,为企业规模化应用AI提供了选择。
对于本次GLM-4.6的这套组合拳,张有鱼表示,智谱的策略非常清晰,其‘1/7价格享受相似智能’的定位,本身就超越了单纯的价格维度。当前头部厂商的低价策略,其核心目标并非短期利润,而是长期的‘生态圈地’。
张有鱼认为,AI大模型竞争的终局,取决于谁能构建最繁荣的开发者生态和积累最高质量的应用数据。较低的API价格,正是实现这一战略目标、抢占未来生态制高点的有效手段之一。