智谱发了国内最好的编程模型,国产芯片赛道迎来又一利好消息!
9月30日,国产大模型独角兽智谱发布新一代大模型 GLM-4.6,代码能力全面进阶。作为GLM系列的最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升,整体性能超越DeepSeek昨日发布的最新模型DeepSeek-V3.2-Exp。尤其是在高级编码能力方面,在公开基准与真实编程任务中,GLM-4.6的代码能力对齐全球领先的Claude Sonnet 4,是国内已知的最好的Coding(编程)模型。
值得注意的是,DeepSeek昨日发布最新模型DeepSeek-V3.2-Exp,华为、寒武纪、海光信息等AI芯片厂商纷纷宣布已适配DeepSeek-V3.2-Exp。继DeepSeek-V3.2-Exp之后,智谱GLM-4.6也适配寒武纪与摩尔线程芯片,业内人士分析称,国产大模型与国产芯片协同正加速进入新阶段,朝着软硬协同的统一生态演进,国内AI产业的发展有望进一步加速。
对标全球领先模型,编程能力再进阶
9月30日,国内大模型独角兽智谱正式发布并开源新一代大模型GLM-4.6,在Agentic Coding(智能体驱动编码)等核心能力上实现大幅跃升。
据智谱介绍,在AIME 25、GPQA、LCB v6等八大模型通用能力的评估中,GLM-4.6在大部分权威榜单表现对齐全球领先的Claude Sonnet 4,成为目前国内最强的Coding模型。

为了测试模型在实际编程任务中的能力,在Claude Code环境下进行的74个真实场景编程任务测试结果显示,GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。
同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越DeepSeek昨日发布的最新模型DeepSeek-V3.2-Exp。具体来看:
上下文长度:上下文窗口由128K提升至200K,适应更长的代码和智能体任务。
推理能力:推理能力提升,并支持在推理过程中调用工具。
搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。
写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。
此外,GLM-4.6还大幅提升了tokens效率和原生Agent体验。在平均tokens消耗上,GLM-4.6低于多个模型,与GLM-4.5相比,GLM-4.6在同类任务中可节省30%以上tokens消耗。在原生Agent体验上,相较于GLM-4.5,GLM-4.6进一步提升了PPT的可用性、前端代码的美观度与更先进的版面布局。
目前GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope同步开源,遵循宽松的MIT开源协议。作为开源模型,GLM-4.6目前是全球开源生态中性能最强的通用大模型之一,进一步提升了国产大模型在全球竞争格局中的地位。
适配寒武纪和摩尔线程芯片,国产芯片迎利好
智谱新一代大模型不仅实现了编程能力的再进阶,同时也加速了国产AI软硬件的生态协同,让国产大模型与国产芯片进一步实现了“双向奔赴”。
智谱官方宣布,GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型—芯片一体化解决方案。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。
与此同时,另外一大国产芯片厂商摩尔线程也基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势。
寒武纪与摩尔线程完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务,释放更广泛的社会与产业价值。
值得注意的是,昨日DeepSeek发布了最新模型DeepSeek-V3.2-Exp,随后包括华为、寒武纪、海光信息等在内的多家国产芯片企业迅速宣布完成了模型适配工作。今日,智谱GLM-4.6发布后亦与国产芯片公司实现“火速适配”。在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度协同。国产大模型与国产芯片协同正加速进入新阶段,朝着软硬协同的统一生态演进,国内AI产业的发展有望进一步加速。
此外,智谱已于今年4月14日启动A股上市辅导,有望冲击“国产AI大模型第一股”,标志着中国AI大模型从技术竞赛迈入商业化落地与资本化运作的阶段。未来,国产原创的GLM系列大模型与国产芯片的深度协同,将在模型训练和推理环节持续推动性能与效率的双重优化,构建更加开放、可控、高效的人工智能基础设施。
延伸阅读
