近日,从央视“意外”曝光多款国产AI芯片与英伟达芯片的性能对比,到腾讯、阿里等多家互联网大厂表态已适配国产主流AI芯片,再到华为罕见公布其AI芯片三年迭代路线图,种种迹象表明,国产AI芯片正从星星之火逐渐燃成燎原之势。近年来,从技术突破到产业生态构建,国产AI芯片在性能、功耗以及应用场景上均取得了长足的进步。
国际投资研究机构伯恩斯坦发布的《2025中国AI芯片行业大报告》显示,中国国产AI芯片销售额将从去年的60亿美元猛增至160亿美元,市场份额从29%提升至42%,增速达112%。
多位产业链人士在接受《中国经营报》记者采访时表示,国产AI芯片已突破单点技术瓶颈,进入规模化应用与生态培育阶段。此阶段将加速产业链上下游协同,推动设计工具、IP核、制造工艺等配套环节完善,逐步构建自主可控技术体系,为后续技术迭代创造市场空间。体系化攻坚不仅能提升国产芯片竞争力,更会推动形成“设计—制造—应用”的闭环生态,为长期技术领先奠定基础。
从技术追赶到多元突围
中国联通三江源绿电智算中心项目的签约名单,呈现出国产算力生态的“协作图谱”——阿里平头哥、沐曦股份、壁仞科技、中昊芯英、太初元碁、燧原科技、摩尔线程等多家国产 AI 芯片企业均在列。
其中,央视《新闻联播》相关报道特别提到了“国产卡与NV卡(英伟达AI算力卡)重要参数对比”。阿里平头哥的 PPU(Parallel Processing Unit,并行处理器)芯片,其每秒运算次数达到与英伟达高端AI芯片相近的水平,而在能效比这一关键指标上,其更是凭借先进的制程工艺和架构设计,实现了对英伟达部分产品的超越。此外,在内存带宽和延迟控制上,PPU芯片也通过独特的优化策略,有效降低了数据传输的瓶颈,提升了整体系统的运行效率。
实际上,国产AI芯片的突围从未陷入“参数对标”的陷阱,而是通过架构创新与场景绑定,在英伟达主导的市场上开辟出多元赛道。这种突破轨迹可追溯至2015年的技术探索期,但真正的质变发生在2018年后,当国际巨头强化算力壁垒时,本土企业转而在计算效率、垂直场景适配等维度构建优势。
也是在2015年,阿里成立平头哥半导体有限公司,百度启动昆仑芯研发项目,华为发布昇腾910芯片,头部科技企业入局为国产AI芯片产业注入动力。与此同时,政策支持力度逐步加大,国家集成电路产业投资基金(大基金)重点布局AI芯片领域,壁仞科技、沐曦股份、燧原科技等具备核心技术的初创企业相继成立,形成了“头部企业引领、初创公司攻坚”的协同攻关产业梯队。此阶段,国产AI芯片企业从“技术跟随”转向“路线创新”,在GPGPU(通用图形处理器)、存算一体、超异构等技术方向展开探索,尝试摆脱对国际主流技术路线的依赖。
经过多年积累,国产AI芯片企业在多个领域取得突破,呈现出“百花齐放”的发展态势。例如寒武纪旗舰产品思元590的性能已对标英伟达A100芯片,综合性能约为A100的80%—90%,成为国内数据中心核心算力器件供应商。亏损8年的寒武纪也实现扭亏为盈。其2025年半年度报告显示,寒武纪上半年营业收入28.81亿元,同比增长4347.82%;归属于母公司所有者的净利润10.38亿元,上年同期净亏损5.3亿元。
在技术创新路径上,国内人工智能芯片制造商表现出显著的创新力。摩尔线程采纳了全功能GPU的技术路线,其产品广泛应用于人工智能计算加速和图形渲染等多个领域;沐曦股份专注于高性能GPU的研发;壁仞科技则以GPGPU技术著称;燧原科技则致力于云端人工智能训练与推理技术。
天使投资人、人工智能领域专家郭涛认为,国内企业同步布局GPGPU、专用ASIC、可编程FPGA及类脑计算等多技术路径,精准匹配云计算、边缘推理、车载终端等差异化需求。分层策略既规避了与英伟达在通用市场的正面交锋,又通过垂直领域深耕建立局部优势。例如寒武纪聚焦通用架构灵活性,壁仞科技强化云端算力密度,地平线深耕车规级能效比。差异化竞争模式更易在细分市场实现单点突破,长期看有利于形成互补性技术集群,推动国产芯片在多元场景中构建核心竞争力。
“集群式”突围
在单卡能力不及英伟达的情况下,超节点和集群成为国内企业实现弯道超车的重要方向。
超节点最初由英伟达公司提出。该技术通过系统级架构的创新,实现了大量计算芯片的紧密集成,形成一个单一的高速互联域。其目的在于满足人工智能领域中,随着大模型参数规模的持续增长而日益增加的计算需求。其核心理念在于使多个计算单元能够协同运作,仿佛一个“巨型单机”,从而实现内存和带宽资源的共享。
国家超级计算广州中心主任卢宇彤表示,在复杂的混合并行策略下,随着并行规模持续扩大,系统节点间通信带宽与可用显存容量成为制约大模型可扩展性的瓶颈,急需计算架构创新以满足未来更大规模模型训练的需求。超节点架构突破传统互联瓶颈与共享协议限制,不断突破系统性能上限,成为多样化算力集群技术未来演进的必然趋势。
然而,英伟达还在构想的事,在中国已经实现商业化。目前华为Cloud Matrix 384超节点已累计部署300多套,通过超节点架构将多颗GPU芯片高效互联,形成计算资源池,能够在保持系统灵活性的同时,大幅提升整体算力。而集群技术则进一步将计算资源扩展至数据中心级别,实现数千乃至上万颗GPU的协同工作,满足超大规模人工智能训练和复杂科学计算的需求。这种“集群式”突围策略,不仅能够有效弥补单卡性能的不足,更能在特定应用场景中展现出比肩英伟达的竞争力。
在刚刚结束的“2025云栖大会”上,阿里云推出了全新一代磐久128超节点AI服务器。其最突出的特征是单柜支持128个AI计算芯片,这一密度指标刷新了业界纪录,意味着同等机房空间内可部署的算力规模较传统方案提升了3倍以上,能高效支撑万卡级集群部署,精准匹配千亿参数大模型的训练需求。
而“华为全联接大会2025”上,华为也推出最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡。基于超节点,华为同时发布了超节点集群产品,分别是Atlas 950 SuperCluster和Atlas 960 SuperCluster。
此外,百度昆仑芯、沐曦股份、壁仞科技等厂商也发布了超节点方案。
对于超节点,华为轮值董事长徐直军直言:“我们认为只有依靠超节点和集群,才会规避中国的芯片制造工艺受限,能够为中国的AI算力提供源源不断的算力支持和供给。”
北京社会科学院副研究员王鹏表示,华为的三年迭代规划首次将前沿技术(如晶圆级芯片、存算一体架构)纳入量产路径,与英伟达形成代际竞争。这预示着中国将在未来三年内构建覆盖通用芯片与专用芯片的完整谱系,通过“研发—储备—释放”的代际接力,实现技术代差追赶。
大厂联手重塑产业生态
除了芯片性能的提升外,当前大厂、芯片厂与运营商之间正在开展深度协同的新型产业合作模式,这种合作模式正从根本上重塑国产AI芯片产业的发展逻辑,推动产业从“单点突破”向“生态共赢”转变。近期,多家互联网巨头表态正积极适配国产AI芯片。
日前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“我们正与多家国产芯片厂商合作适配各种AI模型,因为模型规模有大有小,从数十亿到上百、上千亿参数,不同场景所需的芯片配置不同。我们专注于软件和模型研发,以开放心态与各家芯片厂商协同,在不同场景中选择最合适的硬件、模型和工具。”
阿里巴巴CEO吴泳铭在财报会议上透露,面对全球AI芯片供应的不确定性和政策变动,阿里已采取“后备方案”,与多家合作伙伴携手构建多元化的供应链储备,以确保业务的稳健发展。
DeepSeek近期发布的V3.1模型也进一步强化了混合推理能力与国产芯片适配性,其在官方公告中明确提到,V3.1采用的“UE8M0 FP8”精度格式,是专门为“即将发布的下一代国产芯片”定制的。
王鹏认为,互联网巨头的适配表态与采购决策,证明国产芯片已通过“训练—推理”混合架构满足实际业务需求。这种“技术突破驱动场景验证,场景验证反哺资本投入”的模式,正在推动国产芯片在垂直领域(如智慧城市、工业质检)形成市场优势,构建起“可用—好用—必用”的良性循环。