6月15日,燧原科技即将上会。
若顺利过会,摩尔线程、沐曦股份、壁仞科技、燧原科技——“国产GPU四小龙”将首次在资本市场聚齐。
这是一个里程碑。过去数年间,地缘政治紧张,英伟达高端GPU一卡难求。国产算力供应链被迫加速成型:从EDA工具、光刻胶到芯片设计,从华为昇腾到四小龙,一条自主可控的算力链条正在缝合。
但挑战同样真实。英伟达市值已到5万亿美元区间,CUDA生态壁垒仍坚不可摧。国产GPU厂商不仅要“造出芯片”,更要“卖出芯片、用好芯片”。
不过,上市募资只是第一步,能否真正进入互联网大厂的万卡集群、能否支撑起中国大模型的推理需求、能否从“硬件突破”走向“生态构建”——这才是资本市场对“四小龙”真正的考验。
本土算力供应链加速成型
待国产GPU四小龙齐聚资本市场,行业或迎来资本全面加持周期,募集资金将赋能芯片研发、产线及生态建设,进一步缩小与海外龙头技术差距。
实际上,在地缘政治的影响下,本土算力供应链正在加速成型。
以目前的大模型本土龙头智谱为例,2月12日,智谱在官方公众号透露,其上线并开源 GLM-5,而且其已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。
值得注意的是,国产模型与国产算力全面适配后,其性能表现已不逊于海外厂商。
智谱称,GLM-5在昇腾上首次实现W4A8混合精度量化,可在Atlas800TA3单机部署,实测开箱性能对标H100双机,在长序列、低时延场景下部署成本减少50%。
有产业人士认为,这标志着国产大模型与国产芯片的适配性迈上新台阶,从底层技术层面打破了国产算力链条的应用壁垒。此外,燧原科技等本土GPU厂商的壮大,将完善国产算力全产业链,拉动EDA、制造、封测上下游协同,为大模型、AI应用提供自主算力基座,完善本土算力生态,打开行业长期增长空间。
本土算力链本身也在抢抓AI超级周期和供应链安全带来的巨大机会。
以EDA龙头广立微为例,2025年8月完成了对全球硅光PDA领军企业Luceda NV的收购。Luceda的下游客户主要包括光芯片与模块设计公司、集成器件制造商(IDM)和代工厂(Foundry)、云服务和算力厂商等。
之所以这么做,广立微解释称,过去几年,随着AI算力中心对高带宽、低功耗互连需求的爆发,硅光技术完成了从可插拔光模块到共封装光学(CPO)、光互连(OIO)的架构演进。随着CPO/OIO将光引擎与电芯片紧密封装甚至单片集成,光与电之间的耦合问题变得极为突出。光电协同设计(EPDA)工具和统一数据模型的需求日益迫切。
广立微与Luceda联手,聚焦光电融合场景需求,解决工具链破碎的问题,将光、电、热引入光电系统级设计和优化,解决CPO场景下的系统设计挑战。同时,致力于构建“设计—制造—测试—数据”新底座,使得设计感知制造,助力硅光实现规模化量产。
在半导体材料端,ArF与KrF光刻胶是逻辑、存储芯片制造的核心刚需耗材,属于国内晶圆光刻胶市场价值量占比最高的两大品类。
根据弗若斯特沙利文市场研究,中国半导体光刻胶市场规模增速高于全球半导体光刻胶市场规模增速,预计2029年中国ArF与KrF光刻胶市场规模将合计超100亿元。当前国内高端晶圆光刻胶供给仍由海外厂商主导,国产化率极低。
6月11日晚间,本土光刻胶龙头鼎龙股份自愿公告称,公司年产300吨KrF/ArF高端晶圆光刻胶产线自2026年3月20日投产后,已向两家头部晶圆厂客户交付数百加仑浸没式ArF及KrF光刻胶,并在客户量产产线顺利应用。因公司光刻胶产品性能稳定、使用效果良好,上述两家客户近期合计新增订单近1,000加仑。公司正积极提升产品交付速度,2026年上半年产品交付量预计显著提升,商业化进程显著加快。
鼎龙股份表示:“公司高端晶圆光刻胶业务近期订单持续落地,彰显了公司在技术实力、研发效率、供货稳定性等方面获得下游客户的高度认可。目前量产线产能稳步爬坡,产品交付能力持续提升,未来有望成为公司新的业绩增长极。”
支撑自主AI生态是关键
国产AI芯片的价值,最终要落脚到能否真正支撑起中国AI产业的发展。
客观而言,国内AI大模型随着2024年DeepSeek开源模型问世方开始突破,国内AI应用生态才开始大规模建立,因而国产AI芯片与算法和下游应用场景的适配尚不充分。
而四小龙上市带来的资金与资源赋能,将推动它们跨越单纯“卖硬件”的阶段,向“软硬协同的生态构建者”演进。
当前,国内能够实现AI大模型商业闭环的企业主要集中在字节跳动、腾讯、阿里巴巴等头部互联网平台——能否进入其供应链体系,对国内AI芯片企业的发展至关重要。
国产GPU“四小龙”在上市之前,普遍与互联网大厂形成了“资本+场景”的深度绑定。以燧原科技为例,腾讯科技(上海)有限公司自燧原科技成立之初的Pre-A轮起便开始投资,并持续参与了其后续的多轮融资,目前已成为其最大的机构股东。燧原科技也与腾讯深度合作,历时7年从单一场景小规模验证到多场景大规模验证,再到常态化批量合作。
随着IPO带来充裕资金,国产GPU厂商与大厂的合作正加速向大规模商业交付和收入转化迈进。在头部场景验证成功的基础上,厂商的工程化能力也将从单卡交付跃升至千卡、万卡级智算集群落地。
这种从“产品可用”到“集群大用”的跨越,正是国产算力自主化的关键。正如燧原科技在招股书中规划:未来,一方面,继续深化与互联网和大模型厂商的业务合作,通过极具竞争力的算力产品驱动更多国民应用,让算力走进千家万户;另一方面,积极拓展与大型运营商、国央企和产业伙伴的全面合作,打造标杆性的算力集群项目,并落地标志性的行业解决方案,依托自研国产算力产品,筑牢我国自主可控的算力基础设施核心底座,让算力赋能千行百业。
当前,算力中心的规模化建设,正迎来大模型从“训练”走向“推理”的应用拐点。
而随着AI大模型推理需求的提升,非GPGPU架构(即DSA架构)正加速部署:在推理阶段,AI芯片需要在功耗、成本和实时性等方面进行优化,由于DSA架构可针对特定模型所需算子进行优化定制,相较于GPGPU架构加速卡在针对特定场景或模型下有更好的适配性,在成本、性价比等方面具备优势。
这一架构演进正在重塑全球算力格局,正如燧原科技在招股书中所述,未来随着谷歌、亚马逊、META和微软等主要互联网厂商量产自研云端AI芯片产品(均为DSA架构)以及谷歌TPU产品逐步对外销售,预计英伟达全球市场的垄断地位将受到挑战。
在这一全球性的架构更迭浪潮中,国内阵营亦在加速崛起,华为海思、寒武纪与燧原科技等厂商已成为探索DSA架构的本土先锋。未来,国产GPU厂商的征途将不止于算力自主,更要走向全球竞争的主战场。