• 最近访问:
发表于 2025-10-11 07:54:42 股吧网页版
巨头打响“推理芯片战争”
来源:中国经营网 作者:顾梦轩 李正豪

  大语言模型已从研发走向应用,AI产业的重心也已经从训练阶段转向推理环节。今年以来,随着华为、英伟达和谷歌三大巨头相继发布各自的推理芯片,一场关于AI推理芯片的战争悄然打响。

  根据麦肯锡报告,全球AI推理市场规模预计在2028年将达1500亿美元,年复合增长率超40%,远高于训练市场的20%。

  南开大学金融发展研究院院长田利辉在接受《中国经营报》记者采访时指出,推理芯片将重塑人类生活,形成云端、边缘、终端三元共存格局,自动驾驶、智能摄像头、语音识别等应用将普及,真正实现“AI赋能千行百业”。

  三大巨头各显“神通”

  在今年9月的2025年华为全联接大会上,华为宣布了昇腾芯片的规划和进展。未来3年,华为开发和规划了三个系列,分别是Ascend950系列、Ascend960系列、Ascend970系列。据悉,华为AI芯片将以几乎一年一代、算力翻倍的速度,围绕更易用、更多数据格式、更高带宽等方向持续演进。

  同样是在今年9月,英伟达推出专为大规模上下文处理设计的GPU——RubinCPX,预计于2026年年底上市。

  今年4月,谷歌在Google Cloud Next 25大会上推出了其首款Google TPU推理芯片Ironwood。据了解,Ironwood根据AI工作负载需求提供两种尺寸:256芯片配置和9216芯片配置。后者总算力达到42.5Exaflops(百亿亿次),是ElCapitan超算的24倍,单芯片峰值4.614Exaflops。

  记者在采访中获悉,上述三家公司的推理芯片在技术路径与市场定位上呈现显著差异,在成本、效能以及应用场景中各有千秋。英伟达凭借CUDA生态与全场景适配能力稳居行业龙头,谷歌TPU以ASIC架构实现云端推理极致能效,华为通过集群技术与存储优化突破制程限制。

  在成本控制上,各家公司“各显神通”。星图金融研究院研究员张思远向记者指出,英伟达通过存储技术创新降低单位成本,华为依赖系统级优化分摊成本;效能表现上,谷歌在专用场景领先,英伟达全场景性能均衡。

  张思远向记者表示,华为通过UCM推理记忆数据管理器构建三级存储架构,避免重复计算,降低推理成本。但受限于制程工艺,单芯片硬件成本较英伟达产品更高,需通过规模化部署摊薄成本。谷歌聚焦于ASIC架构与云端规模化降本。

  “英伟达的推理芯片以强大的计算能力和成熟的CUDA生态系统著称,广泛应用于各种AI场景中。但其产品价格较高,增加了使用成本。”经济学家、新金融专家余丰慧向记者指出。

  在效能表现方面,张思远指出,英伟达全场景性能均衡,长上下文推理领先。华为的效能优势则体现在集群算力突破和行业场景深度优化。谷歌则通过HBM(高宽带内存)容量与互联带宽驱动云端效能。

  在应用场景方面,张思远表示,英伟达实现全场景覆盖,消费级与企业级并重。华为则聚焦国内行业,在国内政务、金融、医疗场景市场占有率较大,依托昇腾生态,参与多地智算中心建设,但海外市场拓展受限,消费级场景渗透率不足。

  对谷歌而言,张思远指出,谷歌以云端服务为主导,搜索与AI模型协同。其中搜索业务依赖TPU推理加速,Cloud业务提供Gemini推理服务,支持企业级MoE模型部署。但硬件仅通过云端开放,企业本地化部署需求难以满足。

  “谷歌的TPU以其高度定制化的硬件设计和出色的机器学习性能占据一席之地,不过,谷歌TPU的应用范围较窄,主要针对自家服务和特定合作伙伴。”余丰慧补充道。

  谈及华为推理芯片的发展状态,田利辉指出,华为实质上形成了“算力积木”架构,进而实现灵活扩展,成本效率平衡。

  行业规模将突破3000亿元

  推理芯片的发展将极大地促进人工智能技术在日常生活中的普及与深化。张思远指出,首先,推理芯片的发展可能带来效率革命,重构服务响应范式。推理芯片的能效提升将推动AI应用从“实验室”走向“日常生活”。例如,金融客服系统通过华为UCM技术实现通话分析时间从120秒缩短至10秒;医疗领域,推理加速方案使医学影像分析效率提升6倍,基层医院也能快速获取诊断支持。

  其次,推理芯片可能带来成本普降,降低AI应用门槛。例如,搭载国产推理芯片的AI学习机大量出货,使优质教育资源向三、四线城市渗透。

  “最后,可能带来产业升级,”张思远表示,推理芯片与边缘设备结合,推动消费电子形态革新。如AI眼镜通过低功耗推理芯片实现实时翻译、视觉识别,人形机器人依赖高能效推理芯片完成环境感知与运动控制。

  全球范围内,推理芯片正处于快速发展阶段,各大科技公司纷纷加大研发投入,试图在这一新兴市场分得一杯羹。

  中国推理芯片市场前景广阔,发展潜力巨大。中商产业研究院发布的《2025—2030年人工智能芯片行业市场调研及投资前景预测报告》显示,中国AI推理芯片相关产品及服务行业市场规模由2020年的113亿元增至2024年的1626亿元,期内复合年增长率为94.9%。中商产业研究院分析师预测,2025年中国AI推理芯片相关产品及服务行业市场规模将达到3106亿元。

  以华为为例,华为轮值董事长徐直军曾在全联接大会上公开表示:“有了昇腾芯片为基础,我们就能够打造满足客户需求的算力解决方案。从大型AI算力基础设施建设的技术方向看,超节点已经成为主导性产品形态,并正在成为AI基础设施建设的新常态。”“但仅有强大的单芯片远远不够,如何将成千上万张芯片高效地连接起来,形成一个协同工作的‘超级大脑’才是挑战。”诺安基金科技组基金经理刘慧影表示,为此,华为重磅预告了三款超节点产品,并面向超节点创新性地推出了“灵衢”全光互联协议,且宣传将其技术规范开源。这一举措被认为是算力互联领域的颠覆性的突破。据悉,“灵衢”采用光传输技术,可实现数据高速流转。更重要的是,基于超节点与该协议打造的Atlas950超节点,其算力水平在未来数年内有望保持全球领先地位。

  先进制程有待突破

  受访人士向记者表示,随着国家政策的支持以及市场需求的增长,本地企业也在积极布局该领域,如华为、寒武纪等企业已推出多款自研推理芯片,并在国内外市场上获得了一定的认可。然而,整体技术水平与国际领先企业相比仍存在一定差距。

  张思远指出,第一,在技术指标方面,制程与单芯性能仍有巨大进步空间。英伟达RubinCPX采用3nm制程,华为昇腾910B仍依赖7nm工艺,单芯片算力差距约3倍。第二,在生态建设方面,开发者生态壁垒显著。英伟达CUDA生态积累超15年,全球超400万开发者支持;华为CANN架构开发者数量突破50万,但工具链完善度仍需提升,部分企业因迁移成本高而选择继续使用英伟达方案。第三,在市场渗透方面,中国企业国际份额与场景覆盖不足,相比之下,英伟达推理芯片全球市场占比超70%,覆盖云厂商、消费电子等多领域。

  “中国芯片主要集中在国内政务、安防等toG场景,海外市场拓展缓慢,且高端消费级市场仍以进口为主。”张思远说。

  北京社科院副研究员王鹏表示,国产推理芯片在政企、安防领域的渗透率较高,但高端训练芯片与复杂模型支持能力不足。

  “中国芯片企业正通过‘应用场景驱动—数据积累—算法优化—芯片迭代’闭环加速追赶,本土品牌渗透率从30%持续提升,2025年市场规模将突破1530亿元。”田利辉说,一些国内企业正在探索存算一体和3Dmemory技术,未来将突破大规模集群互联瓶颈,实现从“跟跑”到“并跑”的跨越,真正成为全球AI基础设施的核心力量。

  萨摩耶云科技集团首席经济学家郑磊向记者表示,中国推理芯片正在从“可用”向“好用”阶段过渡,但在先进工艺、存储带宽、软件栈与极致性能场景上仍落后全球顶尖水平,下一步,行业需在RISC-V开源指令集、Chiplet国产封装线、AI编译器框架及行业芯片协同定义上加速迭代,方能真正与世界头部公司在同一梯队竞争。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500