9月24日,上海证券报记者从2025云栖大会现场获悉,目前阿里正推进3800亿元的AI基础设施建设,并计划追加更大的投入。阿里集团董事兼首席执行官吴泳铭称,对比2022年,2032年阿里云全球数据中心的能耗规模将提升10倍,这意味着阿里云算力投入将是指数级提升。
此举成为全球科技巨头竞相加码AI基建的又一重要动向。此前,英伟达、Meta、微软、谷歌等纷纷抛出“大手笔”的投资计划,推动AI基建迈入“超大规模”,折射出对未来算力需求的强烈预期。
在技术层面,超节点正成为本轮竞赛中的关键方向,阿里云、华为均于近期发布了相关产品。机构分析认为,超节点不仅提升算力规模,更通过系统级创新实现资源全局调度,将带来服务器、铜连接、液冷等产业链环节的投资机遇。
科技巨头打响AI基建竞赛
这并非阿里首次披露对于AI基建的积极态度。
今年2月,吴泳铭宣布,未来三年,阿里巴巴将投入超过3800亿元,用于建设云和AI硬件基础设施。他表示,AI爆发远超预期,公司将不遗余力地推进云和AI硬件基础设施建设,助推全行业生态发展。
回溯来看,全球多个科技巨头在年内抛出了关于AI基建的新计划。当地时间9月22日,英伟达与OpenAI宣布达成战略合作意向。通过此次战略合作,OpenAI将建成并部署至少10吉瓦的AI数据中心,配备数百万块英伟达GPU,用于构建下一代AI基础设施。为支持包括数据中心和电力容量在内的部署计划,英伟达将在新系统落地过程中向OpenAI投资至多1000亿美元。
此次合作虽然引发了市场对于英伟达、OpenAI、甲骨文之间“循环交易”的质疑,但其中透露出一个明确的信号:AI基建投资会继续维持高速增长。
当地时间9月18日,微软宣布将斥资40亿美元在威斯康星州建立第二个数据中心,此前其已在威斯康星州的芒特普莱森特建设一处投资约33亿美元的数据中心;当地时间9月5日,Meta透露,到2028年将累计投入至少6000亿美元,用于建设数据中心和人工智能基础设施;当地时间7月15日,谷歌宣布,将在未来两年内投资250亿美元用于数据中心和AI基础设施建设。
按照英伟达的预期,AI基础设施建设有望在未来五年均维持高速增长。英伟达高管此前在财报电话会上表示,预计到2030年末,AI基础设施支出将达到3万亿美元至4万亿美元。考虑到全球各地云服务提供商都在建设AI基础设施,“3万亿美元至4万亿美元”的预期在未来五年是相当合理的。
超节点成基建新常态
“把脉”当前AI基建的技术方向,超节点已经成为满足AI算力需求的主导性产品形态,正在这场竞赛中扮演重要角色。
所谓超节点,英文名为Super Pod,最早由英伟达提出,是一种通过系统级架构创新,将大量计算芯片紧密耦合为单一高速互连域的技术,旨在应对AI大模型参数规模不断增长所带来的算力需求。其核心是让多个计算单元能够像一个“巨型单机”那样协同工作,共享内存和带宽资源。
在2025云栖大会上,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片。
磐久超节点集成阿里自研CIPU2.0芯片和EIC/MOC高性能网卡,采用开放架构,扩展能力极强,可实现高达Pb/s级别Scale-Up带宽和百ns极低延迟,相对于传统架构,同等AI算力下推理性能还可提升50%。
谈及超节点,华为轮值董事长徐直军的判断是,其已经成为主导性产品形态,并正在成为AI基础设施建设的新常态。随着算力需求的持续增长,超节点的规模也在持续、快速增大。
在近日召开的华为全联接大会2025上,华为发布了最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡。基于超节点,华为同时发布了超节点集群产品,分别是Atlas 950 SuperCluster和Atlas 960 SuperCluster。
国新证券认为,超节点架构的核心在于,其“总线级互联”与“平等协同”机制,使得万卡集群在逻辑上能够作为一台统一的计算机高效运行,实现计算与内存资源的全局调度。华为在昇腾AI芯片与超节点技术上的突破,恰逢全球AI算力投资热潮。国产算力产业链借助华为的开放策略,在芯片制造、HBM封装、光通信及液冷温控等多个领域获得发展机遇,但核心挑战仍集中在生态成熟度层面。