9月18日,华为全联接大会2025在上海开幕。会上,华为展出的一整面机柜“墙”吸引了与会人士争相合影,这就是近期备受资本市场和产业界关注的昇腾384超节点。
今年的全联接大会上,华为宣布超节点再升级,“超节点集群”正式亮相,算力规模可达百万卡。这不仅是华为自身算力版图的重要突破,也预示着全球AI算力基础设施进入一个全新的时代。
从超节点到超节点集群
当前,人工智能产业正以前所未有的速度迅猛发展。“模型技术持续突破,AI正快速地从内容生产走向自主行动。推理爆发式增长,中国日均Token消耗量已经超过30万亿,Agentic AI正在从‘被动工具’向‘主动代理’快速演进,逐步进入规模化应用。预计未来5年,80%的人类每天将与智能体互动,所有行业都值得被AI重新定义。”华为董事、ICT BG CEO杨超斌在华为全联接大会2025的昇腾AI人工智能产业峰会上表示。
智能时代算力需求爆炸式增长,对算力有效性和时延的要求不断提升。通过计算系统架构创新,整合算力芯片资源,在一个超节点内构建超大带宽、超低时延的算力实体,支撑千亿乃至万亿参数模型的训练和推理,成为AI基础设施建设的方向之一。
华为、英伟达等是较早布局超节点技术的代表厂商。今年3月,华为正式推出了Atlas 900超节点,开启了华为AI超节点的征程。目前,Atlas 900超节点已经被部署到互联网、电信、制造等多个行业。
其中,华为云基于Atlas 900超节点构建了CloudMatrix 384超节点。据华为云CTO张宇昕表示,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云昇腾AI云服务基于CloudMatrix 384超节点,让通用计算、智能计算通过全新高速网络MatrixLink进行对等全互联,形成一个灵活实现算力配比的异构算力系统。
目前,已有一些上市公司参与到超节点的部署中来。例如,近日,商汤大装置SenseCore与昇腾384超节点合作创新,在功能、性能验证上达到预期目标,在调度优化、系统稳定性及故障恢复等方面取得多项技术创新突破。
美的集团首席信息安全官(CISO)兼软件工程院院长刘向阳在华为云AI峰会上发表主题演讲时提到,美的已成功将多个大模型迁移适配到昇腾平台上,持续从超节点获取澎湃通算、智算资源。
此次大会上,华为推出基于灵衢和超节点架构的全新产品,包括全液冷数据中心AI超节点Atlas 950 SuperPoD、企业级风冷AI超节点服务器Atlas 850和Atlas 860、AI新一代标卡Atlas 350、业界首个通算超节点Taishan 950 SuperPoD等。此外,基于超节点,华为发布了“全世界最强算力集群”——Atlas 950 SuperCluster和Atlas 960 SuperCluster超节点集群,算力规模分别超过50万卡和达到百万卡,拉开算力“百万卡”时代的序幕。
从IDC迈向AIDC
驱动算力效能再升级
AIDC成为智算时代关键的基础设施。“我们正站在人工智能技术革命的关键节点,我国AI算力需求正以惊人速度增长。这种爆发式增长带来了前所未有的机遇,也对数据中心的基础设施建设提出了全新挑战。”全球计算联盟理事长、华中科技大学教授金海在首届AIDC产业发展大会上说。
在中国电子技术标准化研究院副院长陈大纪看来,AIDC发展面临着四大挑战,包括容量规划的压力和不确定性,弹性功率冲击配电与制冷系统,快速交付与弹性需求多变等之间存在矛盾,以及运营管理转型能力不足。
这些问题的解决需要系统性的指引,业界已有所行动。9月17日,首届AIDC产业发展大会预发布了针对AIDC建设的系统性标准文件——《AIDC基础设施规范》。会议期间,华为发布了《AIDC机房参考设计白皮书》,为AIDC机房规划与建设提供了系统化的设计思路与建设方案的参考。
此外,散热成为AIDC行业所面临的共同难题。杨超斌用一组数据进行了说明:底层处理器作为算力的核心,当前主流处理器热流密度已达到150瓦每平方厘米,预计未来几年,每个处理器表面的热流密度将会超过200瓦每平方厘米。以电热水壶进行比较,当前主流AI芯片的热流密度已达电热水壶的15倍、未来会超20倍。
“50kW以上单机柜的功耗必然要寻求液冷,未来高密度的整机柜液冷技术路线是笃定和确定的。”中国电子工程设计院股份有限公司数据中心事业部副总经理王志强认为,因风散热存在的物理局限,未来液冷解决高密散热是一个必然趋势。
杨超斌认为,面对当前液冷机房建设的挑战,业界需要协同产业链,加快液冷机房的产品化与标准化,加速AIDC的部署与使用,共同推动AI产业发展。华为集群计算总经理朱照生介绍了华为在液冷工程化交付方面的实践经验。他提出,通过土建与大机电先行、推进小机电标准化与产品化,实现算力设备快速部署与算力设备“0”等待。