在过去讲了多年的AI云、AI Native云的阿里云,这次首次将Agentic Native云的位置提到了同一高度。
5月20日,阿里云在峰会上围绕"芯片-云-模型-推理"做出全栈Agent化升级,同步推出一系列密集的新产品,包括新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。
这次的变化核心在于,Agent正在成为云资源的新“用户”,其能自动开通沙箱、部署服务,独立调用云计算资源。在面向界面新闻在内的媒体采访中,阿里云资深副总裁刘伟光举例说,Minimax等客户此前在一天之内就完成了过去需要人干两周的云计算资源开通工作,这意味着云计算进入Agent“自动驾驶”时代。
几乎在同一天,谷歌I/O大会同样聚焦Agent与基础设施重构,大厂的思路几乎趋同,Agent将主导未来计算,同时发展全栈AI能力已经成为共识。
“龙虾”所代表的AI Agent热潮出现后,云厂商的变化比过去任何时候都要来得迅猛。界面新闻获悉,在过去5个月时间里,阿里云大模型MaaS(Model as a service,模型即服务)市场的日均Token收入增长约15倍。与此同时,阿里最新财报显示,包含百炼MaaS平台在内的AI模型与应用服务ARR(年度经常性收入)已超过80亿元,预计年底突破300亿元。
刘伟光表示,当智能体突破临界点后,对AI和云的需求将是无穷尽的,云厂商需要为此提前准备。
阿里云过去强调“云芯模”一体化,今年云峰会上其进一步展示了全栈协同策略。刘伟光向界面新闻解释称,今天客户最终得到的是模型能力、芯片能力和云能力的组合,三者必须有机结合,没有芯片环节的支撑,谈性价比和开放云是不够扎实的。
阿里旗下半导体公司平头哥首次公布了未来两年的芯片路线图(Roadmap),明确未来两代芯片新能提升方向,目标在于增强大模型训练与推理效率。
平头哥新一代AI芯片真武M890,144GB显存,800GB/s片间互联带宽,性能是上一代的三倍。2027年计划推出V900,和2028年推出J900,将保持一年一代的节奏。平头哥副总裁高慧透露,Agentic时代,一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPU、GPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是希望实现算力、网力、存力的系统级协同,让Agent都能流畅、稳定运行。
高慧同时披露,截至今年4月,平头哥真武系列AI芯片累计出货56万片,服务20多个行业、400多家客户。
当前,因全球AI需求爆发、出口管制受限,国产算力迎来发展的关键窗口期。国际调研机构IDC数据显示,2025年中国加速服务器(AI芯片)市场总出货量达到约400万张,其中英伟达仍然是第一出货约220万张卡,但国产芯片出货量已经达到165万张,国产AI芯片市场份额持续提升至41%,其中平头哥在国产厂商中排名第二。
国产芯片快速增长的逻辑在于,今天算力已经变成了强卖方市场,而国产厂商通过算法创新与工程优化,有机会实现更高的性价比。
所谓“性价比”,刘伟光对界面新闻记者强调称,同样的集群、同样的芯片,能不能跑出比别人更多的高质量Token。他的判断是,别的平台用千问开源模型跑,一定跑不过百炼,因为阿里云的工程团队和模型团队本来就是一家,每天在一起做优化。这种软硬协同的壁垒,短期内很难被复制。
这次激进升级之后,由Agent驱动的MaaS收入将取代ECS成为阿里云最大的产品线。一位接近阿里云的人士向界面新闻表示,阿里云在中国大语言模型(LLM)市场中Maas收入已排名第一。
收入增长来源于Token的价值变化。去年底,刘伟光拜访了几百家客户,回过头来看,前两年模型能力有限,企业不会为AI付很多钱。但到了2025年,Coding能力的出现成为一个巨大的分水岭。
模型不再只是提效工具,而是开始做人类做不了的工作,因此当AI从“成本项”向“生产资料”的转变,企业愿意为它单独列一笔预算,Token支出占比自然提升。
刘伟光判断,对于AI原生创业公司,今天模型调用的支出占比可能接近100%。对于互联网企业,目前大约在15%到20%。传统企业还在5%以下,但增长很快。
对于利润率,刘伟光确认MaaS业务已经有利润了,并且从第一天定价开始就是盈利的。未来,阿里云的收入和利润增长将主要来自三个因素:
一是MAAS服务,即基于模型调用的公共云收入,利润率高于单纯卖算力卡。
二是私有部署市场,为企业客户提供本地化模型部署方案,拓展增量空间。
三是由Agent Cloud带动的传统云增长,每个Token消耗背后对应等比例的CPU、存储、网络资源使用,形成“1个GPU带来1个CPU”的联动效应,拉动整体云收入。
围绕AI,阿里云内部考核指标也在调整,不看绝对的Token调用量,而是看三个指标:付费Token客户数的日增长、核心系统接入模型的数量和效率,以及智能体在企业内部自主完成任务的闭环效率。
这背后,阿里云的销售体系也面临紧迫转型。刘伟光向包括界面新闻在内的媒体表示,过去,阿里云的销售主要跟客户的IT部门打交道,卖的是服务器、数据库、存储,一线销售看到客户线下有多少台服务器,就能大致算出收入。
但现在做MaaS,答案是不确定的,销售需要跟业务部门聊,跟CEO聊,了解他们怎么编程、怎么做市场营销、怎么优化生产线。阿里几千人的销售团队,都要打破自己过去的作业方式,去挖掘客户那些过去从未被触及的需求。在组织架构上,阿里云开始设立专门的MaaS销售岗位。
去年底刘伟光曾提出,阿里云要拿下2026年中国AI云市场增量的80%。他认为,在大语言模型推理市场,阿里云已经拿到了大部分增量。过去在金融、汽车、政务、运营商的存量客户积累,以及覆盖全国的销售网络,是实现这一目标的基础。
不过,这场全栈重构能否被市场接受,还需要时间验证。界面新闻了解到,由于性能差距客观存在,供应链上游持续涨价,今天很多国产芯片从芯片到Token的“经济账”仍是打不平的,阿里云所说的“性价比”要如何提升,还有大量工作要做。
此外,界面新闻从行业人士处获悉,不光是阿里云,整个市场的算力供给,处于供不应求的状态,这些算力供给该如何平衡,优先分给哪些业务和客户,仍然是大厂内部需要花精力去平衡的事情。