7月29日晚间,“AI六小虎”的“老大”智谱AI官方发布紧急致歉声明。
因GLM-4.5模型上线后用户需求激增,智谱清言、z.ai及开放平台BigModel均出现响应延迟、任务中断等问题,原定的50元包月限量活动亦因服务器资源不足受到影响。
智谱团队承诺“全力增加机器资源”,并为用户提供临时方案——已购券用户服务延期一周,新用户可先试用轻量版GLM-4.5-Air模型。
这场突如其来的“泼天富贵”和“甜蜜负担”,源于7月26日-28日世界人工智能大会(WAIC) 2025所带来的“AI春晚”效应。
WAIC看得见的“硝烟”
7月28日晚,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与 ModelScope平台同步开源。
智谱方面称,GLM-4.5在包含推理、代码、智能体的综合能力达到开源SOTA(State of The Art,指最新发布的、性能超越现有模型的先进技术或产品),在真实代码智能体的人工对比评测中,实测国内最佳。
此外,GLM-4.5的参数效率是DeepSeek-R1的2倍、Kimi-K2的3倍;API(应用程序编程接口)调用价格低至输入0.8元/百万tokens,输出2元/百万tokens,是Claude的1/10。
由此,发布会后24小时内,GLM-4.5在OpenRouter全球模型调用量榜单飙升至第20位,用户涌入导致服务器过载。
WAIC 2025已成为大模型公司的“军备竞赛场”。
智谱GLM-4.5以“原生智能体”为核心理念,首次在单模型中融合推理、编码与智能体能力。其宣称在12项基准测试中综合得分全球第三,仅次于OpenAI的o3模型与马斯克旗下人工智能初创公司xAI推出的Grok 4;且是国产模型和开源模型双第一。
在真实场景方面,GLM-4.5在工具调用可靠性和全栈开发任务完成度上超越阿里巴巴(09988,以下简称阿里)的Qwen3-Coder与月之暗面的Kimi-K2。
实测中,GLM-4.5可生成交互式B站(09626)页面、实时搜索引擎、PPT乃至Flappy Bird游戏等,表现不俗。
但智谱并非“一枝独秀”,在WAIC前后,同行们扎堆发布或开源模型。
7月中下旬以来,阿里接连开源多个模型,包括开源视频生成模型通义万相2.2、千问3最新版基础模型(非思考版)、千问3推理模型(Qwen3-235B-A22B)以及AI编程模型Qwen3-Coder等。
海外知名模型API聚合平台OpenRouter数据显示,阿里通义千问API调用量暴涨,前段时间已突破1000亿Tokens。截至7月25日,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。
国内大模型“六小虎”之一阶跃星辰则在7月25日发布Step-3多模态推理模型,采用MoE(混合专家模型)架构,总参数量321B,激活参数量38B。同时,阶跃星辰还宣布获上海国投等机构超5亿美元融资。阶跃星辰CEO姜大昕在WAIC上还立下了2025年“10亿元年营收”的“军令状”。
此外,月之暗面展出其主力模型Kimi-K2,主打代码能力和Agentic任务处理,宣称其达到推理模型SOTA。
MiniMax也在WAIC上携MiniMaxAgent、Hailuo(海螺)AI、MiniMaxAudio、星野等多款旗下AI原生产品亮相,还展示了其热门的AI智能硬件产品和生态应用。
“五小虎”欲回舞台中央
年初DeepSeek横空出世后,其余的大模型厂商,尤其是“AI六小虎”们都沉寂了一段时间。
DeepSeek-R1证明“后发可超车”,迫使“六小虎”压缩研发周期。月之暗面K2本欲年中发布,反被DeepSeek逼出“残血版”K1.5;智谱GLM-4.5原计划对标Claude 4,却因月之暗面K2突袭被迫加训。模型战争从“重参数”转向“拼首发”,错失时间窗口即丧失市场声量。
“AI六小虎”曾被视为对抗大厂的核心力量,如今却深陷分化困局,WAIC 2025参展的也仅剩智谱、阶跃星辰、MiniMax、月之暗面四家。
智谱作为“国资宠儿”,也是“AI六小虎”中为数不多在DeepSeek冲击波后、仍能持续融资的。2025年,智谱连获杭州、珠海、成都国资及浦东创投累计超28亿元战投,估值冲至400亿元。4月,智谱还传出IPO(首次公开募股)消息,或将成“AI六小虎”中的上市首舰。
但光鲜背后,暗流难免涌动。
年初,智谱首席战略官张阔离职;之后,负责应用AI与合作副总裁李惠子、负责商业化的COO张帆等多名高管离职,商业化压力倒逼其CEO张鹏将业务从垂直行业转向地域扩张。
MiniMax也在6月传出港股IPO消息。其视频生成模型Hailuo 2在海外爆红。点点数据显示,仅在7月22日,其单日下载量就达到11万。
“AI领域一定会有多个玩家持续存在。”在WAIC首日的主题演讲上,MiniMax创始人、CEO闫俊杰说。
此外,月之暗面也在收缩战线,从2024年豪掷数亿元营销的“投流王”,转向深耕代码等场景;百川智能在多位联合创始人离职后,转向医疗垂类场景;零一万物放弃基座模型研发All in To B,在WAIC现场发布与光环云合作的“法律智算综合云服务”。
2024年前,“AI六小虎”融资额轻松过亿,但如今投资人转向确定性标的。例如,智谱目前的重心从基础研发转向定制化项目,而这类“苦力模式”利润微薄且难标准化。OpenAI近期还“酸酸”点名智谱“在印尼、越南推进主权大模型”,印证智谱“国家队”背景。
“(做基础大模型)是一件非常艰苦的事情,而且投入也非常大……每一轮的技术迭代,都会有部分公司掉队。”阶跃星辰CEO姜大昕在会上发言,点出了目前AI行业的残酷现状。
半年多的“奋发图强”,WAIC 2025让如智谱这样的“AI五小虎”短暂重获关注。但要重回“舞台中央”,并不是“单枪匹马”就能说的算的。