• 最近访问:
发表于 2026-06-05 13:39:00 股吧网页版
Step 3.7 Flash冲上海外热榜 智谱、MiniMax同台竞速 阶跃星辰高光背后仍需补齐生态欠账
来源:每日经济新闻

  发布仅一周时间,阶跃星辰最新开源基座模型Step 3.7 Flash冲上海外热榜,拿下了海外大模型评测平台Artificial Analysis多个第一。4日,阶跃星辰在其官方微信公众号公布了这一消息。

  《每日经济新闻》记者注意到,在Artificial Analysis的Output Speed(输出速度)榜,Step 3.7 Flash以409 Tokens/s(词元/秒)位列主流模型第一,同时在端到端响应时长(End-to-End Response Time)、智能效率(Intelligence vs.Output Speed)与速度价格比(Output Speed vs.Price)等关键指标上均处于领先位置。此前,在该模型发布2天后,Step 3.7 Flash还登上OpenRouter Trending全球第二位,成为近期全球开发者社区最受关注的开源模型之一。

  然而,高光之下,“百模大战”的持续压力同样清晰:Step 3.7 Flash发布同期,与阶跃星辰同为“AI六小龙”的智谱已提前推出同速率高速API(应用程序编程接口);6月1日,MiniMax携百万上下文新一代通用模型M3强势卡位。

  快思慢想研究院院长、特邀评论员田丰在接受《每日经济新闻》记者采访时表示,Step 3.7 Flash的推出是阶跃星辰在效率基础设施这一细分赛道建立了可验证的技术信号,但尚未形成可防御的差异化护城河。“相较于智谱、MiniMax等竞争对手,阶跃星辰处于‘滞后’位次。”田丰说,“滞后指的是在产品触达层与开发者生态仍存在系统性空缺,而非模型技术本身的落差。”

  Step 3.7 Flash速度抢眼,但规模化生产采用仍存不确定性

  “模型竞争正在从单纯追求峰值智能,转向追求单位成本下能够持续交付多少有效智能。高效率Flash(通常指轻量、快速、低成本的模型版本)模型或将不再是旗舰模型的补充,而会成为AI(人工智能)生产化时代最重要的基础模型形态之一。”阶跃星辰如此解释其对Flash模型的押注。

  Step 3.7 Flash自5月29日正式发布并开源。据官方介绍,Step 3.7 Flash采用稀疏MoE架构,总参数196B+1.8B(ViT),激活参数仅11B,在模型能力、推理成本与执行效率之间实现更优平衡。与此同时,最高生成速度达400 Tokens/s,适合高频、多轮、低等待的Agent(智能体)应用。

  速度确实抢眼,但正如阶跃星辰自述,Step 3.7 Flash追求的不仅仅是“更快”或者“更便宜”,而是成为一款真正“面向生产级Agent的高效率模型”。在阶跃星辰看来,随着Agent从Demo走向真实生产环境,模型不只要回答问题,更要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮任务中持续保持执行轨迹。这对底层基础模型提出了完全不同的要求,同时,模型能力的关键指标正在发生变化。

  为此,Step 3.7 Flash面向生产级Agent优化了四大能力:原生多模态理解执行,可识别图表、软件界面、驾驶面板并拆解实操步骤;联网与视觉搜索增强,搭载图像与全网检索能力,不确定信息自主交叉核验;高稳定性工具调用与编排,支持浏览器、终端、办公软件等66类工具连贯调用;全生态适配主流Agent开发框架,兼顾云端商用与本地轻量化部署。

  在“好用”这一维度上,阶跃星辰亮出的“成绩单”显示,其中在τ²-bench Telecom(陶平方基准中的电信客服评测领域)的低、中、高三档推理难度下通过率均达到98%以上。

  对于这一高分表现,田丰在接受《每日经济新闻》记者采访时解读称,τ²-bench测试(一款面向大语言模型对话智能体的评测基准工具)作为目前最贴近生产级Agent场景的工具调用基准之一,测试的是模型在用户、工具、数据库三方交互中的一致性与抗错能力,98%得分确实具有参考价值。

  但他也泼了“一盆冷水”:τ²-bench的测试集中于零售、航空、电信等结构化领域,现实Agent工作流中的长尾场景(非结构化API、动态上下文切换、多工具串联失败恢复)覆盖不足;此外,Step 3.7 Flash虽然在发布2天后登上OpenRouter Trending全球第二位,但数据显示,Step 3.7 Flash发布一周内周Token消耗达566K,属于中等活跃水平,尚不足以判断规模化生产采用。

  在他看来,更需要关注的信号是,未来Step 3.7 Flash能否在OpenRouter榜单中稳定排名前列,并维持数月的调用增长曲线。

  智谱、MiniMax贴身角逐,阶跃星辰破局关键不在速度而在生态

  就在阶跃星辰为Step 3.7 Flash的登顶而收获关注时,智谱与MiniMax在同一时间窗口内相继出牌,持续的“百模大战”压力也映照出阶跃星辰高光之下的阴影。

  一方面,推理速度正日益在成为行业标配,而非差异化优势。5月22日,即阶跃星辰发布Step 3.7 Flash一周前,智谱已面向部分企业客户推出GLM-5.1高速API“GLM-5.1-highspeed”,在保留旗舰基座能力的前提下,输出速度同样达到400 Tokens/s。一周时间,两家国产大模型公司均创下几乎同一速度纪录。田丰指出:“这说明400 Tokens/s已成为当前推理系统工程的技术收敛点,而非阶跃星辰的独立优势。”

  事实上,速度赛道也从不缺少追逐者,Flash产品路线正在迎来行业的集结。例如,近期受到广泛关注的DeepSeek-V4系列模型,同时推出Pro和Flash两条产品线,两者均支持高达100万Token上下文,旗舰型号主打推理峰值,Flash型号主打效率。

  另一方面,阶跃星辰虽锚定生产级Agent推出最新开源基座模型,但其新模型的256K上下文窗口在面对“上下文即竞争力”的长程Agent场景时,容易遭遇结构性天花板。

  Step 3.7 Flash发布3天后,MiniMax正式推出新一代通用模型M3,主打前沿Coding(编程)能力、1M超长上下文、原生多模态的完整组合,与阶跃星辰形成泾渭分明的技术路线。田丰认为,MiniMax M3凭借百万级上下文窗口应对复杂任务上限的瓶颈,依靠“能力完整性”支撑更高API单价;阶跃星辰则坚持“单位成本下的有效智能”,锚定高频轻量化Agent基础设施。前者的能力峰值路线争夺复杂任务定价权,后者的速度路线锁定基础设施频率。

  “两条路线不存在零和竞争,而是各自对应Agent生产化的不同价值层。但阶跃星辰更要警惕‘廉价但可替代’的陷阱:速度与成本的优势可以为阶跃星辰赢得大量中低复杂度Agent场景,但这类场景的迁移成本也低,护城河易被侵蚀。”田丰说。

  他进一步指出,相较于智谱、MiniMax,阶跃星辰在产品节奏与生态布局上存在一定滞后,这类短板弥补周期远长于技术迭代。滞后首先来自数次战略摇摆。阶跃星辰早年深耕C端(消费者)消费应用,主力产品“冒泡鸭”停运后,从“超级模型+超级应用”路线仓促切换至Agent基座研发,战略变更形成产品空窗期,资本市场估值随之大幅震荡。反观智谱、MiniMax在IPO前就敲定清晰发展路径:智谱依托GLM全系产品深耕政企MaaS(模型即服务)商业化;MiniMax以Talkie等C端产品积累流量,构筑全球化增长飞轮,二者早早完成用户触点沉淀。

  其次是开发者生态密度的硬性差距。商业化数据直观展现差距:MiniMax最新披露的业务数据显示,其全球企业和开发者客户数已超百万,较半年前增长5倍,全球用户规模约3亿,过去两个月年化经常性收入增长超过100%,这背后是其长期沉淀的API调用粘性;智谱则依托CodeGeex王牌应用牢牢锁住编程开发者,2026年3月,其MaaS平台注册用户突破400万,API年度经常性收入(ARR)飙升至约17亿元,较上年同期提升60倍。

  “阶跃星辰虽牵头联合十余家国产芯片厂商组建模芯生态联盟,提前布局国产化算力适配,但合作止步于硬件基础调试,没能落地规模化部署与开发者迁移成果。”田丰表示,“其生态联盟更接近供给侧协同,真正的生态壁垒需要以需求侧的开发者黏性作为回路,这一闭环目前尚未形成。”

  回到Step 3.7 Flash本身,这款产品凭借工具调用稳定性与速度成本优势,为阶跃星辰守住了效率赛道的入场资格,但无力在短时间内修复多年积累的生态欠账。其押注Flash模型的路线有其突围价值,可一旦全行业集体扎堆布局Flash产品,阶跃若想不被淹没,必须在同质化中找到那个“不可替代”的答案。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500