“只有当模型能力跨越‘质变点’(Tipping Point),才能真正满足企业与个人在生产场景中的使用需求。”6月23日,火山引擎总裁谭待在2026夏季FORCE原动力大会上宣告了豆包大模型家族的最新里程碑。
这一天,豆包最新大模型2.1 Pro正式亮相,谭待随后接受《中国经营报》记者的采访中直言,该模型在Coding(编程)与Agent(智能体)领域的多项评测表现已优于被视为行业标杆的Claude Opus 4.6。
这无疑传递出一个清晰而强烈的信号:大模型的竞争,正在从参数规模和C端流量的比拼,转向B端生产力的真实兑现。
从“玩具”到“工具”
在本次发布会上,“质变点”成为贯穿始终的核心词汇。
谭待在采访中对“质变点”进行了拆解:“Seedance 2.0出来之前,很多人讲视频生成是玩具,确实也是玩具。周末的调用次数是远大于工作日的,这说明更多是在UGC环境大家休闲的时候玩。但是Seedance 2.0出来之后,工作日的调用次数逐渐超过周末的,这说明大家是在办公的时候用它,在生产的环境中用它。”
这种数据特征的变化,被火山引擎视为判断技术是否具备生产力价值的一个标准。
如今,这一标准被应用到最新的旗舰模型豆包2.1 Pro身上。据谭待透露,豆包2.1 Pro在Terminal Bench 2.1、SWE-Pro、SciCode等代码评测中已进入全球第一梯队,并在OSWorld、MobileWorld等Agent能力评测中位居前列。
对于大模型来说,所谓的“生产级质变点”,区别于简单问答、片段生成的演示级模型,核心标准是能够自主完成长周期、高复杂度工程任务,全程自迭代、自校验、输出可直接上线交付成果。
谭待分享了芯片RTL设计真实客户案例:豆包2.1 Pro连续运行18小时迭代了9轮,自主完成仿真、测试、综合全流程,输出1300行可直接上线校验代码;在虚拟城市场景中,模型可调度500余个智能体并行协作,完成上千次工具调用生成上百栋建筑。
“这些都不是PPT上的指标游戏,而是试图证明模型已经从‘辅助工具’变成了‘可上岗的生产工人’。”谭待在接受采访中表示,“真正的生产级就是这个代码可以真正跑通测试上线。我们举的芯片RTL的例子,完成了真正有用的可以上线的代码。”
据披露,字节内部已大规模落地AI Coding生产流程,外部已有WPS、奔驰、上汽、海底捞等头部企业完成测试并落地。
面向Coding与Agent场景,火山引擎还上线了Doubao-Seed-Evolving版本,将以每月2至4次的频率快速迭代。
价格战之外的价值博弈
如果说模型能力决定了能不能上牌桌,那么定价策略决定了能在牌桌上坐多久。
豆包2.1 Pro的定价为每百万Token(词元)输入6元、输出30元,缓存命中仅1.2元。面向高频调用场景的豆包2.1 Turbo,价格进一步降至Pro版的一半。
这一价格策略引发了行业关注。近期国产大模型API价格涨跌互现,豆包的定价逻辑究竟是什么?
谭待在采访中回应称:“看模型不能只看价格,要结合它的价值来看。模型能做更多的事情,它创造的价值更大。现在不管是火山引擎还是其他家的主流模型,虽然单Token的价格在上升,但单Token创造的价值上升得更快。模型的性价比是在提升。”
谭待进一步解释道:“现在模型不管是Coding、Agent还是视频生成都真正跨过了生产力质变的支点,能创造更多的价值。”
另一个值得注意的细节是,火山引擎表示,豆包2.1 Pro的综合使用成本较Claude Opus 4.6降低了近80%。这种“加量减价”的策略,直接瞄准了企业级生产环境的规模化部署需求。
然而,仅有好的模型并不足以攻破企业级市场的堡垒。谭待透露,AI落地最大的障碍往往在于“最后一公里”的适配。
在企业服务落地路径上,火山引擎专门组建FDE行业落地团队,成员兼具代码开发能力与垂直行业Knowhow,覆盖汽车、半导体、医疗、金融、教育等赛道。
谭待解释了该团队的定位:“FDE不是传统销售或售前,需要和标杆客户深度共创,挖掘行业专属AI场景,让Token调用真正转化为业务增收、成本节约的实际价值。”
除基础大模型与多模态生成工具外,火山引擎还发布了HiAgent 3.0、ArkClaw企业工作台、Trae代码工具、Coze零代码平台四层智能体产品矩阵,覆盖普通运营、业务人员、低代码开发者、专业程序员等不同使用群体,形成零代码至高代码完整分层解决方案。
谭待解释了分层逻辑:企业内部岗位需求差异显著,市场上不存在单一产品适配全部人群的情况。HR、财务、市场人员需要开箱即用零代码工具,产品、运营适合低代码平台,半导体、互联网研发则依赖专业Coding智能体Trae。HiAgent 3.0新增数字员工全生命周期管理功能,支持智能体上岗考核、运行监控、Token绩效管控,企业可根据产出效果调配资源额度,解决AI落地后权责模糊、管理无序的行业痛点。
大模型进入算账时代
在本次FORCE原动力大会上,火山引擎还透露了另一组值得关注的数据:目前已有超过110万企业和个人使用火山方舟大模型服务,年Token调用量超过1万亿的企业已达200家,半年内增长一倍,覆盖互联网、制造、金融、汽车等多个行业。
这意味着大模型调用正在从“尝鲜预算”迁移到“运营预算”,Token正在变成类似算力、带宽一样的基础设施。业内也有观点指出,国内大模型行业已告别单纯的C端流量竞争与价格战,商业化锚点正式切换至B端企业生产力兑现周期。
谭待的判断是:“目前市场还处在非常早期的阶段,短期的输赢不是特别重要。我们更重要的是用更好的AI能力去服务更多的企业,因为这个市场本身还有10倍、1000倍增长的空间。”
针对行业关心的自研芯片、算力储备问题,谭待给出的判断是:“云厂商的核心竞争力不在于自有芯片,Anthropic同样未自研芯片,但依旧拥有全球影响力,企业采购MaaS服务核心诉求是解决业务问题,底层硬件只是配套支撑。”
但火山引擎并未放弃基础架构自研,DPU、网络交换机等底层硬件布局早于云业务成型,借助硬件卸载提升AI集群的整体算力效率,同时全面适配国产异构算力,国内自研芯片在整体算力底座占比也比较可观,依托火山方舟混合调度能力可以充分释放国产硬件产能。
当被问及火山引擎的护城河时,谭待的回答简洁而直接:“AI最核心是两个事情,第一是模型能力,特别是要跨越生产级的‘质变点’。第二是怎么把这个模型带到企业里面去。”
“火山引擎的业务优先级不固定,模型能力短板阶段全力迭代基座,能力达标后重点完善Harness应用、行业落地、安全合规配套体系,两者交替成为阶段核心任务。”谭待说道。