当下,大模型踏入生产力落地的关键节点,字节跳动正以All in(全力以赴)姿态加码这场行业竞争。
6月24日,喧嚣多日的“豆包付费”靴子落地。豆包专业版正式上线,采用三级阶梯定价:标准版68元/月、加强版200元/月、高级版500元/月,最高一年5088元。
就在前一日(6月23日),在火山引擎“2026夏季FORCE原动力”大会上(以下简称FORCE大会),字节跳动CEO(首席执行官)梁汝波通过视频再次明确传递了字节跳动在AI(人工智能)时代的信念:攀登AI高峰是公司当下最重要的事。而按照梁汝波此前在1月份字节跳动2026年首次全员会议上,对于何为当下最该攀登的“高峰”表态:短期而言,高峰就是“豆包/Dola助手应用”。
豆包专业版基于最新的“豆包 2.1 系列大模型”在昨日的FORCE大会上刚刚揭开面纱:豆包大模型 2.1 Pro、Seedance 2.5 视频生成模型及多款多模态新品集中释出。
在资本市场持续推高AI估值的当下,字节在这场“军备竞赛”中处于何种身位,市场持续追问的算力、定价及商业化前路还有哪些关卡?成为行业关注的核心。
闯关AI“质变点”:豆包2.1 Pro每百万Token输入定价6元、豆包专业版付费“靴子落地”

豆包专业版发布会现场每经记者李宇彤摄
按照官方介绍,豆包专业版服务基于最新的豆包2.1系列大模型,面向复杂办公和生产力场景,专业版提供更高的复杂工作场景使用额度,并上线全新的办公任务模式。此外,免费用户也可以体验接入豆包2.1 Turbo模型的办公任务模式。
定价方面,豆包专业版和最初公布时价格一致,并采用三级阶梯定价方案:标准套餐连续包月68元,专家模式、办公任务模式等功能的额度为免费版的5倍以上;加强套餐连续包月200元,额度为标准套餐的4倍;高级套餐连续包月500元,额度为标准套餐的10倍。
在模型能力上,豆包办公任务模式支持操作本地电脑、使用浏览器、调用Skills技能和定时任务等能力并且内置Office办公套件。
就在昨日FORCE大会上,火山引擎总裁谭待提出了一个核心概念——“质变点”。在他看来,只有当模型能力跨越“质变点”,才能真正满足企业与个人在生产场景中的使用需求。而全球范围内,第一个跨越“质变点”的视频生成模型是Seedance 2.0;Coding(编程)与Agent领域则是美国Anthropic的Claude Opus 4.6。
最新发布的豆包2.1 Pro同样是冲着这个“质变点”而来。据会上公布的测评结果,豆包2.1 Pro在Coding(代码)、Agent、VLM(视觉语言模型)三大核心方向实现能力跃升,在多项评测表现优于Claude Opus 4.6。在Terminal Bench 2.1、SWE-Pro、SciCode等代码评测中,豆包2.1 Pro进入第一梯队。在OSWorld、MobileWorld、MMMU-Pro等Agent与多模态评测中也位居全球前列。
除了测评数据,谭待强调了豆包模型的生产级能力。他表示,一项芯片设计RTL的测试中,豆包2.1 Pro连续运行近18小时,经历9轮迭代,跑通了仿真、测试、综合检查等完整工艺流程。在Agent能力演示环节,依托豆包2.1 Pro搭建的3D虚拟城市场景,可实现500余个智能Agent同步协作,完成上千轮工具调用,生成超百栋建筑。
值得一提的是,同一时间,整个行业都在朝着同一个方向冲刺。
6月17日,智谱发布GLM-5.2,主攻“长程任务”,可连续数小时自主跑完完整大型工程。此前4月,月之暗面推出Kimi K2.6,全面扩容Agent集群能力,最高支持300个子Agent并行完成4000个协作步骤,可实现13小时不间断编码。6月,Kimi再推K2.7 Code,进一步强化长上下文编程的指令遵循能力。同时,阿里也于6月初发布Qwen3.7-Plus,实现多模态混合智能体突破,可自主完成软件复刻等复杂长程任务。
各家大模型厂商不约而同地将Coding与Agent作为下一阶段的主战场。当大家都走在相同的技术路线上,商业化便成了评定的另一个重要标准。而在这场商业化竞争中,价格无疑是最直接的切口。
豆包2.1 Pro每百万token(词元)输入价格为6元,输出价格为30元,缓存命中价格为1.2元。火山引擎表示,其综合使用成本较Claude Opus 4.6降低近80%。面向高频调用场景的豆包2.1 Turbo,价格进一步降至2.1 Pro的一半。
横向对比来看,这一价格虽低于Claude Opus 4.6,但高于DeepSeek V4 Pro。不过,对于模型定价,谭待有自己的判断。他在接受包括《每日经济新闻》在内的媒体记者群访时表示:“模型价格不能只看价格,要结合它的价值来看。单Token创造的价值上升得比单Token价格上升更快,模型的性价比是在提升的。”
关于豆包专业版付费,知名经济学者、工信部信息通信经济专家委员会委员盘和林对《每日经济新闻》记者表示,在他看来定价没有问题,但实际上真正有问题的是当前同类型的办公产品的确比较多,之前,豆包+即梦+剪映是为内容创作者准备的。此次往办公领域拓展,则说明豆包想要在B端发展更多新用户,以开拓AI获客新渠道。定价合理的原因在于B端用户其实对价格并不敏感,但由于可选产品较多,那么B端以什么理由接受豆包,则是一个需要深刻思考的问题。
他同时指出,现阶段,国内大模型企业中,字节跳动是投入最高的,也是功能最全面的,但是,功能全面并不代表遥遥领先,字节跳动长期的策略,是通过个人用户培养使用习惯,逐渐向B端用户导入,但短期来看,可能还是性价比主导用户选择。
否认Seedance ARR已达20亿美元回应“算力焦虑”、合规与商业化
如果说豆包2.1 Pro代表的是字节跳动在语言模型方向的纵深推进,那么Seedance视频模型则是它横向扩张的利器。
本次FORCE大会上,最新的豆包视频生成模型Seedance 2.5首次亮相,预计将于7月正式上线。据介绍,Seedance 2.5实现了30秒单段原生视频直出,最多支持50个多模态素材联合生成,保持画面一致性的局部编辑三项能力提升。
谭待认为,视频生成是通往世界模型的路径之一,在实体产业中有巨大的应用潜力。目前,Seedance已在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。
至于价格,目前该模型尚未开放API(应用程序编程接口)接口,但《每日经济新闻》记者在Seedance 2.5展台上了解到,其定价方面相较上一代变动不会太大。
随着大模型进入商用落地的深水区,算力供给、商业化天花板成为所有头部玩家都绕不开的考题。在大力推动视频模型的同时,市场对其合规性的探讨一直没有消失。
谭待对此也有清晰的认知。他在接受媒体记者群访时表示,Seedance 2.0早在今年春节前就已具备上线条件,但正式API对外开放一直推迟到4月,中间几个月的时间,团队核心工作就是搭建安全策略体系,包括商业端安全、IP版权保护,以及用户侧的人脸保护等。
本次大会上,Seedance 2.0也宣布同步升级,已具备原生4K视频生成能力,在广告、影视等画质高要求的场景中得以拓展应用边界。但谭待强调,影视和短剧只是Seedance的一个环节,“长期来看可能只是一个小场景”。
他列举了更广泛的落地方向:制造业用Seedance制作多语言产品说明和售后服务视频,具身智能企业用Seedance做数据合成以突破真实世界数据获取瓶颈,自动驾驶公司则用它合成极端天气和边缘路况等Corner case(边缘极端场景)来训练算法。他将视频生成视为“构建世界模型的基础”,并表示通过无监督大规模训练,对世界状态假设最少、自然数据最多,是合成世界模型的有效方法之一。
此外值得一提的是,谭待在采访中提及创收能力时回应:“外面所有传的Seedance的收入数据都是错的,而且偏高。”此前有市场消息表示,字节跳动Seedance视频生成模型当前年化收入(ARR)已达20亿美元(约合人民币143亿元),单月超10亿元。
此外,算力焦虑是行业另一个普遍心结。随着大模型调用量指数级增长,高端算力稀缺、业务间算力争抢的讨论不绝于耳,国产算力替代也成为行业热词。
谭待解释称,Seedance与Coding Agent对底层芯片的要求本就不同。视频生成模型以Diffusion结构为主,对高带宽的需求更低。加上火山方舟在推理侧的大量优化,Seedance可以高效利用各类低端芯片,与Coding类模型不存在算力冲突。“算力的分配完全不是问题,”他说,“这也是Seedance能够得到大规模应用的重要原因。”
这场向实体产业的渗透战,绝非字节跳动一家的独角戏。阿里云近期同样在AI商用领域密集落子:通义千问系列连续迭代代码与多模态能力,推出工业、金融垂类解决方案。同时升级百炼MaaS服务矩阵,推出AgentRun一站式智能体开发平台,并计划下半年在海外市场落地完整的Agentic AI产品矩阵。AI商用已从单点突破进入全面铺开阶段。
谭待也对当前的市场阶段作出了判断:“去年说跑了500米,今年跑了一公里多一点点。这一公里很重要,已经跨过了生产的‘质变点’。”提升的模型能力是落地的本钱,但如何将模型势能转化为可持续的商业模式,仍是所有参赛者必须作答的考题。