6月23日,火山引擎2026夏季FORCE原动力大会上,集中发布豆包大模型2.1,以及视频、音频、图像等多款新模型,并升级面向Agent(智能体)的云服务体系。
据披露,截至今年6月,豆包大模型日均词元(Token)调用量已突破180万亿,过去一年增长超10倍。IDC数据显示,在中国公有云MaaS服务市场,火山引擎以49.5%的市场份额位居第一。
随着豆包2.1的发布,Coding(编程)与Agent能力跨越“质变点”,AI正式进入生产环境。
跨越生产级“质变点”
“只有当模型能力跨越‘质变点’,才能真正满足企业与个人在生产场景中的使用需求。”火山引擎总裁谭待没有用参数规模做开场,而是抛出了一个更务实的衡量标准。
在他给出的坐标系里,全球范围内,第一个跨越“质变点”的视频生成模型是Seedance 2.0,Coding与Agent领域则是Claude Opus 4.6。而现在,这个阵营里多了一个新名字——豆包2.1 Pro。
作为本次大会发布的主力模型,豆包2.1 Pro在Coding、Agent(智能体)、VLM(视觉语言模型)三大核心方向实现能力跃升。
过去两年,大模型在“能写代码”和“能交付项目”之间,隔着一道鸿沟。在Coding维度,跨越“质变点”意味着不再停留在代码片段补全或者单文件生成。模型需要理解整个代码仓库,能完成从需求分析到架构设计、从代码生成到测试验证的完整链路,并且具备自测闭环的能力——遇到报错自己能调试修复。Agent能力的门槛同样被大幅拉高,简单任务执行之外,生产级的智能体能够在动态环境中自主规划路径。
实现多智能体协作
模型不能只是一个好用的辅助工具,它得成为能够独立完成任务的生产力单元。据悉,豆包2.1 Pro已可落地芯片RTL开发等真实工业代码迭代任务,字节内部也已大规模落地AI Coding生产流程。
另一个展示更具画面感。依托豆包2.1 Pro搭建了一个3D虚拟城市场景,500多个智能Agent同步协作,完成上千轮工具调用,最终生成超过100栋建筑。过程中,不同Agent需要协调各自的任务、处理中途出错、动态调整步骤,几乎复现了一个小型数字施工队的运作方式。
目前,豆包2.1模型已在火山引擎开放API服务,并陆续接入TRAE、扣子等产品。已有ezona、WPS、沐瞳、OPPO、美的等头部企业完成测试并落地,覆盖代码生成、智能体应用等场景。火山引擎表示,豆包2.1 Pro综合使用成本较Claude Opus 4.6降低近80%。
同时,火山引擎上线Doubao-Seed-Evolving版本,面向Coding与Agent场景,将以每月2至4次的频率快速迭代。豆包2.1提供Pro和Turbo两个版本,分别面向高复杂度任务探索和规模化生产场景。相较上一代版本,豆包2.1在Coding工程交付、Agent长链路任务执行和多模态理解方面实现全面升级。
音视频生成模型再升级
豆包视频生成模型Seedance 2.5也首次亮相,实现了30秒单段原生视频直出、最多支持50个全模态素材联合生成、保持画面一致性的局部编辑三项核心能力提升,预计7月正式上市。
谭待认为,视频生成是通往世界模型的路径之一,在实体产业中有巨大的应用潜力。目前,Seedance已在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。
此外,火山引擎还展示了豆包图像创作模型Seedream 5.0 Pro和豆包音频生成模型Seed-Audio 1.0,进一步巩固其多模态领先优势。
Seedream 5.0 Pro具备交互式精准编辑、多图层分离、高密度信息表达和原生多语种文字生成等能力,可直接生成可编辑分层设计图和复杂信息图。Seed-Audio 1.0则具备零样本多模态参考能力,支持一次生成多角色对白、背景音乐和拟音特效。
面向Agent时代,火山引擎再次升级AI云原生架构,发布方舟CLI命令行工具,支持开发者通过一行指令将Agent接入火山方舟。据悉,目前已有超过110万企业和个人使用火山方舟大模型服务,年Token调用量超过1万亿的企业已达200家,半年内增长1倍,覆盖互联网、制造、金融、汽车等多个行业。