6月23日,北京火山引擎科技有限公司(以下简称“火山引擎”)集中发布豆包大模型2.1系列产品,并首次公开亮相全新升级的视频生成模型Seedance 2.5,补齐企业级多模态AI落地的核心视频能力短板。据火山引擎披露,截至今年6月份,豆包大模型日均词元调用量已突破180万亿,过去一年增长超10倍。国际数据公司IDC的研究显示,在中国公有云MaaS服务市场,火山引擎以49.5%的市场份额位居第一。
火山引擎总裁谭待表示,只有当模型能力跨越“质变点”,才能真正满足企业与个人在生产场景中的使用需求。
加速AI视频工业化进程
据了解,Seedance 2.5预计将于7月初正式上线,模型精准直击当前AI视频生成行业普遍存在的“长叙事成片难、多场景风格易割裂、后期编辑可控性弱”三大核心痛点,全面补齐商用落地短板。
相较于前代产品,Seedance 2.5实现单段原生30秒完整叙事视频直出,成功打破行业同类产品普遍15秒至20秒的视频时长瓶颈。依托底层渲染链路的全面优化与贯通,创作者无需进行多段视频拼接、补帧修复,即可生成起承转合完整、人物动作连贯、光影色调统一的长叙事视频,大幅降低短剧制作、品牌广告成片、文旅宣传短片等商业场景的后期剪辑与返工成本,显著提升内容生产效率。
在精细化创作与可控性层面,Seedance 2.5将全模态参考素材输入上限从12份大幅提升至50份,支持图片、分镜脚本、参考音效、人设素材等多类型资料同步输入参考,彻底解决系列短片、多角色剧集、多场景品牌内容的美术调性不统一、风格断层等行业难题。
谭待认为,视频生成是通往世界模型的路径之一,在实体产业中有巨大的应用潜力。目前,Seedance已在具身智能、工业制造、智能驾驶等领域落地,为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。
有行业分析师对《证券日报》记者表示,Seedance 2.5精准解决了AI视频长叙事创作困难、多场景风格割裂等行业核心痛点,模型原生集成的视频编辑能力彻底打通生成与后期流程。这标志着AI视频已从娱乐属性的“创意工具”,迭代为可控、高效、可落地的商业级生产力工具,为内容工业化生产、实体产业数字化转型开辟了全新发展空间。
构筑企业级AI基础设施
除旗舰视频生成模型之外,火山引擎还同步展出豆包图像创作模型Seedream 5.0 Pro、音频生成模型Seed-Audio 1.0,全方位补齐图文、音频、视频全链路多模态生态版图,形成完整的内容生产技术矩阵。
其中,Seedream 5.0 Pro支持交互式精准编辑、多图层独立分离,可直接输出可二次编辑的分层设计素材,适配专业设计生产需求;Seed-Audio 1.0具备零样本多模态参考能力,可一次性完成多角色对白生成、场景拟音、背景配乐等全流程音频制作。图像、音频、视频三大模型形成高效协同,为MCN机构、影视制作团队、品牌营销企业提供从素材创作、内容生成到后期优化的一站式AI工业化生产方案。
在通用大模型底座层面,火山引擎全新发布的豆包2.1 Pro围绕编程、智能体、视觉语言模型三大核心能力全面升级,多项权威评测指标跻身全球第一梯队。在产业落地关键的性价比层面,新款模型具备显著成本优势。豆包2.1 Pro每百万词元输入价格6元、输出价格30元,缓存命中后价格低至1.2元。针对高频调用、轻量化落地场景,火山引擎推出豆包2.1 Turbo版本,定价仅为2.1 Pro版本的一半,进一步降低企业AI落地门槛。
面向全面到来的智能体时代,火山引擎持续完善企业级AI应用基础设施,同步发布方舟CLI、AgentKit、ArkClaw企业版工作台等多款工具产品,覆盖模型开发、智能体搭建、企业级运维全流程,助力传统企业快速落地定制化AI应用。
工业和信息化部信息通信经济专家委员会委员盘和林对《证券日报》记者表示,此次火山引擎全系多模态产品的集中发布,可帮助企业实现在AI底层技术、多模态生成能力的代际跨越,更释放出清晰的产业信号:随着AI视频技术彻底突破时长限制、可控性不足的核心瓶颈,内容生产工业化、实体产业数字化的双向融合,正式迈入全新发展拐点。