9月9日,WAVE SUMMIT深度学习开发者大会2025在京举行。会上,百度发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。
百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。目前,用户可以在文心一言官网、文小言App使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰
王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心大模型X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

文心大模型X1.1在多个基准测试达到SOTA
据悉,文心大模型的能力拓展和效率提升,得益于飞桨、文心的联合优化。大会现场,百度发布了飞桨核心框架v3.2,在大模型训练、硬件适配和生态支持上全面升级,并同步升级大模型开发套件ERNIEKit和高效部署套件FastDeploy。
当天,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜现场展示了文心大模型X1.1的实际使用体验。
吴甜介绍,在更复杂的长程任务场景,文心大模型X1.1在面对共享单车平台不同等级用户,不同类型问题的处理流程,以及用户的不同情绪状态多元素叠加的问题时,能够严格遵循业务流程先后规划、再自主调用工具,并结合用户情绪,短时间内解决了问题,服务过程完整主动。
“大模型能力的扩展和效率的提升,带来了更前瞻、更有想象力的创新应用。”吴甜以数字人直播为例表示,超拟真数字人要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动,需要综合运用多种模态AI技术。百度研制了剧本驱动多模协同的数字人技术,实现了语言、声音和形象的协调一致。
吴甜进一步称,这套技术方案重点包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜
百度AI技术生态总经理马艳军正式对外发布飞桨(PaddlePaddle)框架v3.2,以及文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy和两大AI科学计算套件PaddleCFD、PaddleMaterials,全面降低大模型从训练到部署的应用门槛。
马艳军表示,依托计算优化、并行策略和原生容错能力三大核心升级,飞桨框架v3.2突破大模型训练技术难题,显著提升了训练效率,在ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%。同时,该版本强化了类CUDA芯片适配能力,实现了最高92%的算子内核复用率,并全面兼容Safetensors权重及生态加速库一键接入,显著降低部署成本。

百度AI技术生态总经理马艳军
大会现场,百度开源了最新思考模型ERNIE-4.5-21B-A3B-Thinking,该模型是在ERNIE-4.5-21B-A3B基础上训练的深度思考模型。此外,百度智能代码助手文心快码全新升级至3.5S(Super Synergistic AgentS)版本,强化多智能体自协同能力,实现“一人即团队”开发新模式。

百度副总裁陈洋
据百度副总裁陈洋介绍,文心快码3.5S版本从三方面进行了升级。首先,在智能体能力方面,能懂业务,会分解任务列表,执行更准;其次,从单智能体到多智能体协同,动态生成多个智能体,自主协同一起解决复杂任务;最后,在团队协作方面,基于Rules与MCP构建统一的经验库,实现团队知识传承。
数据显示,文心快码目前已服务超过1000万的开发者。在百度内部,整体新增代码中已经有45%由AI生成,其中前10%的Agent用户,AI完成的部分超过了75%。