2025年上半年,伴随DeepSeek-R1及V3.1等国产大模型的迭代推出,银行业的AI应用正从局部试点迈向全面融合。多家上市银行在半年度业绩报告中披露了大模型建设的进展。
业内人士认为,在利率市场化深化、息差持续收窄的背景下,银行业普遍将人工智能视为提升运营效率、优化客户体验及开拓新增长极的核心抓手,从“降本增效”工具迈向“收入驱动”引擎的战略转变日益清晰。
行业应用加速普及
平安银行中报显示,2025年上半年,该行构建大模型能力体系,通过监督微调、强化学习、大模型自主规划、智能体等技术进行模型调优训练,提升重点场景应用能力,6月末平安银行已落地大模型应用场景超330个。
尤其在风控合规方面,平安银行深化智能算法应用,夯实智能化风险防控体系。在对公风险管理上,深化大模型在智慧风控的探索应用,建立风险专家知识库,借助智能体提升风险控制各流程的效率,强化大模型的适用能力。在零售贷款审批与催收上,该行依托大模型能力,对非结构化数据及其他要素进行风险特征挖掘和识别,提升风险管理能力。在普惠金融上,平安银行持续深化央行“资金流信用信息共享平台”的应用,全面完善普惠生态客户的风险画像,支持信贷资金精准直达中小微企业。在账户风险防控上,打造反电诈“风控大脑”,提升账户风险管理和客户服务效率。在内控合规上,升级“慧小喵”审计大模型,通过打造多维智能体,实现营销、制度等领域的智能合规审查及归因分析,推动审计监督与纪检监察工作提质增效。
浦发银行(600000.SH)方面透露称,截至2025年6月末,该行已构建千卡算力,在股份制商业银行中率先实现全栈国产化算力平台+开源大模型的金融应用,形成大小模型协同的“浦银智启”模型服务矩阵,同时搭建多维度大模型评测体系,形成超3万的评测数据集,初步构建千万级企业知识库。
中国银行(601988.SH)研究院研究员刘晨指出,传统大模型计算资源消耗较大,DeepSeek基于专家混合架构(MoE)、模型训练优化、高效强化学习和数据蒸馏技术,显著提高了计算效率和推理速度,同时也大幅降低了对计算资源的需求。据DeepSeek数据,预训练大模型Deepseek-V3的训练成本约为558万美元,远低于同类头部模型;DeepSeek在API服务定价也远低于OpenAI同类产品。同时,在较低成本的基础上,DeepSeek也能够兼顾模型效率。
政策支持是推动银行加快AI应用的重要力量。2025年3月,中国人民银行召开2025年科技工作会议,已明确要求加快金融数字化智能化转型,安全稳妥有序推进人工智能大模型等在金融领域的应用。
在此背景下,多家银行对大模型进行了积极部署。建设银行(601939.SH)方面在接受投资者调研时指出,DeepSeek-R1开源大模型发布以来,建设银行第一时间利用自身丰富的人才、算力储备和高质量的金融数据,对通用开源大模型进行预训练、微调和强化学习,较早采用私有化方式部署了DeepSeek-R1-671B满血版和DeepSeek-R1-32B蒸馏版金融大模型及外部可信搜索服务。
从具体成果看,在个人金融领域,建设银行“帮得”个人客户经理智能助理话术生成场景应用支持回答问题、提供建议业务能力;对话术加工润色,使话术更为友好流畅,为客户经理提供话术参考;对较长的知识内容,比如产品说明书进行总结归纳;对不同年龄、风格的客户能生成差异性营销话术;个人客户经理智能化运营能力场景应用,可以通过自然语言描述客群特点,运用大模型生成客群筛选条件,结合客户360度画像标签精准定位客群,不仅提高了客群圈选的便捷性,也提升了用户体验。在授信审批领域,建设银行对公授信审批生成评级审查要点场景应用,通过提示词工程,利用大模型自动生成评级审查要点文档,有效减轻了评级合规岗工作量。
刘晨指出,DeepSeek大幅降低AI大模型的应用门槛,中小银行可以选择与金融科技服务商合作,通过接入DeepSeek开源大模型,运用包括混合专家系统在内的智能技术降低算力消耗,从而减少研发成本、突破技术门槛,同时借助二次开发对接业务场景需求,缩小与大行数字服务能力的差距。
上海银行(601229.SH)近期在接受投资者调研时指出:“从OpenAI发布ChatGPT,特别是今年年初DeepSeek发布以来,大家把更多精力投入到大模型,大模型的出现促使我们对金融科技思考更加深入,也促使我们对数字化转型研究更加深入。现在在大模型框架下,我们更加需要思考如何将本行的业务、服务能力与大模型提供的专家模型相结合,这给技术发展带来了不同路径。”
业务模式重构进行时
尽管银行业在大模型应用方面取得了显著进展,但行业仍面临诸多挑战。毕马威方面分析指出,银行业大模型应用正从效率提升工具向价值创造引擎演进,但场景落地仍面临“可控性”、“可解释性”与“投入产出比”三大核心制约因素。这一判断揭示了行业转型进入深水区的现实挑战,也为未来发展指明了方向。
从应用成熟度来看,当前银行业大模型应用呈现出明显的层级特征。毕马威将其划分为四个阶段:“降本增效”类应用(如办公管理)和“生产力革命”类应用(如AI生成营销文案、分析报告等)已趋近成熟;“流程重构”类应用部分场景经过验证且投产(如知识库问答类Agent、智能问数类Agent),部分仍处于探索阶段(如投研Agent、风控Agent);而涉及“模式创新”及“颠覆性变革”的应用模式则多处于探索或未经验证阶段。这种梯度发展格局,反映了银行业在拥抱新技术时的审慎态度。
近期,银行在大模型方面开始了新的探索。如兴业银行(601166.SH)正征集合作伙伴,拟基于行内数据训练金融大模型以提升研发效率;科大讯飞(002230.SZ)中标江西银行大模型软硬件采购项目。
记者从江苏银行(600919.SH)了解到,依托国产芯片为代表的混合算力架构,该行成功实现单张GPU计算卡千亿级推理大模型的规模化部署。该行从国产操作系统底层依赖库入手,通过完全自主编译与适配,构建新一代技术架构框架,兼容并稳定运行MXFP4量化算法,相较传统方案实现计算性能3倍加速与硬件资源占用减少75%的优化成果。
基于“专家经验为主,人工智能为辅”的设计理念,江苏银行千亿大模型构建了具备多种能力的智能体,并在业务材料录入与审核场景中率先落地运用。在电子流水授信材料鉴伪场景中,该智能体能够自动化匹配鉴定规则、动态选择工具链,精准执行图片细节定位、二值化处理及元数据比对,并自主访问外部金融机构交叉验证;在询证函填写及商户进件等场景,通过多模态识别工具高效完成文本抽取与结构化表单生成,自上线以来累计处理业务数万笔,显著提升运营效率。
苏商银行特约研究员武泽伟认为,未来AI Agent的自主决策、实时响应与智能学习能力,将从三个维度重塑银行业务模式:在客户体验方面,通过多模态交互与个性化服务重新定义银行与客户的连接方式;在风险管理方面,推动风控从“事后响应”转向“实时拦截+预测预警”;在运营效率方面,驱动业务流程向“零接触”与“自适应”进化。