上证报中国证券网讯(记者王子霖)11月8日,在世界互联网大会乌镇峰会上,360数字安全集团正式发布《大模型安全白皮书》(以下简称“白皮书”)。该白皮书首次系统性阐释大模型运行时的五大关键风险,建设性地提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座”的核心理念,并源于实战,提供了可落地的安全解决方案,为大模型应用拉起了全链路安全防线,助力推动人工智能行业向“安全、向善、可信、可控”方向稳健发展。
随着大模型技术加速渗透政务、金融、能源、医疗等重点行业,一个不容忽视的现实是——AI越智能,安全风险越致命。白皮书以2025年国内外多起典型大模型安全事件为切入点,系统性归纳了威胁大模型安全的五大关键风险:首先是基础设施安全风险,包括设备控制、供应链漏洞、拒绝服务攻击以及算力资源滥用等问题;其次是内容安全风险,涉及不符合核心价值观、虚假或违规内容、大模型幻觉,以及提示注入攻击等;第三类是数据与知识库安全风险,数据泄露、越权访问、隐私滥用和知识产权问题日益突出;第四是智能体安全风险,随着智能体自主性增强,插件调用、算力调度、数据流转等环节的安全边界更加模糊;最后是用户端安全风险,包括权限控制、API调用监控、恶意脚本执行以及MCP执行安全等。
面对上述复杂挑战,白皮书基于实战经验,给出了“外挂式安全 + 平台原生安全”双轨治理策略——前者像AI的 “外部保镖”,灵活应对实时风险;后者像AI的“内置铠甲”,从根源筑牢安全基础,两者配合形成全链路防护网。
具体而言,外挂式安全侧重模型外部防护,通过“以模治模”实现对算力主机、软件生态、输入输出内容及模型幻觉的主动监测与防御。平台原生安全则聚焦大模型数据、知识库、智能体及客户端等环节,将安全能力嵌入核心组件,强化配套组件安全与全流程合规管控。
此外,基于“外防风险、内固架构”的大模型安全核心理念,360给出一份覆盖大模型安全全链路解决方案。该方案通过七大核心产品能力,共同组成“外挂式”与“平台原生”相结合的纵深防御体系。
据悉,360已将这一能力落地政务、金融、制造等各行业,真正让大模型安全从理论变成“能落地、能管用”的实战方案。未来,公司还将联合产学研各界,共同推动安全标准建设与技术共享,携手共建安全、可信的AI生态。让AI世界更安全、更美好。