9月8日,ISC.AI 2025上海大模型安全论坛暨大模型安全卫士产品发布会在上海举行。会上发布的360大模型安全卫士以“四大智能体”为核心,系统化破解AI安全难题,全面夯实智能化发展基座。
近年来,大模型技术迅猛发展、智能体应用加速落地。人工智能正在重塑百行千业,成为推动新一轮科技革命与产业变革的核心动力。 不过,AI在带来机遇的同时,也衍生出众多新挑战。
360集团创始人、ISC大会主席周鸿祎在致辞中表示,AI发展面临着恶意利用、内容安全、“幻觉”问题、提示词攻击等风险,大模型既是生产力工具,也可能成为新的攻击载体和攻击入口,政府和企业的数据资产、商业机密面临着前所未有的暴露风险,保障AI安全是一项长期而艰巨的任务,需要各方协同努力。
360数字安全集团副总裁余凯表示,面对AI安全新挑战,传统安全企业在大模型技术领域积淀不足,往往是“盲人摸象”,难以系统把握全局;而多数大模型企业缺乏必要的安全技术积累与攻防实践经验,往往难以提出行之有效的解决方案。
作为兼具数字安全和人工智能双重能力的企业,360充分发挥跨领域优势,基于“以模制模”理念打造360大模型安全卫士,聚焦解决AI的“可靠、可信、可控、向善”核心问题,以四大智能体系统性解决大模型生命周期中各环节的安全问题。
具体来看,其内容安全智能体通过垂直领域专业模型训练,提供智能判定、风险内容检测及安全回复代答等关键能力。通过建立五道“内容防线”,提供超过100个风险类目识别能力,确保输入输出双向安全。同时以测促防,持续对模型回复内容进行评测,识别潜在攻击风险。
AI Agent安全智能体通过原生安全机制,全面保障AI Agent在执行任务过程中的数据安全与权限控制,有效防范自动规划与执行中可能出现的行为失控问题,把大模型能力“关在笼子里”。
幻觉抑制智能体通过搜索增强、知识增强与对齐增强技术,提升大模型推理过程的准确性,有效抑制因内容时效性缺失、数据过时等因素引发的大模型“幻觉”问题,确保生成内容真实可信。
软件安全智能体能够高效识别开源软件,精准定位AI软件的安全漏洞。覆盖从模型训练到推理的全链路安全检测,支持识别模型服务相关组件、生态链漏洞扫描与多语言代码审计,保障AI软件供应链生命周期的安全性。
此外,360将大模型安全卫士融入安全运营体系,通过整合安全大模型、安全大脑平台、大模型安全卫士及终端探针工具的核心能力,构建“网数模一体化”安全运营平台,实现安全运营系统性重塑与升级。
余凯表示,AI安全是一个高门槛的技术领域,需要同时具备AI技术积淀、安全实战经验、真实场景验证和海量语料积累。360通过自身大规模AI业务场景验证产品能力,同时沉淀了海量安全语料,构建起核心竞争力。目前,360大模型安全卫士已在公司内外多项业务中实现深度应用。