近年来,大模型的发展几乎沿着同一条路径展开:更大的参数规模、更强的推理能力,以及越来越丰富的云端服务。
但在金融、政务、医疗等行业,AI落地始终面临一个现实问题——数据能否离开本地环境。
近日,明略科技发布面向 AIPC 的端侧 GUI 模型 Mano-CUA-4B-2.0,并上线 Thinking 模式。与主流云端 Agent 不同,这一模型可以直接运行在用户本地设备上,通过视觉理解屏幕并完成操作,数据无需上传至外部服务器。
这背后反映的,其实是 Agent 商业化正在出现的新分化:当越来越多企业开始尝试让 AI 直接参与业务流程时,模型能力已不再是唯一门槛,数据安全、部署成本和系统兼容性,正在成为决定 AI 能否真正落地的重要因素。
云端Agent之外,为什么端侧开始受到关注
Agent已经成为AI产业最热门的方向之一。
从 OpenAI 推出的 Operator,到 Anthropic 持续强化 Computer Use 能力,再到 Microsoft 将 Copilot 深度嵌入 Windows,行业正在尝试让 AI 从“回答问题”走向“完成任务”。
不过,Agent真正进入企业生产环境后,一个长期被忽视的问题开始浮现。
对于互联网企业而言,把数据发送到云端模型进行处理往往不是障碍;但对于银行、医院和政务机构来说,客户信息、病历数据、政务档案等敏感信息受到严格监管,很多场景甚至要求数据不得离开本地网络环境。
这意味着,部分行业并不是不需要 Agent,而是难以采用传统云端 Agent。
市场研究机构 IDC 预计,到2028年全球超过70%的企业将采用混合部署或本地部署AI架构,以满足数据治理和合规要求。这样的趋势,也推动越来越多厂商重新关注端侧AI的发展。
从这个角度看,端侧Agent并不是云端Agent的替代品,而更像是另一条补充路线。
强监管行业需要的,不只是更聪明的模型
金融、医疗和政务有一个共同特点:数字化程度高,但系统复杂、数据敏感。
例如银行每天都存在大量跨系统录入、核验和报表生成工作;医院需要处理病历录入、医保核对等重复流程;政务系统则经常面临内外网隔离和历史系统众多的问题。
这些工作天然适合自动化,却又往往难以直接接入云端大模型。
相比之下,端侧 Agent 的价值在于,它可以在本地设备完成感知、推理和执行,既满足数据安全要求,也能够适应断网、内网隔离等特殊环境。
更重要的是,很多传统行业使用的大量业务系统并没有开放 API。
这也是为什么近年来包括 Anthropic Computer Use、OpenAI Operator 在内的新一代 Agent 产品都开始采用 GUI 操作路线:通过“看屏幕、点鼠标”的方式完成任务,而不是依赖系统接口。
从产业演进看,这正在成为 Agent 落地的重要方向之一。
明略在解决什么问题
此次升级中,明略最值得关注的并非单纯的模型参数,而是其试图解决端侧 Agent 长期存在的两个问题。
第一个问题是兼容性。
Mano-CUA 采用纯视觉 GUI 操控方式,可以直接理解桌面软件和网页界面。对于金融、医疗和政务场景中大量封闭、老旧的业务系统而言,这意味着企业不需要大规模改造原有系统,也不必等待接口开放。
第二个问题是稳定性。
过去端侧 Agent 最大的挑战并非“能不能操作”,而是“能不能持续完成复杂任务”。
由于本地算力有限,很多端侧模型在长流程任务中容易出现步骤遗漏或执行偏差。此次上线的 Thinking 模式,本质上是在执行前增加任务规划和推理环节,让模型先思考再行动。
根据明略公布的测试结果,在100项真实 macOS GUI 任务测试中,Mano-CUA-4B-2.0 的任务完成率相比上一版本提升约9%,在中高复杂度任务中的提升达到10%至13%。
对于 Agent 来说,这类提升并不只是实验室指标的变化,而意味着其更接近真实生产环境所需要的可靠性。
被低估的商业逻辑:端侧算力的经济性
相比性能指标,明略此次提出的另一个观点可能更值得关注。
过去一年,行业讨论 Agent 时更多关注模型能力,但企业真正部署时,成本往往是绕不开的问题。
云端 Agent 的推理能力越强,消耗的 Token 越多,相应成本也会持续增长。对于需要高频运行的复杂流程而言,这种边际成本并不低。
而端侧部署的逻辑不同。
硬件采购完成后,模型推理所带来的额外成本相对固定。换句话说,AI“思考”得更久、更复杂,不会像云端调用一样持续增加费用。
这也是为什么不少业内人士开始将端侧Agent视为企业自动化的新基础设施,而不仅仅是一种模型部署方式。
对于金融、医疗和政务等高频业务场景来说,合规要求和成本控制往往同样重要。端侧路线恰好同时回应了这两个问题。
从模型到市场
从更大的产业背景看,Agent正在经历从“演示价值”向“生产价值”的转变。
过去行业关注的是模型能否完成任务;现在企业更关心的是任务能否稳定执行、是否符合监管要求,以及投入产出比是否成立。
在这一过程中,云端Agent仍将是主流方向,但端侧Agent正在打开一部分此前难以触达的市场。
明略此次升级 Mano-CUA 2.0,某种程度上正是对这一趋势的回应。
当行业仍在比较谁拥有更强的大模型时,越来越多企业开始思考另一个问题:如果数据不能出域,AI还能不能真正参与生产流程?
对于金融、政务和医疗等强监管行业而言,这或许比模型排行榜上的排名更重要。因为决定AI能否创造价值的,最终不是参数规模,而是它是否能够在真实业务环境中被部署、被使用,并持续创造效率。