2025年确实将成为Agent(智能体)爆发的关键节点,这不是概念炒作,是技术成熟度曲线的必然结果。
国际知名咨询公司Gartner已把AI智能体列为2025年十大战略性技术趋势之一。谷歌、阿里巴巴等国内外知名企业也在该领域展开布局。
PPIO联合创始人兼CEO姚欣认为,这将为云厂商带来新的机遇。他透露,目前PPIO的AI算力云业务增长迅猛,日均token调用量超过2000亿。
随着智能体以及AI应用的发展,推理算力需求已经超过训练需求,对于低延迟、高并发推理的需求激增,且和分布式推理架构特性一致,为分布式云创造了巨大的市场机遇。
智能体迈入“自主纪元” 真正成为人类工作助手
今年3月,通用型自主智能体Manus的发布,一度引发业内强烈关注。微软、谷歌、阿里巴巴、腾讯、百度、360集团等国内外科技巨头也纷纷加入布局智能体的队伍。2025年更被视作智能体落地元年。
“确切地说,今年是Agent自主规划的元年。”姚欣称,“原先,智能体需要人类来设定任务目标以及条件、规则,不够智能、通用和自主性。如今,智能体已经进入到自主执行、自主规划的阶段。这样的智能体才能成为数字员工,真的能帮人干活了。”
在姚欣看来,这得益于三个方面的核心突破:
首先是大模型能力提升带来的认知能力质变。GPT-4o等大模型在推理和规划能力上实现了突破,Agent不再是简单的对话工具,而是具备了"思考-规划-执行"的完整闭环能力。
其次是工具生态的成熟。MCP协议、各类API接口、安全沙箱等基础设施让Agent真正具备了"行动力",能够安全地与真实世界交互。
第三是市场需求的爆发。企业对智能化的需求已经从"提升效率"转向"完全自动化",Agent正好满足了这一痛点。
“大模型的规划推理、任务拆解能力都在不断提升。同时,AI编程也在走向自动化。你不需要懂编程,利用自然语言把需求讲清楚,就可以实现程序开发。这让AI插上了手和脚,拥有了更强的可执行力。” 姚欣解释,而在需求层面,不少知识密集型、执行标准化的工作,Agent能达到甚至超过入门级员工的水平,这极大推动了Agent的加速落地。
AI推理爆发式增长为分布式云带来机遇
Agent市场将在2025年进入千亿级规模,特别在企业服务、内容创作、智能客服等领域。这意味着AI算力基础设施将迎来新的变革。随着Agent应用的普及,AI算力将进一步从"训练为王"转向"推理为王"。
“市场趋势上,我们看到两个明显变化:一是推理算力需求已经超过训练需求,二是对低延迟、高并发推理的需求激增。” 姚欣称。
这恰恰是PPIO的机会所在。PPIO运营着全球4000+分布式算力节点。姚欣透露,其AI算力云业务增长迅猛,过去一年实现了百倍以上的增长,目前日均token调用量超过2000亿,在独立AI云公司中排名前二。
与阿里云、亚马逊云等集中式云计算厂商不同,PPIO采取的是轻资产运营模式,整合了第三方数据中心机房里的闲置算力。
“我们的商业模式可以比喻为‘算力滴滴’。就像滴滴整合闲置车辆一样,PPIO并不自建数据中心,而是整合全国闲置的算力资源。这让我们能以更低成本获得算力,同时为算力拥有方提升资源利用率,创造额外收益,形成共赢生态。”
通过这种分布式资源调度,PPIO能提供更低成本的推理服务。“国内不同城市的电价差能达到3-5倍左右,房租场地、运维成本也能相差若干倍以上。PPIO 国内的算力节点已经覆盖 1300 多个县市,这些更下沉、更广覆盖的资源,让资源成本相对较低。” 姚欣解释。
更分散、更分布的算力节点还让PPIO实现更低的时延,从而实现更高的性能。“ 我们能实现低于200ms的延时服务,并且通过FP8量化、KVCache压缩、投机采样等技术,我们实现了大模型推理10倍以上的性能提升。” 姚欣提到,“更重要的是,在国产化替代的大趋势下,本土分布式算力网络具有战略价值。我们能够支撑教育、金融、政务等对数据安全有严格要求的行业需求。”
安全执行、成本控制成为智能体的落地挑战
从对话生成跃迁到自主执行,智能体正成为最重要的商业化锚点和下一代人机交互范式。但在落地过程中,其挑战与痛点随之浮出水面。
姚欣认为,挑战主要在于安全执行、成本控制和多Agent协作三个方面。
“在安全方面,因为大语言模型存在幻觉问题,生成代码时可能会导致程序出现故障。很多智能体经常执行一半卡住了,或调了一个不该调用的API,因此不能在日常应用环境中直接让AI来执行代码。”
此外,随着AI智能体的爆发,市场整体Tokens使用量正在暴增。“智能体调用模型时,单次任务可能要消耗几十万到几百万Tokens。相比过去人类一次对话消耗约几千token,智能体的单次任务成本要提升百倍左右。” 姚欣分析。
不过,机遇往往与挑战并存。这也意味着在推理加速、成本降低、模型性能优化等方面,将产生巨大的市场空间。
在刚刚结束的WAIC 2025期间,PPIO正式发布国内首个 Agentic AI 基础设施服务平台,通过能毫秒级启动的安全沙箱解决执行风险,通过分布式算力网络实现成本优化。

传统云平台为通用计算设计,而Agent需要的是"瞬时启动、安全执行、弹性扩缩"的专用基础设施。姚欣介绍,该平台解决了Agent规模化的三大核心痛点:安全隔离、弹性算力和工具整合。
“我们的Agent沙箱基于Firecracker MicroVM,实现了小于200ms的冷启动和VM级安全隔离,单实例成本比国外同类产品低50%以上。更重要的是,我们整合了Browser use、Computer use、MCP等主流Agent工具链。” 姚欣指出,这为开发者提供了"即开即用"的Agent开发环境,大幅降低了Agent应用的开发门槛和运营成本。预计将加速中国Agent生态的形成,让更多企业能够快速部署AI智能体。
从单一Agent应用走向多Agent协作
自动驾驶汽车、人形机器人正成为人工智能的新应用领域,亟需低时延的AI算力。PPIO也展开了相关合作布局。
“在智能驾驶方面,我们与极豆智能深度合作,为其沧海大模型提供训练算力,支持智能座舱的多模态AI能力,包括智能助手、语音交互、AI电台等功能。PPIO 结合低延迟AI 推理和边缘云传输服务能提供毫秒级响应,满足车机交互的实时性要求。” 姚欣介绍。
在具身智能方面,机器人正在从"程序控制"向"AI驱动"转变。机器人需要实时的感知、决策和执行能力,这对算力的低延迟、高并发要求极高。而分布式算力网络天然适合这类场景。
当前,AI正在经历从"思考"到"行动"的关键跃迁。大模型解决了"能思考"的问题,Agent要解决"能行动"的问题。展望未来,姚欣认为,AI发展将经历三个阶段:
现阶段是单一Agent应用爆发,重点是工具调用和任务执行。至中期阶段,多Agent协作系统成熟,形成复杂的智能体生态。到长期阶段,通用Agent出现,将接近真正的AGI能力。
在此发展过程中,PPIO的目标是成为全球领先的Agent基础设施提供商。为此,PPIO已在香港设立出海总部,把算力滴滴模式复制到海外。
“我们与北欧、中东、东南亚、北美等算力合作方一起合作,为海外的Agent提供服务。从长远来看,我们希望让每个开发者都能轻松构建和部署Agent应用,推动整个行业向智能化转型。” 姚欣称。