智能体迎来“自主”元年：AI推理需求暴增，分布式云迎机遇_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-08-09 10:40:10 股吧网页版

智能体迎来“自主”元年：AI推理需求暴增，分布式云迎机遇

来源：财联社

　　2025年确实将成为Agent（智能体）爆发的关键节点，这不是概念炒作，是技术成熟度曲线的必然结果。

　　国际知名咨询公司Gartner已把AI智能体列为2025年十大战略性技术趋势之一。谷歌、阿里巴巴等国内外知名企业也在该领域展开布局。

　　PPIO联合创始人兼CEO姚欣认为，这将为云厂商带来新的机遇。他透露，目前PPIO的AI算力云业务增长迅猛，日均token调用量超过2000亿。

　　随着智能体以及AI应用的发展，推理算力需求已经超过训练需求，对于低延迟、高并发推理的需求激增，且和分布式推理架构特性一致，为分布式云创造了巨大的市场机遇。

　　智能体迈入“自主纪元” 真正成为人类工作助手

　　今年3月，通用型自主智能体Manus的发布，一度引发业内强烈关注。微软、谷歌、阿里巴巴、腾讯、百度、360集团等国内外科技巨头也纷纷加入布局智能体的队伍。2025年更被视作智能体落地元年。

　　“确切地说，今年是Agent自主规划的元年。”姚欣称，“原先，智能体需要人类来设定任务目标以及条件、规则，不够智能、通用和自主性。如今，智能体已经进入到自主执行、自主规划的阶段。这样的智能体才能成为数字员工，真的能帮人干活了。”

　　在姚欣看来，这得益于三个方面的核心突破：

　　首先是大模型能力提升带来的认知能力质变。GPT-4o等大模型在推理和规划能力上实现了突破，Agent不再是简单的对话工具，而是具备了"思考-规划-执行"的完整闭环能力。

　　其次是工具生态的成熟。MCP协议、各类API接口、安全沙箱等基础设施让Agent真正具备了"行动力"，能够安全地与真实世界交互。

　　第三是市场需求的爆发。企业对智能化的需求已经从"提升效率"转向"完全自动化"，Agent正好满足了这一痛点。

　　“大模型的规划推理、任务拆解能力都在不断提升。同时，AI编程也在走向自动化。你不需要懂编程，利用自然语言把需求讲清楚，就可以实现程序开发。这让AI插上了手和脚，拥有了更强的可执行力。” 姚欣解释，而在需求层面，不少知识密集型、执行标准化的工作，Agent能达到甚至超过入门级员工的水平，这极大推动了Agent的加速落地。

　　AI推理爆发式增长为分布式云带来机遇

　　Agent市场将在2025年进入千亿级规模，特别在企业服务、内容创作、智能客服等领域。这意味着AI算力基础设施将迎来新的变革。随着Agent应用的普及，AI算力将进一步从"训练为王"转向"推理为王"。

　　“市场趋势上，我们看到两个明显变化：一是推理算力需求已经超过训练需求，二是对低延迟、高并发推理的需求激增。” 姚欣称。

　　这恰恰是PPIO的机会所在。PPIO运营着全球4000+分布式算力节点。姚欣透露，其AI算力云业务增长迅猛，过去一年实现了百倍以上的增长，目前日均token调用量超过2000亿，在独立AI云公司中排名前二。

　　与阿里云、亚马逊云等集中式云计算厂商不同，PPIO采取的是轻资产运营模式，整合了第三方数据中心机房里的闲置算力。

　　“我们的商业模式可以比喻为‘算力滴滴’。就像滴滴整合闲置车辆一样，PPIO并不自建数据中心，而是整合全国闲置的算力资源。这让我们能以更低成本获得算力，同时为算力拥有方提升资源利用率，创造额外收益，形成共赢生态。”

　　通过这种分布式资源调度，PPIO能提供更低成本的推理服务。“国内不同城市的电价差能达到3-5倍左右，房租场地、运维成本也能相差若干倍以上。PPIO 国内的算力节点已经覆盖 1300 多个县市，这些更下沉、更广覆盖的资源，让资源成本相对较低。” 姚欣解释。

　　更分散、更分布的算力节点还让PPIO实现更低的时延，从而实现更高的性能。“ 我们能实现低于200ms的延时服务，并且通过FP8量化、KVCache压缩、投机采样等技术，我们实现了大模型推理10倍以上的性能提升。” 姚欣提到，“更重要的是，在国产化替代的大趋势下，本土分布式算力网络具有战略价值。我们能够支撑教育、金融、政务等对数据安全有严格要求的行业需求。”

　　安全执行、成本控制成为智能体的落地挑战

　　从对话生成跃迁到自主执行，智能体正成为最重要的商业化锚点和下一代人机交互范式。但在落地过程中，其挑战与痛点随之浮出水面。

　　姚欣认为，挑战主要在于安全执行、成本控制和多Agent协作三个方面。

　　“在安全方面，因为大语言模型存在幻觉问题，生成代码时可能会导致程序出现故障。很多智能体经常执行一半卡住了，或调了一个不该调用的API，因此不能在日常应用环境中直接让AI来执行代码。”

　　此外，随着AI智能体的爆发，市场整体Tokens使用量正在暴增。“智能体调用模型时，单次任务可能要消耗几十万到几百万Tokens。相比过去人类一次对话消耗约几千token，智能体的单次任务成本要提升百倍左右。” 姚欣分析。

　　不过，机遇往往与挑战并存。这也意味着在推理加速、成本降低、模型性能优化等方面，将产生巨大的市场空间。

　　在刚刚结束的WAIC 2025期间，PPIO正式发布国内首个 Agentic AI 基础设施服务平台，通过能毫秒级启动的安全沙箱解决执行风险，通过分布式算力网络实现成本优化。

　　传统云平台为通用计算设计，而Agent需要的是"瞬时启动、安全执行、弹性扩缩"的专用基础设施。姚欣介绍，该平台解决了Agent规模化的三大核心痛点：安全隔离、弹性算力和工具整合。

　　“我们的Agent沙箱基于Firecracker MicroVM，实现了小于200ms的冷启动和VM级安全隔离，单实例成本比国外同类产品低50%以上。更重要的是，我们整合了Browser use、Computer use、MCP等主流Agent工具链。” 姚欣指出，这为开发者提供了"即开即用"的Agent开发环境，大幅降低了Agent应用的开发门槛和运营成本。预计将加速中国Agent生态的形成，让更多企业能够快速部署AI智能体。

　　从单一Agent应用走向多Agent协作

　　自动驾驶汽车、人形机器人正成为人工智能的新应用领域，亟需低时延的AI算力。PPIO也展开了相关合作布局。

　　“在智能驾驶方面，我们与极豆智能深度合作，为其沧海大模型提供训练算力，支持智能座舱的多模态AI能力，包括智能助手、语音交互、AI电台等功能。PPIO 结合低延迟AI 推理和边缘云传输服务能提供毫秒级响应，满足车机交互的实时性要求。” 姚欣介绍。

　　在具身智能方面，机器人正在从"程序控制"向"AI驱动"转变。机器人需要实时的感知、决策和执行能力，这对算力的低延迟、高并发要求极高。而分布式算力网络天然适合这类场景。

　　当前，AI正在经历从"思考"到"行动"的关键跃迁。大模型解决了"能思考"的问题，Agent要解决"能行动"的问题。展望未来，姚欣认为，AI发展将经历三个阶段：

　　现阶段是单一Agent应用爆发，重点是工具调用和任务执行。至中期阶段，多Agent协作系统成熟，形成复杂的智能体生态。到长期阶段，通用Agent出现，将接近真正的AGI能力。

　　在此发展过程中，PPIO的目标是成为全球领先的Agent基础设施提供商。为此，PPIO已在香港设立出海总部，把算力滴滴模式复制到海外。

　　“我们与北欧、中东、东南亚、北美等算力合作方一起合作，为海外的Agent提供服务。从长远来看，我们希望让每个开发者都能轻松构建和部署Agent应用，推动整个行业向智能化转型。” 姚欣称。

（文章来源：财联社） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》