• 最近访问:
发表于 2025-08-09 10:40:10 股吧网页版
智能体迎来“自主”元年:AI推理需求暴增,分布式云迎机遇
来源:财联社

  2025年确实将成为Agent(智能体)爆发的关键节点,这不是概念炒作,是技术成熟度曲线的必然结果。

  国际知名咨询公司Gartner已把AI智能体列为2025年十大战略性技术趋势之一。谷歌、阿里巴巴等国内外知名企业也在该领域展开布局。

  PPIO联合创始人兼CEO姚欣认为,这将为云厂商带来新的机遇。他透露,目前PPIO的AI算力云业务增长迅猛,日均token调用量超过2000亿。

  随着智能体以及AI应用的发展,推理算力需求已经超过训练需求,对于低延迟、高并发推理的需求激增,且和分布式推理架构特性一致,为分布式云创造了巨大的市场机遇。

  智能体迈入“自主纪元” 真正成为人类工作助手

  今年3月,通用型自主智能体Manus的发布,一度引发业内强烈关注。微软、谷歌、阿里巴巴、腾讯、百度、360集团等国内外科技巨头也纷纷加入布局智能体的队伍。2025年更被视作智能体落地元年。

  “确切地说,今年是Agent自主规划的元年。”姚欣称,“原先,智能体需要人类来设定任务目标以及条件、规则,不够智能、通用和自主性。如今,智能体已经进入到自主执行、自主规划的阶段。这样的智能体才能成为数字员工,真的能帮人干活了。”

  在姚欣看来,这得益于三个方面的核心突破:

  首先是大模型能力提升带来的认知能力质变。GPT-4o等大模型在推理和规划能力上实现了突破,Agent不再是简单的对话工具,而是具备了"思考-规划-执行"的完整闭环能力。

  其次是工具生态的成熟。MCP协议、各类API接口、安全沙箱等基础设施让Agent真正具备了"行动力",能够安全地与真实世界交互。

  第三是市场需求的爆发。企业对智能化的需求已经从"提升效率"转向"完全自动化",Agent正好满足了这一痛点。

  “大模型的规划推理、任务拆解能力都在不断提升。同时,AI编程也在走向自动化。你不需要懂编程,利用自然语言把需求讲清楚,就可以实现程序开发。这让AI插上了手和脚,拥有了更强的可执行力。” 姚欣解释,而在需求层面,不少知识密集型、执行标准化的工作,Agent能达到甚至超过入门级员工的水平,这极大推动了Agent的加速落地。

  AI推理爆发式增长为分布式云带来机遇

  Agent市场将在2025年进入千亿级规模,特别在企业服务、内容创作、智能客服等领域。这意味着AI算力基础设施将迎来新的变革。随着Agent应用的普及,AI算力将进一步从"训练为王"转向"推理为王"。

  “市场趋势上,我们看到两个明显变化:一是推理算力需求已经超过训练需求,二是对低延迟、高并发推理的需求激增。” 姚欣称。

  这恰恰是PPIO的机会所在。PPIO运营着全球4000+分布式算力节点。姚欣透露,其AI算力云业务增长迅猛,过去一年实现了百倍以上的增长,目前日均token调用量超过2000亿,在独立AI云公司中排名前二。

  与阿里云、亚马逊云等集中式云计算厂商不同,PPIO采取的是轻资产运营模式,整合了第三方数据中心机房里的闲置算力。

  “我们的商业模式可以比喻为‘算力滴滴’。就像滴滴整合闲置车辆一样,PPIO并不自建数据中心,而是整合全国闲置的算力资源。这让我们能以更低成本获得算力,同时为算力拥有方提升资源利用率,创造额外收益,形成共赢生态。”

  通过这种分布式资源调度,PPIO能提供更低成本的推理服务。“国内不同城市的电价差能达到3-5倍左右,房租场地、运维成本也能相差若干倍以上。PPIO 国内的算力节点已经覆盖 1300 多个县市,这些更下沉、更广覆盖的资源,让资源成本相对较低。” 姚欣解释。

  更分散、更分布的算力节点还让PPIO实现更低的时延,从而实现更高的性能。“ 我们能实现低于200ms的延时服务,并且通过FP8量化、KVCache压缩、投机采样等技术,我们实现了大模型推理10倍以上的性能提升。” 姚欣提到,“更重要的是,在国产化替代的大趋势下,本土分布式算力网络具有战略价值。我们能够支撑教育、金融、政务等对数据安全有严格要求的行业需求。”

  安全执行、成本控制成为智能体的落地挑战

  从对话生成跃迁到自主执行,智能体正成为最重要的商业化锚点和下一代人机交互范式。但在落地过程中,其挑战与痛点随之浮出水面。

  姚欣认为,挑战主要在于安全执行、成本控制和多Agent协作三个方面。

  “在安全方面,因为大语言模型存在幻觉问题,生成代码时可能会导致程序出现故障。很多智能体经常执行一半卡住了,或调了一个不该调用的API,因此不能在日常应用环境中直接让AI来执行代码。”

  此外,随着AI智能体的爆发,市场整体Tokens使用量正在暴增。“智能体调用模型时,单次任务可能要消耗几十万到几百万Tokens。相比过去人类一次对话消耗约几千token,智能体的单次任务成本要提升百倍左右。” 姚欣分析。

  不过,机遇往往与挑战并存。这也意味着在推理加速、成本降低、模型性能优化等方面,将产生巨大的市场空间。

  在刚刚结束的WAIC 2025期间,PPIO正式发布国内首个 Agentic AI 基础设施服务平台,通过能毫秒级启动的安全沙箱解决执行风险,通过分布式算力网络实现成本优化。

image

  传统云平台为通用计算设计,而Agent需要的是"瞬时启动、安全执行、弹性扩缩"的专用基础设施。姚欣介绍,该平台解决了Agent规模化的三大核心痛点:安全隔离、弹性算力和工具整合。

  “我们的Agent沙箱基于Firecracker MicroVM,实现了小于200ms的冷启动和VM级安全隔离,单实例成本比国外同类产品低50%以上。更重要的是,我们整合了Browser use、Computer use、MCP等主流Agent工具链。” 姚欣指出,这为开发者提供了"即开即用"的Agent开发环境,大幅降低了Agent应用的开发门槛和运营成本。预计将加速中国Agent生态的形成,让更多企业能够快速部署AI智能体。

  从单一Agent应用走向多Agent协作

  自动驾驶汽车、人形机器人正成为人工智能的新应用领域,亟需低时延的AI算力。PPIO也展开了相关合作布局。

  “在智能驾驶方面,我们与极豆智能深度合作,为其沧海大模型提供训练算力,支持智能座舱的多模态AI能力,包括智能助手、语音交互、AI电台等功能。PPIO 结合低延迟AI 推理和边缘云传输服务能提供毫秒级响应,满足车机交互的实时性要求。” 姚欣介绍。

  在具身智能方面,机器人正在从"程序控制"向"AI驱动"转变。机器人需要实时的感知、决策和执行能力,这对算力的低延迟、高并发要求极高。而分布式算力网络天然适合这类场景。

  当前,AI正在经历从"思考"到"行动"的关键跃迁。大模型解决了"能思考"的问题,Agent要解决"能行动"的问题。展望未来,姚欣认为,AI发展将经历三个阶段:

  现阶段是单一Agent应用爆发,重点是工具调用和任务执行。至中期阶段,多Agent协作系统成熟,形成复杂的智能体生态。到长期阶段,通用Agent出现,将接近真正的AGI能力。

  在此发展过程中,PPIO的目标是成为全球领先的Agent基础设施提供商。为此,PPIO已在香港设立出海总部,把算力滴滴模式复制到海外。

  “我们与北欧、中东、东南亚、北美等算力合作方一起合作,为海外的Agent提供服务。从长远来看,我们希望让每个开发者都能轻松构建和部署Agent应用,推动整个行业向智能化转型。” 姚欣称。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500