• 最近访问:
发表于 2026-06-18 16:39:30 股吧网页版
Fable5/Mythos5发布,长任务Agent会把算力需求再推高吗?
来源:界面新闻

  2026年6月10日,Anthropic发布Claude Fable5与Claude Mythos5。关于这次模型更新,值得我们重点关注的,不只是模型回答得更准、聊天体验更好,而是任务形态变了:大模型正在从问答工具,往能够持续规划、执行、检查和修正的长任务Agent方向升级。

  对应到投资上,问题也很直接。如果AI不只是帮人写一段代码、回答一个问题,而是替人完成一项复杂工程任务,它消耗的Token、推理时间、算力资源和企业部署需求,可能都会上一个台阶。

  一、这两个模型是什么?

  Fable5与Mythos5可以理解为Anthropic基于同一底层模型能力做的分层发布。

  Fable5是面向普通用户开放的Mythos-class模型,定位为公开可用的旗舰版本。它的重点不是把普通聊天体验再打磨精进一些,而是处理更长时间、更复杂、更偏异步执行的任务。说得直白些,它不只是回答得更好看,而是要在更长的任务链条里稳定干活。

  Mythos5则是同一底层能力中权限更高、限制更少的版本,优先面向Project Glasswing等可信安全伙伴开放。由于这类模型在网络安全、生命科学等领域能力更强,也可能带来更高风险,Anthropic采用了更偏企业级的分层权限、安全审计和可信访问机制。

  二、这两个模型有多强?

  从公开测试看,这一代模型的能力提升主要体现在三类任务上:综合推理、Agent编程,以及复杂代码质量。

  在人类最后考试(HLE)上,Mythos 5在不调用工具的情况下超过Preview版本,相比GPT-5.5、Gemini 3.1 Pro也明显领先。HLE主要衡量模型在数学、科学、人文、逻辑推理等复杂问题上的综合能力,而且题目通常不是简单检索就能回答。这个分数更高,说明模型不是只会生成流畅文本,而是在长链条推理、跨学科理解和复杂问题拆解上更进一步。

  图1:HLE测评结果

image

  数据来源:新智元,易方达指数

  编程能力的差距更直观。SWE-Bench Pro主要用来测评模型能不能处理真实世界里的Agent编程任务,比如理解代码库、定位问题、修改代码、跑测试并修复错误。Fable 5拿到80.3%,高于11天前刚发布的Opus 4.8的69.2%,也高于GPT-5.5的58.6%和Gemini 3.1 Pro的54.2%。这说明它已经不只是“生成一段代码”,而是更接近能在真实工程环境里推进一段任务。

  图2:Agentic coding测评结果

image

  数据来源:新智元,易方达指数

  代码质量也拉开了差距。在Cognition推出的FrontierCode Diamond中,Fable 5拿到29.3%,而GPT-5.5只有5.7%。这个榜单更关注Agent写出来的代码质量,而不是单纯能不能跑通。换句话说,模型要理解需求、控制修改范围、减少副作用,还要让代码更接近工程团队能接受的状态。

  图3:Frontier Code测评结果

image

  数据来源:新智元,易方达指数

  早期案例也能说明这种变化。全球头部支付科技公司Stripe用Fable 5在5000万行Ruby代码库里做全局迁移,据称原本一个团队要两个月以上的工作,该模型一天就完成了。这个案例的重点不是“快”,而是任务规模变了:模型开始能够应对大型代码库、复杂依赖关系和连续验证流程。换句话说,AI-Coding正在从“补几行代码”,走向承接一段完整工程任务。

  三、为什么长任务Agent有望拉动算力需求?

  算力需求增长,不只来自模型参数变大,也来自使用方式的变化。

  过去很多AI应用是单轮问答:用户提问,模型回答,任务结束。但Agent模式下,一个任务往往会被拆成多步:先理解目标,再制定计划,再调用工具,再检查结果,再根据反馈继续修正。一次任务可能包含多轮推理、多次工具调用、多次上下文读取和多次结果验证。

  也就是说,完成同一个工作目标,Agent模式消耗的Token数量、推理时间和上下文窗口使用量,都可能明显高于普通聊天。代码迁移、复杂工程修复、长文档分析、金融研究、科研辅助这些场景尤其如此,任务链条长,对模型稳定性和算力供给的要求也更高。

  更值得关注的是企业级Agent的使用频率。它不是偶尔试一次,而可能嵌入研发、运营、风控、客服、投研等日常流程。一旦从个人尝鲜走向组织级部署,算力需求就会从“流量驱动”进一步变成“工作流驱动”。这类需求通常更持续,也更看重低延迟、高可用和安全可控。

  因此,Fable5/Mythos5不只是一次模型更新。它进一步说明,大模型竞争的主线正在从聊天机器人,转向长任务Agent、AI Coding、知识工作自动化和安全可控的企业级部署。

  四、在这种情况下,哪些环节可能受益?

  长任务Agent成为AI应用的重要方向,投资线索最终还是会回到算力基础设施产业链。原因在于,这类能力要真正进入企业场景,不能只停留在模型发布和产品演示层面,还要有足够的云端推理资源去承接高频调用。海外云厂商、模型公司和AI应用平台要推广这类Agent能力,推理基础设施就需要持续扩容。

  从硬件环节看,相关需求会沿着AI服务器和数据中心链条传导。GPU和AI服务器是核心,网络互联决定集群效率,光模块、交换机、高速连接器、PCB等环节都会受益于集群规模扩大。与此同时,数据中心功率密度提升后,电源、散热、液冷、机柜等配套也会变得更重要。长任务Agent越多,推理侧负载越重,这些硬件环节的需求弹性也越值得跟踪。

  五、应选择什么产品布局算力硬件的产业趋势?

  不少创业板公司本身就和全球AI硬件产业链联系密切。它们通过光通信、服务器零部件、PCB、消费电子、半导体设备材料、电源散热等环节,参与海外算力基础设施建设,未来相关公司的订单和业绩弹性可能逐步体现。

  对普通投资者来说,海外算力链覆盖环节多,既有光模块、PCB、服务器零部件,也有半导体设备材料、电源散热和消费电子,逐一个股筛选难度不低。相比集中配置于单一公司,借助ETF打包配置,可能是一种更为便捷、省心的参与方式。可以关注创业板ETF易方达(159915,联接基金A/C/Y:110026/004744/022907)。该产品跟踪创业板指,覆盖创业板中市值较大、流动性较好的代表性公司,可作为布局成长资产和观察AI硬件链外溢机会的工具之一。

  如果希望进一步强化成长风格,也可以关注创业板成长ETF易方达(159597,联接基金A/C:021749/021750)。该产品在海外算力产业链中的暴露程度更高,在科技制造和成长风格占优阶段,或可更充分反映产业趋势变化。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500