2026年6月10日,Anthropic发布Claude Fable5与Claude Mythos5。关于这次模型更新,值得我们重点关注的,不只是模型回答得更准、聊天体验更好,而是任务形态变了:大模型正在从问答工具,往能够持续规划、执行、检查和修正的长任务Agent方向升级。
对应到投资上,问题也很直接。如果AI不只是帮人写一段代码、回答一个问题,而是替人完成一项复杂工程任务,它消耗的Token、推理时间、算力资源和企业部署需求,可能都会上一个台阶。
一、这两个模型是什么?
Fable5与Mythos5可以理解为Anthropic基于同一底层模型能力做的分层发布。
Fable5是面向普通用户开放的Mythos-class模型,定位为公开可用的旗舰版本。它的重点不是把普通聊天体验再打磨精进一些,而是处理更长时间、更复杂、更偏异步执行的任务。说得直白些,它不只是回答得更好看,而是要在更长的任务链条里稳定干活。
Mythos5则是同一底层能力中权限更高、限制更少的版本,优先面向Project Glasswing等可信安全伙伴开放。由于这类模型在网络安全、生命科学等领域能力更强,也可能带来更高风险,Anthropic采用了更偏企业级的分层权限、安全审计和可信访问机制。
二、这两个模型有多强?
从公开测试看,这一代模型的能力提升主要体现在三类任务上:综合推理、Agent编程,以及复杂代码质量。
在人类最后考试(HLE)上,Mythos 5在不调用工具的情况下超过Preview版本,相比GPT-5.5、Gemini 3.1 Pro也明显领先。HLE主要衡量模型在数学、科学、人文、逻辑推理等复杂问题上的综合能力,而且题目通常不是简单检索就能回答。这个分数更高,说明模型不是只会生成流畅文本,而是在长链条推理、跨学科理解和复杂问题拆解上更进一步。
图1:HLE测评结果

数据来源:新智元,易方达指数
编程能力的差距更直观。SWE-Bench Pro主要用来测评模型能不能处理真实世界里的Agent编程任务,比如理解代码库、定位问题、修改代码、跑测试并修复错误。Fable 5拿到80.3%,高于11天前刚发布的Opus 4.8的69.2%,也高于GPT-5.5的58.6%和Gemini 3.1 Pro的54.2%。这说明它已经不只是“生成一段代码”,而是更接近能在真实工程环境里推进一段任务。
图2:Agentic coding测评结果

数据来源:新智元,易方达指数
代码质量也拉开了差距。在Cognition推出的FrontierCode Diamond中,Fable 5拿到29.3%,而GPT-5.5只有5.7%。这个榜单更关注Agent写出来的代码质量,而不是单纯能不能跑通。换句话说,模型要理解需求、控制修改范围、减少副作用,还要让代码更接近工程团队能接受的状态。
图3:Frontier Code测评结果

数据来源:新智元,易方达指数
早期案例也能说明这种变化。全球头部支付科技公司Stripe用Fable 5在5000万行Ruby代码库里做全局迁移,据称原本一个团队要两个月以上的工作,该模型一天就完成了。这个案例的重点不是“快”,而是任务规模变了:模型开始能够应对大型代码库、复杂依赖关系和连续验证流程。换句话说,AI-Coding正在从“补几行代码”,走向承接一段完整工程任务。
三、为什么长任务Agent有望拉动算力需求?
算力需求增长,不只来自模型参数变大,也来自使用方式的变化。
过去很多AI应用是单轮问答:用户提问,模型回答,任务结束。但Agent模式下,一个任务往往会被拆成多步:先理解目标,再制定计划,再调用工具,再检查结果,再根据反馈继续修正。一次任务可能包含多轮推理、多次工具调用、多次上下文读取和多次结果验证。
也就是说,完成同一个工作目标,Agent模式消耗的Token数量、推理时间和上下文窗口使用量,都可能明显高于普通聊天。代码迁移、复杂工程修复、长文档分析、金融研究、科研辅助这些场景尤其如此,任务链条长,对模型稳定性和算力供给的要求也更高。
更值得关注的是企业级Agent的使用频率。它不是偶尔试一次,而可能嵌入研发、运营、风控、客服、投研等日常流程。一旦从个人尝鲜走向组织级部署,算力需求就会从“流量驱动”进一步变成“工作流驱动”。这类需求通常更持续,也更看重低延迟、高可用和安全可控。
因此,Fable5/Mythos5不只是一次模型更新。它进一步说明,大模型竞争的主线正在从聊天机器人,转向长任务Agent、AI Coding、知识工作自动化和安全可控的企业级部署。
四、在这种情况下,哪些环节可能受益?
长任务Agent成为AI应用的重要方向,投资线索最终还是会回到算力基础设施产业链。原因在于,这类能力要真正进入企业场景,不能只停留在模型发布和产品演示层面,还要有足够的云端推理资源去承接高频调用。海外云厂商、模型公司和AI应用平台要推广这类Agent能力,推理基础设施就需要持续扩容。
从硬件环节看,相关需求会沿着AI服务器和数据中心链条传导。GPU和AI服务器是核心,网络互联决定集群效率,光模块、交换机、高速连接器、PCB等环节都会受益于集群规模扩大。与此同时,数据中心功率密度提升后,电源、散热、液冷、机柜等配套也会变得更重要。长任务Agent越多,推理侧负载越重,这些硬件环节的需求弹性也越值得跟踪。
五、应选择什么产品布局算力硬件的产业趋势?
不少创业板公司本身就和全球AI硬件产业链联系密切。它们通过光通信、服务器零部件、PCB、消费电子、半导体设备材料、电源散热等环节,参与海外算力基础设施建设,未来相关公司的订单和业绩弹性可能逐步体现。
对普通投资者来说,海外算力链覆盖环节多,既有光模块、PCB、服务器零部件,也有半导体设备材料、电源散热和消费电子,逐一个股筛选难度不低。相比集中配置于单一公司,借助ETF打包配置,可能是一种更为便捷、省心的参与方式。可以关注创业板ETF易方达(159915,联接基金A/C/Y:110026/004744/022907)。该产品跟踪创业板指,覆盖创业板中市值较大、流动性较好的代表性公司,可作为布局成长资产和观察AI硬件链外溢机会的工具之一。
如果希望进一步强化成长风格,也可以关注创业板成长ETF易方达(159597,联接基金A/C:021749/021750)。该产品在海外算力产业链中的暴露程度更高,在科技制造和成长风格占优阶段,或可更充分反映产业趋势变化。