美东时间8月7日,OpenAI正式发布GPT-5。OpenAI CEO山姆·奥特曼在新模型发布会上称,GPT-5是“世界上最好的模型”,它的问世标志着OpenAI在实现通用人工智能(AGI)道路上迈出“重要一步”。随后,微软也宣布将GPT-5整合到旗下广泛的产品组合中。

据介绍,GPT-5已开始成为ChatGPT的新默认模型,向所有Plus、Pro、Team和免费用户推出,Enterprise 和 Edu用户将在一周后获得访问权限。
编程及智能体任务能力提高
据悉,GPT-5采用了统一系统设计,包含一个高效的基础模型用于处理常规问题、一个具备深度推理能力的“GPT-5 thinking”模型专门应对复杂任务,以及一个实时路由器则根据对话复杂度、工具需求等因素快速选择合适的模型。OpenAI表示,将在API中发布三个版本的GPT-5:gpt-5、gpt-5-mini和gpt-5-nano。
在对GPT-5的介绍中,OpenAI着重强调了其编程及智能体任务能力。
据介绍,GPT-5在关键编程基准测试中达到SOTA级别。数据显示,GPT-5在基于真实软件工程任务的SWE-benchVerified测试中得分74.9%,在评估代码编辑能力的AiderPolyglot测试中得分88%。

开发编程能力已是主要AI大模型玩家共同塑造的趋势。今年5月,Anthropic正式推出Claude 4系列大模型。先期推出的型号包括Claude Opus 4——一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能。国内方面,月之暗面的Kimi K2,以及阿里的Qwen3-Coder也在AI编程领域具有突出的表现。
OpenAI表示,GPT-5是真正的编程协作伙伴,擅长生成高质量代码并处理诸如修复漏洞、修改代码以及解答复杂代码库相关问题等任务,并具备可控性和协作性,能够以极高精度执行非常详细的指令,并在工具调用前及期间提前解释其操作原因。同时,GPT-5在前端编程方面也表现出色,在内部测试中,其在70%的前端Web开发任务中表现优于OpenAIo3。
在编程之外,OpenAI还称GPT-5在各类智能体任务中表现更好,能更可靠地串联多个操作步骤来完成现实世界任务,并在指令遵循和工具调用的基准测试中创下了新纪录。
Manus联合创始人兼首席科学家季逸超表示:“GPT-5在我们的内部基准测试中取得了迄今为止单个模型的最佳性能,在各种智能体任务中都表现出色。”
值得关注的是,埃隆·马斯克也发文表示,Grok4在ARC-AGI测试中击败了GPT-5,并透露Grok5将于今年年底前发布,预计表现将更加出色。

微软抢先接入旗下产品线
OpenAI刚刚官宣,微软就立即宣布,将GPT-5整合到旗下广泛的产品组合中,包括Microsoft 365 Copilot、Microsoft Copilot、GitHub Copilot和Azure AI Foundry等平台,让微软的企业和消费者用户能够立即体验到GPT-5的高级推理能力和编程优势。
“这是我们的合作伙伴OpenAI推出的迄今为止能力最强大的模型,在推理、编码和聊天方面带来了重大新突破,所有训练均在Azure上进行。”微软CEO萨提亚·纳德拉表示。对此,马斯克警告称:“OpenAI会把微软生吞了。”
GPT-5正式开始成为ChatGPT的新默认模型,向所有Plus、Pro、Team 和免费用户推出,Enterprise和Edu用户将在一周后获得访问权限。
与GPT-4o一样,GPT-5的免费和付费版的区别在于用量。Plus用户享有更高使用限额,Pro用户可无限使用并获得增强版本GPT-5 Pro。对于免费用户,完整的推理功能可能需要几天时间才能完全上线。一旦免费用户达到GPT-5的用量限制,OpenAI就将为他们切换到更小的模型GPT-5 mini。
The Information报道称,OpenAI在2025年前七个月的年收入几乎翻了一番,年化收入达到120亿美元,但成本也在上升。业内人士认为,这一数字意味着OpenAI每月产生10亿美元收入,其ChatGPT套件的周活跃用户激增至约7亿。同时,OpenAI也将2025年的现金消耗预测上调至80亿美元,比早前预测高出10亿美元。
