六年来首次！OpenAI发布两款开放权重AI推理模型！奥尔特曼称其为“全球最佳开放模型”_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-08-06 06:56:50 股吧网页版

六年来首次！OpenAI发布两款开放权重AI推理模型！奥尔特曼称其为“全球最佳开放模型”

来源：每日经济新闻

　　OpenAI向开源模型迈出重要一步：六年来首次推出开放权重模型。

　　OpenAI首席执行官山姆·奥尔特曼当地时间8月5日宣布，公司将在未来几天里带来许多新东西，其中周二迎来一项“小而重磅”的更新——预热已久的开源模型GPT-OSS。

　　简单而言，OpenAI在8月5日共发布两款开放权重AI推理模型。其中参数量达到1170亿的gpt-oss-120b能力更强，可以由单个英伟达专业数据中心GPU驱动；参数量210亿的gpt-oss-20b模型，则能够在配备16GB内存的消费级笔记本电脑上运行。

　　在今年1月DeepSeek引爆开源AI风暴后，奥尔特曼曾认错称OpenAI在开源技术方面“站在了历史的错误一边”，这正是OpenAI重新推出开源模型的原因。

　　两款模型都以宽松的Apache 2.0许可证发布，企业在商用前无需付费或获得许可。

　　奥尔特曼在社交媒体表示：gpt-oss是一个重大突破，这是最先进的开放权重推理模型，具有与o4-mini相当的强大现实世界性能，可以在你自己的电脑（或手机的较小版本）上本地运行。我们相信这是世界上最好、最实用的开放模型。

　　同时，亚马逊宣布将首次向客户提供OpenAI的模型，计划在其Bedrock和SageMaker平台上提供OpenAI的开放AI权重新模型。这是云计算巨头亚马逊首次提供OpenAI的产品。

　　gpt-oss-20b和120b的发布标志着OpenAI战略转向的重要节点，此前该公司多次推迟开放权重模型发布，并进行了广泛的安全测试和评估，以确保模型不被恶意利用。

　　OpenAI介绍，两款gpt-oss模型采用了其最先进的预训练和后训练技术，特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合（MoE）架构的Transformer，以减少处理输入所需的活跃参数数量。

　　gpt-oss-120b每个token激活5.1亿参数，总参数量为1170亿；gpt-oss-20b激活3.6B参数，总参数量为210亿。模型使用交替的密集和局部带状稀疏注意力模式，支持高达128k的上下文长度。

　　OpenAI称gpt-oss-20b是一款中型开放模型，gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。

　　OpenAI表示，较小的模型至少需要16GB显存或统一内存才能发挥最佳性能，并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少60GB显存或统一内存。

　　在性能评估方面，OpenAI披露，gpt-oss-120b在核心推理基准测试中接近OpenAI o4-mini的表现。较小的gpt-oss-20b模型在相同评估中达到或超过OpenAI o3-mini的性能。

　　gpt-oss-120b在竞赛编码（Codeforces）、通用问题求解（MMLU和HLE）以及工具调用（TauBench）方面均优于OpenAI o3mini，并匹敌甚至超越了OpenAI o4-mini。它在健康相关查询（HealthBench）和竞赛数学（AIME 2024和2025）方面的表现甚至超过o4-mini。

　　即使规模较小，gpt-oss-20b在上述同类的评估中也匹敌甚至超越了OpenAI o3mini，甚至在竞赛数学和健康方面也超越了后者。

　　值得注意的是，相较o3和o4-mini模型，两款开放模型也会出现更多的幻觉。OpenAI解释称，由于较小的模型拥有的世界知识比大型前沿模型少，所以更容易产生幻觉也在意料之中。在OpenAI内部用于衡量模型对人物知识准确性的PersonQA基准测试中，gpt-oss-120b和gpt-oss-20b分别对49%和53%的问题产生幻觉，达到o1模型的3倍多，也高于o4-mini模型的36%。

　　顺便一提，作为毫无惊喜的预告，奥尔特曼同时强调本周晚些时候会有一项“重大更新”。鉴于公司这段日子不断吊业界胃口的举动，市场普遍预期OpenAI下一个重磅更新将是推出GPT-5。

　　OpenAI对开放权重模型的安全性给予了特别关注，因为一旦发布，对手可能对模型进行恶意微调。该公司在预训练期间过滤了与化学、生物、放射性和核（CBRN）相关的有害数据。

　　为直接评估风险，OpenAI对模型进行了专门的生物学和网络安全数据微调，创建了攻击者可能制作的特定领域非拒绝版本。经过内部和外部测试，这些恶意微调的模型无法达到其准备框架中的"高能力"阈值。

　　OpenAI此次发布开放权重模型很大程度上受到市场竞争压力驱动。OpenAI总裁Greg Brockman在本周二的记者会上表示："看到生态系统的发展令人兴奋，我们很高兴能为此做出贡献，真正推动前沿发展，然后看看会发生什么。"

　　OpenAI与英伟达、AMD、Cerebras和Groq等芯片制造商合作，确保模型在各种芯片上良好运行。英伟达CEO黄仁勋在声明中称：OpenAI向世界展示了在英伟达AI上可以构建什么——现在他们正在推进开源软件的创新。

　　值得注意的是，谷歌 DeepMind 8月4日宣布推出第三代通用的世界模型 Genie 3 ，可以生成前所未有的多样化交互式环境，给出文本提示，Genie 3 可以生成动态世界，可以以每秒 24 帧的速度实时导航，并以 720p 的分辨率保持几分钟的一致性。

　　DeepMind 在模拟环境领域已有十余年的深厚积累。从训练能玩转即时战略游戏的 AI，到为机器人开发开放式学习环境，这些研究都指向了一个共同的目标：构建强大的世界模型。

　　与前代模型（如 Genie 1/2）和视频生成模型（如 Veo 2，Veo 3对直觉物理学的深刻理解）相比，Genie 3 是第一个允许实时交互的世界模型，同时与 Genie 2 相比，其一致性和真实感也得到了提升。

　　Genie 3的终极目标之一是为具身智能体（Embodied Agent）提供一个无限丰富的训练场。DeepMind已将其与通用智能体SIMA进行结合测试。研究人员可以为SIMA设定一个目标（如在面包房里找到工业搅拌机），SIMA则通过向Genie 3发送导航指令来尝试完成任务。Genie 3像一个真正的世界一样，根据SIMA的行为实时反馈结果，从而让智能体在海量的what if场景中学习和成长。

　　每日经济新闻综合公开资料

（文章来源：每日经济新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》