MiniMax上新M3模型，编程能力超GPT-5.5_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-06-01 14:44:00 股吧网页版

MiniMax上新M3模型，编程能力超GPT-5.5

来源：南方都市报

　　继启动A股上市辅导后，MiniMax再迎新动向。6月1日，MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention（MSA），在编程及智能体能力、超长上下文及原生多模态等多个关键方向，均实现代际突破。

　　5月30日，MiniMax Group Inc.在上海证监局办理辅导备案登记，拟首次公开发行股票并上市，行业分类为I65软件和信息技术服务业，辅导券商为中信证券股份有限公司。MiniMax成为继智谱后，于港交所主板挂牌上市又启动“A+H”双平台布局的公司。

　　据悉，M3同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型。MiniMax称，M3是目前的开源模型当中，唯一能同时做到这三点的。

　　M3采取的是自研的稀疏注意力架构MSA（MiniMax Sparse Attention）。相较传统全注意力机制，MSA能够显著降低长上下文下的计算成本，并将上下文窗口提升至100万token。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时，能够在一次推理中保留更完整的信息链路。MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推理效率显著提升。

　　在行业内，采用新的注意力机制、减少token消耗已经成为新模型发布时的标配。比如DeepSeek发布的全新系列模型V4就采取了另一种节省计算量和缓存空间的混合压缩注意力机制，该机制使得模型在处理超长上下文时，能够更高效地组织和检索信息，相较上一代模型只需约27%的计算量和10%的缓存空间，这意味着同样的任务消耗的Token和算力都更少。

　　除模型架构升级外，MiniMax在底层推理算子层面也进行了进一步优化。通过重新设计数据读取与计算路径，相关性能较主流开源方案提升4倍以上。这也符合业内逐渐形成的新共识，即随着Agent任务复杂度不断提高，“更长上下文、更稳定记忆、更低成本推理”正在成为决定产品可用性的关键能力。

　　在大模型目前消耗Token最多的coding和Agentic大项上，M3也做了明显提升。在衡量Coding能力的SWE-Bench Pro上，MiniMax M3超过4月发布、主打编程的OpenAI新一代模型GPT-5.5，以及Gemini 3.1 Pro，接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上，MiniMax M3超过Opus 4.7。在面向自主Agent的端到端评测框架Claw-Eval上，MiniMax M3得到最高分。

　　为验证最新模型的超长上下文、编程和agent能力，MiniMax内部丢给M3一篇ICLR 2025 Outstanding Paper Award 获奖论文并让其独立复现，最终M3自主运行了接近12小时，全程自主产出18次commit与23张实验图表，并跑通了核心实验、验证了论文中提出的方法。

　　多模态一直是MiniMax的核心战略布局，这一方向在M3模型上也得到充分落地。

　　据介绍，M3是一个从Step 0开始进行多模态混合训练的模型。MiniMax在报告中强调，在为相关数据重构整套数据管线后，MiniMax已可以将训练数据Token规模提升至100万亿的量级。这意味着模型能力正在从语言理解进一步向真实数字环境延伸。无论是办公自动化、企业软件操作，还是更复杂的生产力场景，AI进入实际执行层的速度正在明显加快。

（文章来源：南方都市报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》