百万token不失忆，MiniMax刚启上市辅导又发M3，自研架构曝光_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-06-02 06:34:50 股吧网页版

百万token不失忆，MiniMax刚启上市辅导又发M3，自研架构曝光

来源：上观新闻

　　不久前正式启动A股上市辅导，同时也是港交所上市公司的上海企业MiniMax，昨天（6月1日）再推新一代通用模型MiniMax M3。

　　M3模型旨在挑战大模型读取长文档、大段代码时“越往后越忘事”，以及算起来又慢又贵的痛点，是国内首个同时具备前沿 Coding（编程）能力、1M（兆）超长上下文、原生多模态三项核心能力的大模型。上述“三合一”能力很容易引发业内推测——M3正是对标美国Anthropic公司于今年4月推出的Claude Opus 4.7。Opus 4.7主打极致的指令遵循、高清视觉、深度推理及专业代码能力。当下，MiniMax M3不能说能力已超越Opus 4.7，但胜在开源策略与性价比优势。

开源的M3，能力逼近Claude Opus 4.7。

　　具体来看，在衡量编程能力的SWE-Bench Pro评测基准中，MiniMax M3超过OpenAI的GPT-5.5和谷歌的Gemini 3.1Pro，逼近Opus 4.7。

　　不同于大量模型是在后期才加上看图、看视频的能力，M3从训练的一开始，就实现文字、图片、视频等多模态混合训练，体现出“原生多模态”的属性。

　　全球大模型竞争正酣，各家公司保持优势的关键能力，在于当Agent（智能体）的任务复杂度不断提高时，模型如何实现更长上下文、更稳定记忆，以及更低成本推理。

　　据了解，支撑M3保持优势的关键技术底座，在于MiniMax公司自研的稀疏注意力架构MSA（MiniMax Sparse Attention）——相较传统“全注意力机制”，MSA能显著降低长上下文的计算成本，并将上下文窗口提升至100万token（词元），相当于2本中文长篇小说。这意味着，模型在处理长文档、复杂代码仓库、多轮任务协作等场景时可保留更完整的信息链路。关键在于，MiniMax的模型性价比依旧能打，M3的单token计算量仅为上一代模型的约二十分之一。

MiniMax公司自研的稀疏注意力架构MSA。

　　AI行业的终极竞争，在于智能能力的进步速度。MiniMax M1于去年6月发布。去年四季度，公司又密集发布M2和M2.1模型。M2.5则于今年2月发布。此次再发M3，足见上海大模型公司的研发效率。

（文章来源：上观新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》