• 最近访问:
发表于 2025-05-30 18:15:30 股吧网页版
最新一期权威大模型榜单出炉:豆包1.5、商汤日日新V6并列国内第一
来源:上观新闻


K图 00020_0

  5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

  豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5Flash Preview,在国内大模型第一梯队领跑。

  位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

  报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

  SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。

  同时,根据Hugging Face——全球最大的AI开源社区上的数据,在Open Compass本月的多模态大模型评测榜单中,商汤日日新V6(SenseNova-V6 Pro)以80.4的总分,超越Gemini 2.5 Pro,位居第一。

  新民晚报记者了解到,凭借多模态长思维链训练、全局记忆、强化学习等技术创新,商汤日日新V6以单一模型即可完成文本、多模态等多种任务,在推理、数理、代码等方面拥有显著优势,能够深度理解人类意图,处理各类复杂信息和复杂问题,为真实的业务应用提供强大助力。同时,商汤日日新V6的多模态训练整体效率对齐语言训练,实现业内最优水平,推理成本亦实现业界最低。

  得益于高效能与低成本的完美结合,商汤日日新V6自今年4月发布以来,获得了行业各界的广泛支持,已在具身智能、智慧教育、智慧文旅等领域携手多家合作伙伴,将共同推动多行业、多场景落地。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500