• 最近访问:
发表于 2026-06-12 13:53:00 股吧网页版
从双臂协作到环境泛化,这款世界模型横扫四大权威榜单,还向全行业开源!
来源:上观新闻

  近日,大晓机器人开悟世界模型(Kairos)同时在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、DreamGen等全球针对世界模型视频生成和状态预测的权威具身智能评测中均实现第一,超越Cosmos3、PI、MotuBrain、being-H0.7、Abot、Fast-WAM、Wan2.2等全球主流世界模型。凭借首创的原生统一世界模型架构——“多模态理解—生成—预测”一体化架构,实现了从具身视频生成、任务指令追随、泛化能力到场景鲁棒性的全维度领先,并向全行业开源。

  复杂双臂操作能力获权威验证

  在全球最具挑战性的双臂机器人操作评测基准RoboTwin 2.0中,Kairos以96.1%的平均成功率位列所有参评方法第一,刷新当前最好成绩,并显著领先传统VLA模型,展现出在复杂双臂协作、精细操作与多任务泛化场景中的领先能力。

  RoboTwin 2.0是由上海交通大学、香港大学,联合上海人工智能实验室等研究团队共同推出的高难度双臂操作评测基准,包含50项复杂协同任务。该基准核心对比了VLA(视觉语言动作)模型与WAM(世界动作模型)两大技术范式,后者因具备环境动力学预测能力,更契合长时序推理与复杂规划需求。

  在这一极具挑战的测试中,Kairos以96.1分的平均成功率强势登顶榜首。其在Clean(标准)场景取得96.9分,在Randomized(随机化)场景取得95.2分,不仅远超G0.5(93.2)starVLA(88.3)等VLA模型,也全面超越AIM(93.1)、Fast-WAM(91.8)、MotuBrain(96.0)等主流世界模型。这一显著优势得益于Kairos对世界动力学与动作演化的联合建模,使其在复杂双臂操作的规划、执行及应对现实不确定性方面实现了质的飞跃。

  实现世界模型路线范式超越

  在全球最严苛的场景级泛化能力评测基准LIBERO-Plus中,Kairos世界模型以89.0分的总成绩力压所有主流VLA模型和世界模型,登顶全球榜首。

  LIBERO-Plus由上海创智学院、复旦大学、同济大学和新加坡国立大学的研究团队共同提出,通过模拟相机视角、机器人形态、语言指令、光照条件、背景环境、噪声干扰、空间布局等7种真实场景变量,测试模型在未知扰动下的鲁棒性,是衡量机器人能否适应开放世界的“终极考验”。

  评测结果显示,Kairos不仅超越同为世界模型的Being-H0.7(84.8分),更全面超越了包括 ACoT-VLA(88.0分)、Pi 0.5(85.7分)、ProGAL-VLA(85.5分)在内的所有主流VLA模型。在核心子维度上,Kairos展现出碾压级的环境鲁棒性:光照(97.7)背景(95.8)噪声(96.8)三大维度均取得接近满分的成绩,相机视角(95.5)语言指令(86.8)维度也位居前列。

  这份成绩首次证明,世界模型路线在场景级泛化能力上已经超越了传统VLA路线。Kairos世界模型能够在光照突变、背景杂乱、存在噪声干扰的复杂环境中稳定执行任务,准确理解多样化的语言指令,并适应不同的相机视角。这意味着搭载Kairos世界模型的机器人以极小代价,即可直接部署到家庭、工厂、商场等多样化真实场景中,为具身智能的大规模商业化落地扫清了最后一道核心技术障碍。

  物理建模精度达到高水平

  在衡量机器人世界建模能力的行业金标准WorldModelBench机器人专项测试中,Kairos-4B以9.30分的总成绩登顶全球榜首,仅用4B参数便全面超越了包括28B参数的Lingbot、16B参数的Cosmos3、14B参数的Abot-Physworld、5B参数的Wan2.2在内的主流模型,创造了世界模型领域参数效率的新纪录。

  该基准由加州大学伯克利分校、加州大学圣迭戈分校、英伟达和麻省理工学院的联合研究团队提出,核心评估指令遵循和未来帧生成两大能力,直接决定机器人能否理解人类指令并预判动作后果,是具身智能最基础的核心能力。

  评测结果显示,Kairos在多个核心维度实现全面领先。指令遵循得分2.36,与16B参数的Cosmos3并列全球第一,参数效率提升4倍;在物理遵循维度取得4.96分的高分,其中牛顿力学、重力两大核心物理规律维度全部斩获满分1.00;此外,在时序质量指标上取得满分1.00,展现出超越竞品的时序一致性与视觉连续性。

  泛化能力领跑全球

  在专为机器人具身智能设计的DreamGen Bench评测中,Kairos世界模型一举夺得平均物理遵循和总平均分两项全球第一,全面超越Cosmos3、Lingbot、Wan2.2等主流世界模型。

  DreamGen由英伟达,联合华盛顿大学、加州大学伯克利分校、加州大学洛杉矶分校等多所顶尖高校的研究团队共同提出,是目前系统性评估世界模型真实场景泛化能力的基准,其得分与下游机器人策略训练性能呈显著正相关,分数越高,模型生成的合成数据训练出的机器人实际表现越好。

  在核心三大泛化场景中,Kairos世界模型在物理遵循(PA)维度上大幅领先,其中新行为执行得分0.489和新环境适配得分0.581位居全球第一。在指令遵循(IF)维度上,新行为执行得分0.745也取得第一名。综合泛化能力大幅超越 Lingbot、Cosmos3、Abot-PhysWorld等主流世界模型。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500