• 最近访问:
发表于 2026-04-15 19:02:10 股吧网页版
具身模型Scaling Law初显?人形机器人数据战事全面打响
来源:财联社 作者:科创板日报记者 敖瑾

  《科创板日报》4月15日讯(记者敖瑾)具身智能围绕数据展开的中场战事打响。

  过去一年,行业焦点从本体能力转向具身大脑。这在资本市场表现为,2026年一季度,多家专注具身大脑的公司相继完成大额融资,星海图、智平方、自变量等项目估值快速跃迁,密集跻身独角兽行列。

  而随着大脑竞赛的不断升温,一个更底层的约束变量——数据,也越来越受到重视。在此背景下,自2025年下半年起,具身智能企业在数据侧的布局明显加速:从数据采集中心建设,到开源数据集,再到分布式采集网络探索,数据竞争成为具身智能发展的新阶段性主线。

  最近一家在数据层做出了动作的是戴盟机器人。其于今日(15日)联合多家海内外学术机构与企业,发布了具身数据集Daimon-Infinity。

  触觉数据可显著减少训练所需数据量

  戴盟机器人成立于2023年,孵化于香港科技大学研究团队,是一家聚焦于触觉感知与灵巧操作的具身智能企业,截至目前,公司官宣完成4轮融资,投资方包括中国移动、招商局创投、招银国际以及国中资本等。

  据公司方面介绍,此次最新发布的数据集包含触觉、视觉、动作轨迹及语音文本等多模态信息,其中1万小时数据面向行业开放并在阿里魔搭社区上线开源。按照公司规划,年内这一数据集规模还将扩展至数百万小时、近十亿条。

  在数据采集方式上,Daimon-Infinity 依托戴盟自研的二指夹爪及五指手套数采设备,结合高分辨率视触觉传感器、鱼眼相机、双目相机及IMU等多类传感器,实现对操作过程的多维度记录。其中,触觉数据覆盖接触力、形变、接触状态以及材质、纹理、滑移等物理交互信息,主要用于补充精细操作任务中极为稀缺的触觉特征。

  戴盟方面表示,该数据集已在OmniVTA等多个含触觉模型中完成验证。

  公司相关负责人对《科创板日报》记者表示,在实际验证中发现,触觉数据的引入,能够显著降低模型训练对数据规模的依赖。原因在于,相比视觉信息,触觉能够直接感知接触关系与物体特性,避免多视角采集带来的冗余数据与遮挡问题,从而提升信息获取效率。其进一步表示,在一些以接触为关键环节的操作任务中,引入触觉数据后,任务成功率得到了明显提升。

  据介绍,戴盟当前数据主要由其主导,联合全球高校及产业场景方采集,远期目标是逐步转向外发式、众包式采集网络。后者是效率更高的数据采集方式,但对基础设施的要求也更高,需要依托设备端和云端平台的协同运行,以最终实现数据上传、处理、验证与反馈的闭环。

  对于开源数据集的战略选择,上述负责人表示,一方面是基于公司当前已具备成熟的数据生产能力,能够对外持续释放数据;另一方面则是希望通过开源引入研究机构与企业参与验证,推动模型能力迭代。“从具身智能当前的发展阶段来看,模型能力的验证需要多方合力推动。”

  不过,数据资源的商业价值已经开始显现。上述负责人对记者透露,公司当前采集的数据已对接部分具身大脑研发机构及企业,后者既是数据使用方,也在前期参与数据需求定义。

  这也意味着,围绕数据供给的商业模式也在逐步显现。

  百度就做出了一次更体系化的探索。其在4月初推出了“具身智能数据超市”,主要面向模型公司提供数据调用、定制采集等服务,本质上正是围绕数据供给侧展开的一种商业化探索。在更早前的今年1月,湖北人形机器人创新中心与智元机器人正式官宣合作,前者向智元交付了数千小时的人形机器人训练数据。

  从数采中心到分层体系

  目前,具身智能行业围绕数据的布局仍在持续加速。

  上述湖北人形机器人创新中心,事实上就是这轮数采大潮中的训练场模式的代表之一。过去一年,上海、北京等多地都相继启动了具身智能数据采集中心建设,通过集中部署机器人与操作场景,进行规模化数据采集。这类模式以本体为核心,强调数据精度与场景真实性,可以说是当前最直接的数据来源。

  另一方面,行业级开源数据集与工具链也在加速推出,包括智元机器人、乐聚以及最新加入的戴盟等具身智能企业,都相继推出了面向行业的开源数据集与开发工具,参与开源共建。

  同时,国家与高校体系也在推进数据基础设施建设。公开信息显示,北京国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出RoboMIND数据集及Benchmark体系,尝试建立统一评测标准。

  在国际层面,大规模数据对模型能力的影响也在被持续验证。英伟达研究团队发布EgoScale项目,使用超过2万小时带动作标注的第一视角视频训练模型,并观察到随着数据规模提升,模型能力呈现持续改进趋势。

  更激进的玩家还有Generalist AI。该公司在2025年底发布的GEN-0 模型,使用了超过 27万小时的真实世界操作数据;其在4月初最新发布的GEN-1模型,更是将数据规模进一步推向了50万小时,模型性能和任务成功率也从64%大幅提升至99%,基于此,一些业内人士认为具身模型的Scaling Law得到了初步的验证。

  在具身智能行业内人士看来,Generalist AI路径的价值还在于,利用人佩戴低成本穿戴设备产生的视频数据进行预训练,在降低成本的同时也突破了采集规模的瓶颈。

  上述戴盟数据负责人对《科创板日报》记者表示,具身智能的数据供给存在一个金字塔结构。“最顶层是由机器人本体采集的高质量数据,这类数据精度高、最贴近真实运行状态,在精细操作和特定场景具有重要价值,但采集效率与规模存在明显约束。因此,仅依赖顶层数据,难以支撑模型对复杂场景的泛化能力,还需要中层与底层数据共同补充。”

  其进一步介绍,中层数据更强调在保证可部署性的同时实现规模化,例如通过手持式设备等方式采集,让数据在结构上能够迁移至机器人执行端;底层数据则更多以人为中心,通过第一视角、多模态方式获取大规模数据,以支撑模型在更大规模数据上的训练需求。

  可以看到,极速前进的具身智能领域在短短几年时间内,就经历了竞争焦点的切换,从最早的堆砌硬件,到争夺算法,再到如今对数据基础设施的系统性卡位。当数据成为决定模型能力上限的关键变量,围绕数据展开的竞争或将继续升级。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500