深圳商报·读创客户端首席记者刘琼
数采进家庭,正实实在在改变具身智能的市场化商用进程!
记者获悉,近日,深圳戴盟机器人与中国移动正式达成合作,共同启动“数采进家庭”网络建设:双方依托中国移动数十万家线下营业网点,共建覆盖全国的外发式数据采集网络。首个外发式数采联合创新试点基地在湖南郴州落成,计划于7月15日开启常态化运营。
创新试点基地以“具身数据采集5S店”为定位,项目首期投放1000套设备,满产状态下每年可产生100万小时数据,为行业快速积累极度稀缺的真实场景操作数据。
数据采集“进入真实世界”
记者了解到,创新试点基地集Show(展示)、School(数据采集培训)、Supply(数采设备供给)、Service(售前售后服务)、Synergy(数据模型场景协同)五大核心模块于一体,推动数据基础建设从封闭式采集迈向大众参与的规模化供给。
当市民走进中国移动的营业厅,他领取的可能不是一张电话卡、一台路由器,而是一套机器人数据采集设备!在接受简单培训后,他将以“数采员”的身份回到家中,在日常生活里完成采集任务,将稀缺的真实世界操作数据带给机器人。
“具身智能的竞争核心,当下已经转向高质量真实世界数据的持续获取。”戴盟创始人与首席执行官段江哗表示,将数据采集从封闭式数采厂推向真实家庭,这将是具身智能时代的第一块基础设施拼图,也是整个行业都在等待的一步。
业内普遍认为,具身智能模型的泛化能力,根植于真实环境中的海量交互经验。但行业长期面临一个共同瓶颈:传统数据采集厂运营成本高,且场景任务相对单一、数据容易出现同质化,难以支撑通用模型对“多样性、复杂性、长尾情况”的训练需求。
来自真实世界的操作数据则恰恰最能满足具身模型的训练需求——以家庭场景为例,这是最复杂的真实环境之一,物品千差万别、光照与空间随机变化、任务随时被打断,人的操作也带有强烈的个体差异,这正是具身模型最为亟需的真实世界数据。
“我们便是把数据采集从固定场所中‘外发’出去,延伸到家庭、制造、服务、科研等真实场景,让模型看到更广阔、更多变、更加接近现实的物理世界。”戴盟机器人相关负责人告诉记者。
每年预计产生100万小时数据
今年4月,戴盟发布全球最大规模含触觉多模态物理世界数据集 Daimon-Infinity,并率先搭建外发式数据采集体系,从根本上补齐传统数采厂的短板。作为全球第一大运营商,中国移动遍布全国的线下网点为数据体系提供了广泛而稳定的落点。
移动线下网点作为“具身数据采集5S店”,面向公众提供即领、即学、即用的一站式培训服务;配备二指夹爪、五指手套、头戴式相机等多型采集设备,模拟实操覆盖家庭、物流、制造、展厅、零售五大核心场景。市民经短期培训即可成为数采员,深入真实场景完成采集任务,最大限度还原人类操作的真实性与多样性。
据了解,“数采进家庭”项目以湖南为起点,逐步向全国各地复制推广,最终将形成以线下网点为支点、以周边居民家庭为最小单元、覆盖日常生活全场景的外发式数据采集网络。项目首期投放1000套设备,满产状态下每年可产生100万小时数据,以大众可参与的标准化采集流程,为行业快速积累极度稀缺的真实场景操作数据。
值得关注的是,此次合作是继中国移动链长基金投资戴盟机器人、中国移动具身智能产业创新中心参与戴盟数据集 Daimon-Infinity 之后,双方在业务层面达成的首个落地成果,标志着合作从资本与研发层面正式延伸至基础设施共建。