中经记者曲忠芳北京报道
2026年已过去三个月,具身智能机器人行业的发展风向标日益清晰。人形机器人不再满足于“表演炫技”,而是要真正落地应用,在社会经济生活的各行各业中“上岗”。在迎接大规模“上岗打工潮”之前,人形机器人首先要破解的便是高质量数据稀缺的瓶颈。
基于破解数据瓶颈的行业共识,具身智能数据采集训练场的建设热潮正席卷全国,并持续升温:从北京、天津到上海,从河南郑州到江苏无锡、苏州,再到广东惠州,从山东济南、青岛到四川成都、绵阳……政府、产业及研究机构等各方力量参与其中,加速布局真实数据采集训练场,为人形机器人“上岗”储备关键训练数据。
具身智能数据采集训练场的建设门槛高吗?重点投入成本在哪些方面?数据从采集到应用要经历哪些环节?如何保障数据采集的高效可用?针对这些业界关注的问题,《中国经营报》记者近日结合实地探访与多方采访,初步找到了这些问题的答案。
数据采集训练场成“新基建”
记者对至少15座规模较大的具身智能数据采集训练场进行了梳理汇总,其中,位于苏州吴江区的长三角一体化示范区智能机器人训练中心,天津帕西尼具身智能超级数据工厂、北京石景山人形机器人数据训练中心、北京人形机器人创新中心主导的具身智能数据训练基地,郑州中原异构人形机器人训练场、无锡具身智能机器人训练场等,均是从2025年开始启动建设或者建成运营,可以说,数据采集训练场的建设热潮正是从去年开始形成的。
需要指出的是,各地对于数据采集训练场的命名或简称不尽相同,诸如“数据工厂”“数采工厂”“数据训练场”“训练基地”等,这里使用“数据采集训练场”作统一指代。对机器人来说,数据采集训练场既像是一个“学校”——学习各种技能,又像是一个培训实习的“工厂”,即机器人在各行业正式“上岗”前,从这里学习、练习各类技能。
事实上,记者了解到,除了这些规模较大、集中度高的数据采集训练场之外,在许多产业园、商业写字楼中,许多企业、研究机构也建设了自身的数据采集训练场,尽管规模相对有限,但正如一位业内人士向记者所说:“现在,数据采集工厂是整个具身智能行业的新基建。”
进入2026年以来,具身智能数据采集训练场的热度丝毫不减,呈现持续扩张的趋势。比如,智元机器人与成都郫都区共建的智元西南具身智能产业基地于3月下旬开启生产线试装配,预计4月正式启动;乐聚机器人在济南平阴县与本地企业投资共建的乐聚(济南)人形机器人数据训练中心于3月25日正式上线投入使用;3月28日,北京石景山人形机器人数据训练中心启动了具身智能实训场三期项目。
另一家具身智能企业帕西尼感知科技,前不久刚刚宣布,将在江苏宿迁、湖北武汉、四川自贡、江西赣州新建4座超级数据采集工厂,与其天津数据工厂联动,由此构建起覆盖全国的分布式超级数据采集矩阵。
除此之外,作为电商巨头的京东也宣布“下场”,于3月中旬宣布将建成“全球规模最大、场景最全的具身智能数据采集中心”。不仅如此,京东的此番入局声势浩大,称将发动内部超过10万名员工和外部最多50万名各行业人士参与数据采集。
值得一提的是,许多具身智能企业即使并没有自建大规模的数据采集训练场,也通过不同的形式参与具身智能数据采集训练链条中。例如,穹彻智能的多款数采硬件——包括手持数采系统RoboPocket、可穿戴数采系统CoMiner等社会化数采设备,已在惠州异构数采厂落地。穹彻智能联合创始人,上海交通大学电子信息与电气工程学院计算机系教授、博士生导师卢策吾表示,通过社会化数采设备,能够使数据采集走出数采场、走入真实家庭、工作场景,通过构建“万人采集”网络,能够实现全社会级别的具身智能数据采集。
建设成本及数据采集流程
国际先进技术应用推进中心(深圳)最新出品的《具身智能数据行业研究白皮书》指出,具身智能数据“金字塔”结构从下到上可划分为三类,分别是互联网视频数据(合成数据)、动作捕捉数据、遥操作数据,从下到上数据的精度随之上升,同时采集成本也相应变高。而具身智能数据采集训练场的采集核心,正是遥操作数据和动作捕捉这两类真实数据。
因此,当人们走进一座具身智能数据采集中心,会看到多台机器人同步运行,而旁边的数据采集人员通过手持式、头戴式等不同形态的设备,在不同的实际场景中做着不同的任务。
那么,建设一个大规模的数据采集训练场的成本投入是多少?多位受访者并没有给予记者一个明确的金额,因为训练场的建设涉及政府招商引资、企业合作、研究机构及基金投资等多方因素,但在建设投入的成本结构方面,受访者提到的成本投入大致相同。
帕西尼多模态数据负责人向记者拆解了数据工厂的成本结构,“大头”集中在四个方面:一是核心专业采集系统,无论是依赖机器人本体的传统遥操作采集路线,还是帕西尼“以人为中心”的全模态实采路线,采集系统是重要成本构成,传统方案尤其突出,机器人本体单台造价动辄60万至70万元;二是人力与运营成本,高质量的数据采集需要庞大且具备产业经验的专业采集团队来支撑;三是场地与基建投入,大型标准化采集需要1万平方米以上的物理空间,以天津帕西尼具身智能超级数据工厂为例,其空间达到1.2万平方米,后续四座新建工厂的规模和标准还将升级;四是算力与存储底座,具身智能的数据产出涵盖触觉、视觉、语音、文本、关节角度与空间轨迹等,需要匹配数百PB(注:1PB=1024TB)级的庞大存储容量与极高的实时算力。
从记者整理汇总的15家已上线运营或尚在建设中的数据采集训练场数据来看,占地面积往往在3000至5000平方米之间,而北京石景山人形机器人数据训练中心、天津帕西尼具身智能工厂则均超过了1万平方米;郑州中原异构人形机器人训练场已部署了近100台机器人,上海浦东的智元数据采集中心则同时部署100多台机器人,北京人形机器人具身智能数据训练基地的这一数字为120台不同品牌的机器人。从产能计划来看,京东机器人数据采集中心将在一年内积累500万小时真实场景视频数据,两年内突破1000万小时,同时采集机器人本体数据100万小时;天津帕西尼具身智能超级数据工厂提供的数据是一年将可产出超2亿条的高质量训练数据;乐聚(济南)人形机器人数据训练中心的年度有效数据采集时长近7万小时。从场景设置来看,各家训练场几乎“标配”了多个真实场景,覆盖汽车制造、3C装配、家庭服务、商务办公、餐饮、康养、医疗、物流仓储、特种应用等。
关于数据从采集到应用的流程,上述帕西尼多模态数据负责人解释,最关键的是三个步骤:第一步是人类实景采集,采集员在数采终端的辅助下完成长序列连续采集,为机器人学习注入人类直觉和物理常识;第二步是高价值精炼,原始采集数据进入自动化工具链,由系统进行数据清洗、时序对齐、格式标准化等处理流程,形成高可用数据;第三步则是模型训练,像天津帕西尼具身智能超级数据工厂最终产出的Omnisharing DB高质量数据集,将作为通用“养料”供给具身智能模型,大模型吸收海量全模态实采数据后,才能使泛化能力实现指数级跃升。