6月22日,出行科技与服务公司如祺出行旗下数据业务板块发布具身智能数据平台,推出面向第一人称操作视频的自动化处理流水线。该流水线覆盖从导入、处理、标注、审核到导出的数据全链路,可将原始真实物理数据高效转化为可直接用于具身智能模型训练的生产资料。
全链路自动化流水线破解数据应用效率瓶颈
具身智能正迎来政策与产业双重风口。今年6月,工业和信息化部、国资委启动人形机器人与具身智能实景实训专项行动,提出2026年底在重点场景实现应用验证和常态部署。广东省也发布行动方案,支持广州、深圳等地建设具身智能训练场体系。
在具身智能发展中,第一人称操作视频是重要的数据来源,它以接近机器人视角记录真实世界的操作过程,为具身模型学习手部动作、物体交互、任务步骤和环境变化提供直接数据。
记者了解到,如祺数据此次发布的平台,可对第一人称操作视频自动完成手部检测、相机位姿测算、三维手部姿态优化等AI预处理,并结合长序列动作切片标注工作台与五维自动质检机制,直接输出适配主流训练框架的标准化数据集,实现“开箱即用”,降低企业数据处理的时间和人力成本。

全链路AI数据能力已服务多家头部企业
如祺出行自2023年起系统布局AI数据服务,依托每年数亿单真实出行场景,已构建起覆盖采集、处理、标注、治理的全链路AI数据能力。
目前,如祺出行已在广州、上海、重庆等地常态化部署超300辆智能驾驶采集车,日均产出1600小时、130TB多模态行车与泊车数据。在全国拥有3大交付基地、超1500人专业团队、1000余家BPO合作伙伴及近百万众包资源,月标注产能达千万级。客户包括小马智行、理想汽车、腾讯等头部企业。
数据显示,2025年,以AI数据解决方案为主要收入来源的技术服务板块营收1.60亿元,同比增长487.4%。
从自动驾驶到具身智能,如祺数据持续拓展服务边界
今年5月,如祺出行披露公司拥有标注、行为、合成及多模态训练数据集四大类AI数据资产,并将持续围绕自动驾驶、具身智能、世界模型等方向拓展数据服务能力。
此次具身智能数据平台的发布,是其AI数据能力向高增长数据处理场景的延伸。如祺数据表示,将依托真实物理世界数据的积累和处理能力,为具身智能产业发展提供数据基础设施支撑。

观察:出行平台的数据优势向具身智能领域延伸
如祺出行此次发布具身智能数据平台,是其数据服务从智能驾驶向更广泛的物理AI领域拓展的一步。出行平台天然具备积累真实世界数据的优势:每年数亿单出行订单带来海量多模态驾驶数据,且附带“感知-决策-执行”的完整反馈链条。这种数据资产在自动驾驶领域的价值已被验证,而具身智能对真实物理世界交互数据的需求,为如祺数据提供了新的应用场景。
文、图/广州日报新花城记者:周伟力