当机器人试图在陌生房间自主导航、工业机械臂需精准识别零件时,物理世界的复杂数据如何支撑其“认知能力”?
作为“杭州六小龙”之一的群核科技董事长黄晓煌,在2025世界机器人大会上接受上海证券报记者专访时表示:三维空间数据稀缺性与场景适配难题,是当前阻碍具身智能应用落地的关键卡点之一;海量可交互的三维数据,正在赋予机器人“空间智慧”。
空间数据稀缺成行业痛点
“让机器人看懂复杂室内环境,可能需要百万级的数据量,但准确率可能依然只能达到80%;若要提升至90%,数据量需增至千万级。这不仅获取困难,还有极高的成本问题。”黄晓煌以一组数据为例揭示行业困境,他表示,三维数据的获取难度、成本与数据质量问题,构成了具身智能训练数据的多重挑战。
他进一步解释道,互联网上的文本与图像数据易得,物理正确的三维空间数据则非常稀缺。以室内场景为例,真实数据在互联网上极为稀缺,而人工构建一个三维空间的成本可能高达上万元。更关键的是,训练数据必须精准匹配应用场景。
面对数据困境,群核科技提出生成高质量合成数据的解决方案。其核心产品SpatialVerse(群核空间智能平台),在虚拟环境中匠心独运,生成了海量、物理正确的三维场景,不仅有效规避了信息安全问题,还实现了高精度标注数据的批量产出。
“SpatialVerse提供的合成数据,优势在于天生结构化。”黄晓煌举例称,传统人工标注仅能标记物体标签,而群核的合成数据可自动生成物体关系信息——如桌子与椅子的配套关系、水杯随桌面移动的物理规律,甚至包括铰链的机械特性、材质的摩擦系数等细节。
依托多年创业的积累,群核科技目前已构建起全球最大的室内场景认知深度学习数据集,包含3.6亿多个3D模型、数亿个空间场景。这些模型不仅数量庞大,而且每个都附带了精确的物理特性标签,为室内空间的机器人训练和具身智能技术研发提供了坚实的数据基础。
“这些数据免去了繁琐的人工标注流程,直接为训练机器人的空间认知和交互能力所用。”黄晓煌说。
数据飞轮驱动生态闭环
在海量数据的基础上,群核科技形成了“工具—数据—模型—工具”的闭环。黄晓煌将其比喻为“空间智能飞轮”:通过空间编辑工具积累场景数据,用数据训练空间智能模型,再反哺工具迭代。
目前,公司已开源空间理解模型SpatialLM。其中,SpatialLM基于LLaMA与通义千问训练,输入点云或视频即可输出结构化空间描述脚本,开源后登上HuggingFace大模型趋势榜前三。群核最近发布的开源数据集Interior GS也受到开发者的广泛认可,其包含1000个3D高斯语义场景、55.5万个物体实例,兼容激光雷达与纯视觉方案,有效解决了因硬件变动而引发的模型重新训练这一行业难题。
“我们之所以开源,是因为觉得需要降低行业门槛,建立起产业生态。”黄晓煌表示,群核科技已与银河通用等企业合作。未来,随着机器人进入家庭生活、工厂、商业空间等场景,它们需在千变万化的环境布局中习得泛化能力,而合成数据则能以低成本提供海量的训练场景,诸如物品位置的微调、光照强度的变化等细微之处,均可通过虚拟环境迅速生成和调整。
“具身智能的终极突破在于让机器理解空间和物理世界的规律。”黄晓煌表示,当前AI的“认知”尚局限于二维层面,而AI真正进入真实世界需掌握空间认知。未来,群核科技将持续拓展更多领域的空间场景,同时呼吁产业界共建开源生态。
“只有把空间智能的蛋糕做大,才能让更多企业受益于技术红利。”黄晓煌说。