近日的北京亦庄人形机器人半程马拉松中,完赛队伍数量创新高,年内L4级Robotaxi也在加快铺量。不论是机器人还是自动驾驶,越来越多信号表明,物理AI的拐点已在临近。但业内关注到,还有一些问题需要解决。
仅在感知层面,不同感知维度与器件如何融合就是一个难题。自动驾驶领域视觉和激光雷达路线的分立争论已久。在机器人领域,多种传感器共用的混乱则增加了开发成本。不过,传感器企业已经在做出改变,融合更多种传感器或让一种传感器收集不同维度的信息是一种解决方法。
激光雷达企业不仅关注测距的精度与性能,近期还纷纷走向图像化,激光雷达与视觉路线之间的鸿沟也开始弥合。
弥补路线间的鸿沟
在自动驾驶领域,激光雷达与视觉路线的长期分野,某种程度上也是测距与视觉感知的分野:激光雷达能通过物理方式精确测距,但难以形成人眼类似的视觉图像,而视觉方案可以“看到”画面,却缺乏精确的空间感知。
以特斯拉为代表的一些车企此前走向纯视觉方向,曾引发激光雷达行业巨震。纯视觉的优势明显:图像数据相对统一,可以通过数据飞轮持续收集数据、训练模型,更容易迭代,也省掉了激光雷达的成本。缺点则在于视觉存在盲区,对算法要求高。
但两种路线之间的鸿沟可能已经没有那么深了,激光雷达厂商已在补齐图像能力,某种程度上变得更像摄像头。
先是3月华为乾崑发布新的双光路图像级激光雷达,称车载激光雷达感知能力从点云级迈入图像级。接着,禾赛科技推出6D全彩激光雷达超感光芯片SPAD-SoC,剑指空间智能与物理AI。4月21日,速腾聚创则发布了两款基于“创世”数字化架构的SPAD-SoC芯片,称激光雷达进入图像化时代。
激光雷达生成的图像随着线数增加而变得清晰。华为乾崑的新激光雷达线数达到896线;搭载禾赛新一代芯片的激光雷达可最高支持4320线;预计年内量产上车的速腾聚创凤凰芯片则是首颗原生单片集成2160线的车规级SPAD-SoC。激光雷达企业通过推动技术方案向数字化转变,特别是通过自研光电转换器件SPAD芯片来使线数增加。
“线数达到2000线便进入400万像素级别的三维感知世界,接近2K高清点云成像。4000线则对应800万像素,达到4K,这时激光雷达的三维数据能与摄像头提供的色彩信息更深度融合,构建远超当前技术的精细模型。”速腾聚创CEO邱纯潮在演讲中称,目前这一代芯片采用28nm制程,数字化芯片还将沿着摩尔定律演进,使像素继续提升。
业界展望,激光雷达“看见”的图像还将具有色彩。邱纯潮认为,在激光雷达线数增加到一定程度后,SPAD芯片加上彩色滤光片,便能让激光雷达的像素同时具备几何和色彩信息。该公司具有这种能力的RGB-D(结合彩色图像和深度信息)传感器计划明年年底前推出。届时在自动驾驶方面,数据源的融合难题将从根本上得到解决,自动驾驶领域将不再有“信摄像头还是信激光雷达”这类难题。
文远知行创始人兼CEO韩旭也展望,当激光雷达线数做到1万线,就能做出光场(Light Field,描述空间中光线分布的方法),“到那时,就没有人再讨论人的眼睛有多厉害,就像现在不再有人会跟计算机比速算速度。”
业界呼吁传感器融合
同一种传感器收集更多维信息,对物理AI而言尤其重要。多名业界人士提到传感器冗杂与混乱给机器人开发带来的问题。
“我们很多机器人用到2到3颗传感器,因为机器人在非结构化复杂环境中运行需要深度信息。但我们深受传感器割裂的痛苦。”普渡机器人创始人兼CEO张涛在圆桌对话中表示,服务机器人用到过超声波、红外传感器、单线或多线激光雷达等,传感器之间非常割裂,供应商也非常割裂,机器人公司不得不对接多家供应商并解决不同问题,结果是上层的算法效果打了折扣。
酷哇科技CTO廖文龙也表示,在当下以及过去很长一段时间中,机器人感知层面的核心矛盾在于需要堆砌各种各样的传感器,“拿各种线数的产品,拿一堆透镜、一堆机械式机电系统,拼凑出一个巨大的东西,工程上很复杂,成本很高,性能也有天花板。”
易控智驾副总裁林巧也表示,智驾L4厂商常同时用到摄像头和激光雷达,此前在激光雷达的时空同步方面,业界做了很多工作,但天然存在缺陷。
以激光雷达为代表的传感器迈向融合,让一些业界人士看到解决方向。此次速腾聚创推出的SPAD芯片孔雀面向车载补盲、机器人和空间智能市场。邱纯潮称,输出有语义、能被理解的三维图像信息,使激光雷达能承担传统相机和RGB-D相机的任务。
张涛展望,未来机器人不应使用多种技术架构、不同厂商的传感器,最理想的情况是使用同种架构、不同参数的传感器组合。在这样的底座之上,算法才能做到真正的AI原生。
廖文龙则表示,理想的状态是有一个统一的、简单的方式来做感知任务,例如参照视觉路线的做法,用ViT Transformer(一种深度学习模型)的方式处理,统一在一个架构下并用Scaling Law(规模定律)赋予更大的能力。推动未来2~3年感知从2D变成3D,AI从空间智能走向决策智能、认知智能。林巧则表示,激光雷达厂商在芯片层面解决了信息时空同步的问题,能帮助下游厂商解决特定场景的问题。
一些业内人士还认为,激光雷达走向三维感知,在具身智能方面将主要推动真实数据采集和上半身操作能力迭代。
禾赛科技CEO李一帆近日表示,世界模型与具身智能的训练面临真实三维空间数据稀缺等问题,解决方法是将真实世界进行高保真三维重建,在这个过程中,激光雷达正在成为空间智能的关键数据入口。
近日在北京亦庄人形机器人半程马拉松中夺冠的荣耀机器人,搭载了禾赛科技的激光雷达。业界人士告诉记者,虽然人形机器人尚未全面放量,激光雷达并未成为人形机器人标配,但从能力上看,激光雷达已经能比较好地解决人形机器人下半身运动问题,上半身操作能力是下一个突破口。
速腾聚创机器人产品线负责人杨先声向第一财经记者解释,现在所有3D感知技术都不足以满足现实生活中具身智能对操作的感知需求。常用的双目等方案除了在精度方面遇到问题,也很容易受到环境和目标物移动的影响。只有在特定环境或做特定演示时,能看到机器人完成比较好的操作。这导致机器人在现实环境受光照影响或遇到随机物体时,任务往往会失效。激光雷达做RGB-D就是面向这部分感知需求。
邱纯潮认为,随着激光雷达能输出具备语义的三维图像信息,以及帧率提升、探测精度缩小至毫米级,激光雷达在机器人身上的应用将从下半身跃迁至上半身。