• 最近访问:
发表于 2025-08-12 16:08:11 股吧网页版
机器人能跑能跳能搏击,为何仍陷“成长烦恼”?
来源:第一财经 作者:吕倩

  宇树科技CEO王兴兴在2025世界机器人大会(WRC)论坛上发表完对VLA(视觉-语言-动作)路线的质疑观点后,多位模型厂商代表在台下表达了不同看法,“这个观点不对,核心还是机器人本身不行,大脑没有问题。”

  2025年的WRC大会相较往年的不同点,除了更多的具身厂商莅临参展,更多的机器人产品能跑、能跳,还有很多AI大模型厂商与互联网厂商代表来到现场。

  在国家地方共建人形机器人创新中心(简称“创新中心”)首席科学家江磊观察来看,虽然今年有AI厂商参与,但在行业发展层面,具身厂商与大模型厂商之间尚未形成联动效应。而对VLA技术路线、软硬件关系、数据获取方式的不同看法,也折射出目前具身智能复杂产业链背景下,不同技术路线之间的关系。

  热闹表象下的多项挑战

  据国际数据公司(IDC)报告,在国家政策引导下,中国人形机器人行业正通过“应用验证—技术突破”的双向循环模式加速发展,吸引多元化厂商积极入局,市场整体呈现出强劲增长态势。2024年,中国人形机器人商用销售出货量约为两千台,预计到2030年近六万台,复合增长率达95.3%。

  但该数据是相对行业早期的情况,在加速进化科技有限公司董事长程昊看来,虽然目前很多家厂商完成几百上千台机器人的量产交付,但这个数据距离传统意义上手机和汽车行业的量产概念还有非常大的差距。另外,整个具身行业的商业模式也非常早期。

  一方面,WRC展会现场,轮式、双足、四足、全尺寸、迷你型机器人全矩阵厂商密集披露产品与技术情况,从各自优势领域展现技术程度。如灵初智能机器人打麻将、打包包裹、配送衣物;速腾聚创基于传感器架构创新、自研芯片及AI能力,展出“机器人之眼”,切入“眼脑手”技术路线;深耕触觉感知技术领域的他石科技研发的触觉传感器能精准捕捉物体的纹理、硬度、温度等细微特征,应用于机器人抓取、精密装配、酒店服务等场景。

  但在另一方面,整个产业仍面临成本高昂、硬件一致性与良率不完善、数据存在规模与质量双缺口、软件与算法成熟度不达标、供应链与标准缺失“五座大山”。

  达摩院乐云具身智能平台负责人陈明修认为,目前具身行业存在几项挑战:数据分为真机数据和仿真数据,但不论哪一种都存在高成本问题,将真机数据采集成本由正转负问题亟待解决;仿真能力上,虽然行业提供了很多仿真引擎,但上手门槛很高,需要将其平台化、集群化、弹性化,提升整体仿真能力;模型层面,物理智能体必然要在物理世界里迭代交互,模型架构需要解决兼容性问题,实现具身智能大模型的RLHF(基于人类反馈的强化学习);系统层面,现在一台机器人上可能存在三台不同的主控,使整体系统复杂、低效;机器人本体适配成本高昂,零部件缺乏统一标准。“具身智能大模型还没有达到涌现的阶段,整个生态需要持续的迭代和突破。”陈明修表示。

  星动纪元创始人兼CEO陈建宇观察到现在行业内的机器人种类已经非常繁多,但如果对比几大终端产品,数量仍非常少,原因在于具身每个场景都建立了一套独立系统,这样的硬件堆砌方式无法带来最终的智能进化,只会带来商业牢笼,这也是机器人行业发展了半个多世纪,至今没有出现真正意义上巨头厂商的原因。

  关键但未收敛的大脑议题

  通过物理载体与环境交互实现自主学习与决策的具身智能概念,包括了本体、智能体、数据和学习进化框架。行业目前一般将其简单化区分为负责感知规划的大脑、负责运动控制的小脑,以及负责执行任务的本体三层架构。

  但这样的划分方式实际经过了数年时间的摸索。在乐聚(深圳)机器人技术有限公司董事长冷晓琨看来,今年WRC一个很大的变化是各家机器人灵活性足够强了,背后是机器人小脑技术路线已基本达成一致与收敛。但大脑层面,无论是中译性(中文可解释性)还是收敛,都没有达到理想效果。

  当下具身智能与过去工业机器人的区别是由Automation变成Robotics,其中核心的变化是由过去纯小脑+控制变成了大脑、小脑深度融合。冷晓琨表示,大脑很关键,预计至少需要等到明年大会时,才可以看到基本的大脑框架。

  大脑层面的行业认知也处在碰撞期。陈建宇对记者表示,今年以来,技术路线在大的方向上有一定收敛,包括软件侧与硬件侧。VLA在去年非常少被提及,因为大家对端到端,甚至对是否基于Learning Base(以数据驱动的机器学习算法作为核心控制策略)有争议,到底用传统控制还是Learning Base并无定论。伴随机器人通过强化学习等方式实现稳定行走,行业开始确定该选择Learning Base。而针对分层还是端到端的VLA模型,行业也开始逐渐相信并选择后者。

  具体路线选择上,目前具身行业主要呈“三足鼎立”局面,包括端到端VLA、大小脑分层架构、世界模型路线,也包括用脉冲信号模拟生物神经元,在极低功耗下实现感知-决策-控制一体化的类脑路线,与先用大规模人类示范数据做模仿学习,再用强化学习微调提升鲁棒性与性能上限的模仿-强化学习混合路线进行补充。

  “现在都在讲技术路线,”上海交通大学人工智能学院副院长、穹彻智能联合创始人卢策吾对记者表示,但实际上,具身产业是一个系统性工程,每一条所谓的技术路线都有价值,最后核心要看谁能将各点优势串联成为一个更有用的系统。整个具身产业的限制性因素还没有达到考虑芯片或算力的层次,主要看具身模型架构与数据闭环的迭代——用什么样的数据、多大数据规模,以及采用哪类大脑结构,是目前行业发展的关键。

  加速进化科技有限公司董事长程昊认为具身大脑与云计算行业类似,针对“现在不做大脑就落伍”的观点,他称,具身大脑就像云行业,会有非常明显的规模效应,整个大脑技术范式本身还不成熟,且行业数据远远不够的背景下,程昊认为,具身厂商先将机器人做到四肢健全、在简单场景实现落地,再去发力大脑端,是一条相对可实现的路径。

  数据格局未清晰

  王兴兴之所以对VLA架构持怀疑态度,原因之一是行业现存数据量不够。当VLA模型与真实世界交互时,背后的数据质量、数量都不够用。

  数据问题是此次大会多家参展商强调的重点,他山科技总经理马扬对记者表示,目前行业限制具身产业发展的两大要素,一个是数据,一个是模型。马扬表示今年行业几乎都在做训练场,但其中存在一个问题——采集到的数据到底有没有用?因为训练场有两种模式,一种是遥操,但成本高;一种是真人戴手套去拆除,采集速度会快,但人类手部灵活度与机器手不同,这种情况下采集到的数据通用性较差。

  银河通用创始人王鹤表示,目前不同厂商对数据的看法不一样。银河通用的看法是要教会机器人干活,最直接的数据就是采用遥控机器人干活的数据,但这部分数据目前确实面临着产能不足且非常昂贵的现状,可以类比具身里的自动驾驶,头部车厂每天有百万台车在跑,单天回流上亿条真实数据。

  对比来看,具身领域目前最大的公开数据集仅100万条,缺的数据要怎么获取?王鹤认为数据集内一定要有动作数据,不能让机器人“看一看”视频就完事了,看别人打篮球、跳水、跨栏,并不一定就能学会,但要从真实世界采集真实动作数据又太贵。

  银河通用采取的方式是基于计算机图形学技术,在虚拟空间中复现真实世界物理规律(如重力、摩擦力、材质特性),并搭建大规模可交互物体资产库,依托合成管线,通过直接合成与强化学习自主合成两条路线生成动作数据。经仿真器检验后,由渲染器转化为视觉数据,最终通过Sim2Real(从仿真到现实)技术实现从虚拟到真实的迁移,其中真实数据占比小于1%。

  星海图公司联合创始人、首席科学家赵行将数据来源类比为金字塔架构,底端是互联网视频数据,通过众包模式采集并上传,优点是规模大,但缺点是缺乏动作信息;中层是仿真数据,但挑战是其中存在Sim2Real Gap,即在仿真环境中获取的数据与真实发生的事情相差巨大;顶端即为真机数据。

  多位从业者对记者表达了对数据的重视,以及真实数据与仿真数据的投入,目前两者关系相辅相成,通过融合加速具身模型增强泛化能力。但仍需回到大脑议题的必要性在于,冷晓琨强调,如果大脑的模型架构没有定位清楚,数据的定位也不会清楚。需要海量数据的架构不能仅靠现实数据采集;小模型路线依靠纯现实数据就够用。因此,大脑的模型未定,导致目前数据格局未清晰。

  赵行表示,具身智能是一个从模型到数据、再回看机器人本体的全链条行业,光靠一家公司是不够的。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500