在刚刚结束的智源大会上,一场名为“具身产业CEO论坛”的圆桌会议备受关注。台上坐着的,是当下具身赛道里最炙手可热的创始人,圆桌主持人、智源研究院院长王仲远开玩笑表示:“大家可以多拍几张照片,也许过几年这里面都是身家千亿以上的企业家。”
2026年将过半,中国具身智能产业的热度非但没有退烧,反而呈现出加速态势。仅2026年第一季度,具身智能赛道披露融资超50起,累计融资额突破200亿元,同比增长近60%,创下历史新高。
当互联网大厂的模型之战进入平稳期,自动驾驶的泡沫逐渐消退,资本终于找到了下一个能容纳巨额资金的出口——具身智能。
但钱进来了,未必等于生意跑通了。在这场聚焦具身智能的圆桌论坛上,企业掌门人们都比较冷静,他们很少谈论规模化、商业化,提及更多的还是砸钱抢身位、数据瓶颈、技术发展的早期阶段以及当下紧迫的窗口期。
破壳机器人创始人、清华大学交叉信息研究院助理教授许华哲表示,“大家更多的是想买一张通往未来的门票。”千寻智能创始人兼CEO韩峰涛认为,“如果今年还没有搞到行业头部的资金量和估值,可能明年就很难了。”
产业距离真正的成熟,究竟还有多远?几位创始人的探讨,或许能给出一些答案。
融资热:抢身位,上牌桌
2026年上半年,具身智能领域的融资热度可以用“疯狂”来形容。
千寻智能三个月内融资近50亿元;星源智成立不到一年,融资规模已达10亿元级别;灵心巧手半年内连续完成B轮、B+轮融资,近期传出寻求新一轮400亿元估值的融资消息;破壳机器人一个月内拿下数千万美元天使轮。这个赛道的资本密度,已经逼近当年新能源车的巅峰时期。
但这场狂欢背后的逻辑,远比表象复杂。如果按照传统投资逻辑,一个连规模化场景都尚未验证的行业,不该享受如此溢价。但具身智能的特殊性在于,它正处于从“技术探索”迈入“大规模预训练”的临界点——而这个临界点,恰恰是重金投入的阶段。
“大家都在抢身位和储备弹药,如果今年你还没有搞到行业头部的资金量和估值,可能明年就很难了。”韩峰涛表达出了当下的紧迫感,“至少在第一波具身智能创业的浪潮里面,应该没有再做基础模型的机会了。”
回看大语言模型的发展路径,从GPT-2到GPT-3的跨越,本质上是算力、数据和资金的规模化堆叠。GPT-3之后,留给创业者的窗口就开始迅速收窄。具身智能正在复制这条路径,但成本更高,它不仅要处理数字世界的信息,还要让智能体在物理世界中行动。
在这个时间窗口,谁抢到了足够的资金和估值身位,谁就有资格上桌;否则,连参与第一波创业浪潮的机会都将失去。
因此,资本的狂热,并不等于商业化的成熟。星源智创始人兼CEO刘东认为,如果将融资用途拆解,大致呈现“七三开”的格局——70%用于储备粮草,30%尝试商业化落地。
这也反映了行业的共识:少量商业化落地是为了保持对真实需求的敏感度,储备资金是为了撑过技术成熟前的“黑暗期”,没有人愿意在这个时候掉队。
“具身智能和机器人,肯定是要穿越一个漫长周期,商业化肯定是有起有落。”蚂蚁灵波科技CEO朱兴表示,他将当前产业的初期特征归结为技术仍处于早期阶段。所谓商业化,他认为,今年开始,特定场景、非常小规模的商业试点“应该可以模糊地看见”。
但资本并非盲目。灵心巧手创始人兼CEO周永提供了一个更宏观的视角:“现在不是热潮,而是序章。”他将当前的融资规模与新能源车、芯片产业对比,国内目前“一轮十几亿元”的体量,还只是起点。
他认为,当前的估值是建立在“头部厂商出货一万台”的预期上,而真正的产业成熟,需要“十万台甚至百万台”的规模来支撑。“如果未来有厂商达到每年十万台出货量,资金体量应该是现在的十倍。”周永表示。
这轮融资热潮的本质,是一场筛选。没有人敢说自己已经找到了确切的盈利模式,但所有人都害怕在这时掉队。资本在赌技术奇点的到来,而创业者则在用估值换取试错的时间和空间。未来两年,这张入场券的价格只会更高。
产业发展:成熟是相对的
与一级市场的烈火烹油形成鲜明对比的是,产业成熟度并不像外界想象的那么高。
过去一年,具身智能已取得长足进步,春晚上宇树机器人能翻跟头了,机器人马拉松上冠军“闪电”的成绩已经突破了人类纪录。但本体产业链到底是否成熟,CEO们的判断却较为冷静严苛。
韩峰涛形容道,假设完美形态的人形机器人综合能力为100分,当前各核心部件的得分各有差别:工业机械臂、手术机器人相对成熟,能到50分;轮式底盘约40分;四足机器人30分;双足机器人只有15分;灵巧手目前仅5分。而配套的AI能力,分数更低。
但真正的变量也在于AI:大模型的出现,让那个低分的大脑有可能在短时间内跃升至30分甚至50分,进而反向定义硬件、倒逼硬件迭代。
然而,AI的跃升卡在了一个老问题上:数据。不同于ChatGPT可以轻易抓取互联网文本,机器人的物理交互数据几乎是从零开始构建的,行业内普遍认为,真正的瓶颈已经从“算力”转移到了“数据供给”。
当前行业采集到的真机数据大量重复,与自动驾驶走过的弯路如出一辙——任务场景单一,数据同质化,继续扩充的边际效益急速递减。再好的模型架构,没有物理世界的海量、多样、高质量交互数据,就无法形成物理认知。
千寻智能已在全国布局30多万个采集点位,专职人员超千人,采用分布式方式采集高质量场景数据。蚂蚁灵波同样重金投入,朱兴透露,他们发布具身模型1.0版本时对外公布了约2万小时数据,但这只是从“体量大得多的原始数据中筛选出的优质内容”。
那么,模型尚未成熟,要不要急着推进场景落地?
韩峰涛是明确的“反对派”。他打了一个生动的比方:“现在的模型能力只相当于一两岁的孩童,你不应该让它去打童工,而应该让它去上幼儿园、小学。”
他认为,虽然可以做场景探索,但不能全面铺开。基于现有模型去做项目交付,每一个都要耗时一两个月做后训练和微调,这种成本根本支撑不起规模化。他预测,真正的规模化落地,至少还要等待两年的时间,也就是模型能力达到“初高中”水准之后。
刘东则持相反意见。他引用自动驾驶的教训:“当年大家都去冲L4、L5,结果反而是做L2辅助驾驶的公司活得最好、落地最快。”他认为,必须边训练基座模型,边在真实场景中踩坑。实验室的环境简化了太多外部条件,只有在药房拣货、物流分拣这种真实商业环境中,模型才能暴露问题、快速迭代。
这场分歧的核心,其实是两种路径的博弈:一种是“闭门造车”式的基础研究,相信过早分散精力去适配场景,会拖慢模型迭代的节奏;另一种是“沿途下蛋”式的渐进改良,认为在现有技术条件下积极落地应用,才能做出真正的智能。两者没有绝对的对错,但它们决定了未来一年各家公司资源投入的方向。
争论背后的共识是,具身智能产业正处在一个典型的技术成熟度曲线的爬坡期,2026年是关键一年。对于在场的CEO们而言,眼下的任务是用最快的速度筹集最多的“粮草”,采集最海量的真实数据,然后静待那个物理世界的“GPT时刻”降临。
而现在的一切喧嚣与争议,都只是黎明前必要的序章。