具身智能赛道热度持续走高的同时,产业界始终绕不开核心拷问:具身智能企业到底靠什么赚钱?场景落地如何实现正向收益?完整商业闭环究竟如何打通?
6月16日,在星海图首届全球开发者大会上,星海图CEO高继扬首次对外就具身智能企业的商业模式作出了系统性的回答:“随着基础模型能力的提升,具身智能的商业模式将沿着三个阶段演进变化,从整机销售,到方案订阅,再到物理世界token(词元)销售。”
高继扬坦言:“当前还处于第一个整机销售的阶段,即把产品卖给开发者、科研教育机构、数据采集方等,这其实和‘智能’没太大关系。”因此,星海图“并不过度追求在第一个阶段的商业化成绩,真正追求的是从第二个阶段开始的、真正由智能驱动的商业化领先”。
为了提升基础模型的智能,星海图联合北京亦庄成立亦数智能,计划在2026年内完成100万小时真实数据的采集积累,未来3年这一数字达到1000万小时。高继扬在接受记者采访时透露,将通过外包采集和众包采集相结合的模式达成这一目标。
规模增长不是“造得越多越便宜”模式
星海图创立于2023年9月,迄今已完成了多轮股权融资,尤其是今年2月和4月陆续完成了两轮大额融资,估值已超过200亿元。不同于其他做机器人硬件的企业,高继扬强调,星海图的定位是一家具身智能“大脑”企业。他解释道,所谓“大脑”,最重要的评断依据就是要做具身智能基础模型的预训练。不同于卖硬件的公司“造得越多越便宜”模式,具身智能大脑企业的规模效应将是具身智能基础模型“学得越多越聪明”。
高继扬将“具身智能”拆解成了三个部分,分别是本能智能、作业智能和未来的进化智能。简单来说,本能智能是直接作用于本体,机器人学会驾驭自己的身体,像人一样天然就会保持平衡、会走、会跑、会跳,不需要人用很长时间去教。建立在本能智能之上的,是作业智能,机器人能够有序地作业,提供生产力。这是星海图自去年8月份推出并不断迭代的G系列模型重点发力的方向。展望未来,具身智能的终极形态是进化智能,形成可自我复制的生产力。
对于行业内广泛被问及的商业模式问题,高继扬详细地解析了三个阶段的商业模式变化。第一个阶段,是当前所处的“整机销售”阶段,其年化自然增长率可能保持在30%至100%;当具身智能基础模型能够在一个生产力场景中打开应用和规模交付,就会进入“方案订阅”的第二阶段,机器人整机会成为收费入口,但真正的毛利来源是方案的订阅,年化自然增长率将达到3倍至10倍。随着“智能”从“单一场景有用”走向“多场景、多任务通用”,第三阶段的收费来源就会从方案转向token销售,每年将呈现10倍乃至100倍的增长态势。
在高继扬看来,具身智能行业前期是研发制造型行业,中后期则是人工智能的规模化服务,增长的速度会越来越快。基于这一规律和趋势判断,星海图方面认为在当前追求商业化成绩“意义不大”。
“现在市面上几乎所有的销售都是以整机为中心的销售,如果基础模型能力尚不能支撑生产力场景的话,过早把机器人推到工厂或仓库等,带来的结果只会是客户不满足、团队疲惫和供应链拉扯,在整机销售这一阶段中,盲目追求去冲一个绝对的量,那给企业产生的更多是负债,而非资产。”高继扬说道。
本报记者注意到,高继扬围绕商业模式的回答,是在当前具身智能整机企业激烈比拼机器人出货量,甚至出现“价格战”的市场背景下提出的一种差异化思考。在接受采访时,高继扬的回答更加直接:“硬件成本在未来两年会稳定控制到1万美元左右,但即便如此,这也并不能决定商业化能力,具身智能真正的商业化潜力来自‘大脑’,即机器人到底能干什么活儿,能不能完整地承担一个岗位的生产力。”
算一算百万小时数据采集的“账”
商业模式回答的是具身智能产业“钱从哪里来”,那么与之相关的另一个问题在于“智能从哪里来”。记者观察到,自去年下半年至今年上半年,具身智能行业普遍加大了对真实数据采集的投入,这从全国各地兴起的具身智能数采中心建设热潮就可见一斑,数据被业界视为具身智能跨过下一阶段门槛的关键变量与“燃料”。
高继扬指出,过去几年里行业数据规模最多停留在几千、几万到十几万小时级别,而今年头部企业将会进入百万小时量级,未来两三年可能达到千万小时量级。具身数据分为真实数据、仿真合成数据、互联网视频数据等类别,星海图是业内较早坚定押注真实数据的具身智能企业。
关于真实数据的成本投入,高继扬在现场算了一笔账,智能成本大致可分为三个部分,分别是数据成本、算力成本、人力成本。第一层思考逻辑是关注智能的总成本。如果仅看前两项,星海图的实践经验表明,数据与算力的投入成本比例是1:10,也就是1块钱的数据至少要花10块钱才能训练好。这意味着在数据上量之前必须提高数据质量,而高质量的数据一定是真实数据,真实数据再分为真机数据和真人数据。第二层逻辑则看单向的数据成本。同样基于星海图的实践,真人数据成本约为50元至100元/小时,真机遥操作数据的总采集成本(算上人工、机器折旧等费用)约250元/小时。如果置于整个行业里,真机遥操作的综合成本约100元至150元/小时。由此来计算,今年的目标是要采集100万小时的数据,大约要投入1亿至2亿元的资金。高继扬坦言:“虽然听起来要花上亿元,但与做大语言模型每年算力支出动辄数亿美元甚至更多相比,这一两亿元必须得花,而且太划算了!”
当被记者问及“如何实现百万小时真实数据的采集目标”“是否同样采取‘人海战术’”时,高继扬介绍,星海图与北京亦庄机器人科技产业发展有限公司、北京亦庄国际投资发展有限公司三方联合发起设立了亦数智能公司,得以在北京亦庄全域开放的数据采集场景中进行真实数据采集。“数据都来自人,想让数据量上去,人的数量肯定也得上去。”高继扬表示,将会采取外包采集和众包采集相结合的模式实现数据上量。众包采集是指在生产和生活过程中进行伴随式采集,真人携带设备采集生活或工作中的真实数据;外包采集则是雇用采集人员,针对特定场景和任务进行专业化采集。
另外值得一提的是,星海图联合凯辉基金发起了“星途计划”,面向具身智能早期创业团队提供资本、技术与产业资源。高继扬透露,过去一年里,星海图已陆续投资了18家企业,未来三至五年希望投资30到50家。他指出,具身智能行业链条很长,连接AI、机器人、本体、传感器、数据、制造、场景和服务,不是一家公司靠单点技术就能完成的。“产业成功的时候,不是一家企业的成功,而是一批企业的共同成功。”