上证报中国证券网讯(记者孙小程)4月16日,作为一站式物理AI数据服务平台,觅蜂科技正式亮相,发布物理AI数据服务平台、MEgo系列无本体采集硬件及MEgo Engine数据治理引擎,并联合权威机构启动蜂巢数据共创行动,与京东云、百度云、阿里云等多家头部企业达成合作。
觅蜂科技董事长兼CEO姚卯青表示,AI正从数字世界走向物理世界,具身智能成为下一代计算革命核心赛道。但当前行业面临严重的数据荒漠:物理AI真机交互数据量不足大语言模型的两万分之一,且存在标准缺失、质量参差不齐、供需错配等问题,直接制约具身智能从实验室走向产业落地。
类似汽车需要学习海量多样化驾驶场景数据才能逐渐实现自动驾驶,人形机器人也需要大量涉及不同物体、操作和环境的数据,才能学会“干活”。因此,大模型公司、国内外具身智能大厂以及初创企业,对于数据可谓是“求知若渴”。
“你有多少我就买多少;你什么时候有?我马上要。”这是姚卯青最常从客户处听到的话。
在他看来,数据未来会成为跟算力一样的基础生产资料,也会成为有一定回报周期的投资。
但一个不得不面对的事实是,具身智能的数据涉及触觉、光线、空间等更多维因素的影响,生产难度显著高于大语言模型的文字数据。具身智能行业正面临数据稀缺、标准缺失、质量不一、供需错配等“数据荒漠”难题,行业供需不平衡问题极其突出。
姚卯青认为,所谓的“数据荒”,实质是高质量供给的短缺。许多具身智能数据采集中心存在“为了运营而运营”的问题,导致重复劳动、重复场景的数据很多,价值密度低。解决这一矛盾不能依靠零散交易,未来必将诞生一个集“网络、标准、平台”于一体的生态系统,快速拉通供需两端。
这是一种商业模式,也是支撑具身智能的基建工程。
觅蜂科技希望搭建标准化、平台化的数据底座,让高质量物理AI数据像水电一样,即取即用。与传统数据服务商不同,觅蜂不只是提供数据,更致力于构建物理AI数据基础设施,实现真机遥操、无本体采集、仿真数据全范式覆盖,并打通硬件、软件、平台、运营全链路。
不过,作为一个从明星机器人公司智元孵化而出的独立数据平台,觅蜂科技如何取得其他客户,尤其是潜在竞争对手的信任?
姚卯青对此强调了平台的独立性与中立原则,“智元获取觅蜂数据的唯一途径就是市场化下单。”
他并不担心觅蜂的数据会滋养竞争对手,导致智元被超越。“有人用了我们的数据训练出非常强大的模型之后,我们反而非常开心。”
被问及距离具身智能的“GPT-3时刻”还有多远时,姚卯青给出了进度条:从去年到今年初,行业可能仅从5%进展到10%,处于“线性增长”阶段;但随着觅蜂开始布局产能,预计到今年底,进度有望推进至20%-30%。
不过,要实现从量变到质变的“涌现”,最终还需要4年至5年时间。
从数据规模看,根据姚卯青的判断,当有效真机数据迈过一亿小时门槛,具身智能会像大模型一样出现明显涌现。关键不只是模型强,更在于数据的广度、真实度和多样性。
他介绍,依托全流程质检体系与全球化采集网络,觅蜂科技2026年将实现千万小时级数据产能。