今天,上海大晓机器人公司宣布完成天使+轮融资,吉利资本、上海科创基金、临港新片区基金等多家创投机构参与本轮融资,老股东商汤国香资本继续增资。今年上半年,这家由商汤科技联合创始人王晓刚创立、澳大利亚科学院院士陶大程担任首席科学家的企业已融资数亿美元。公司研发的开悟(Kairos)世界模型,在具身视频生成、任务指令追随、泛化能力、场景鲁棒性等维度达到业内领先水平,已向全行业开源,为具身智能机器人提供端侧大脑。
在家居场景实验室,大晓机器人研发团队向记者展示了业内首个世界模型驱动的端侧具身大脑。这个大脑装在一台人形机器人体内,参数量为40亿,不需要与云端大模型相连,即可在设备端指挥机器人完成各项任务——拿起水壶浇花,打开冰箱取出麦片,将麦片倒入碗中,把要洗的衣服倒入脏衣篓……“我们没有遥控机器人,这些任务都是Kairos-4B世界模型驱动机器人自主完成的。”研发人员说。
在零售场景中,记者向一只机器狗发出指令:“帮我从便利店带两瓶可乐回来。”听到指令后,这只机器狗在办公楼里自主规划路径,进入了大晓机器人公司的便利店。那里有一个轮式人形机器人“售货员”,机器狗对它说:“我要购买两瓶可乐。”于是,人形机器人在货架上识别出可乐,抓起两瓶,放入机器狗身上的篮子,准确完成了两台机器人的交互任务。
“世界模型能大幅提升具身智能的上限,”王晓刚告诉记者,“它能理解我们世界的物理规律、人的行为逻辑,操控机器人完成一系列复杂动作。”
据介绍,世界模型是人工智能用来模拟现实世界动态、预测未来状态的核心技术框架,它可以让机器人在“脑海”中构建虚拟世界,在行动前先推演后果再执行,具备生成性、多模态、互动性三大核心能力。
开悟世界模型3.0采用“多模态理解—生成—预测”一体化架构,依托自主研发的混合线性注意力算子与全局状态共享机制,实现了全链路高效协同。这个创新架构确立了世界模型主流演进方向,英伟达近日发布的Cosmos 3.0全模态世界模型所采用架构,就与开悟3.0同源。
在数据层面,开悟世界模型汇聚了十余万小时真人采集的实景数据、数百万小时互联网上的真实世界视频,覆盖数百类职业场景。凭借创新架构与海量真实数据,这个世界模型兼具物理直觉、泛化能力和鲁棒性。在此基础上打造的Kairos-4B已成为全球首款可端侧直驱机器人本体的具身世界模型,打通了世界理解与状态预测的端到端闭环,消除中间转译延迟,让机器人实现“想到即做到”。这一突破能大幅提升机器人的响应速度与作业精度,为具身智能的商业化落地开辟新路径。
完成天使+轮融资后,大晓机器人将迭代升级开悟世界模型,加速世界模型在大规模仿真训练、端侧直驱控制等关键技术环节的突破与落地应用;进一步开发面向智慧零售、安防巡检、文旅、酒店等商业场景的软硬一体全场景解决方案,深化与产业链上下游伙伴的合作,共建开放协同的具身智能产业生态。
王晓刚表示,具身智能时代是人工智能发展的下一个阶段,以世界模型为核心打造的“最强大脑”正是开启这个时代的钥匙。“我们将继续坚持底层技术创新,以‘让每个机器人拥有聪明的大脑’为使命,把具身智能前沿技术转化为新质生产力,加速具身智能‘ChatGPT时刻’的到来。”