加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等高效供给。
——摘自“十五五”规划建议
今年的一次实验,让实验室所有人都屏息凝视:当玻璃瓶被仿生双臂机器人稳稳放置在医药光谱检测仪上时,团队成员长舒了一口气。仿生双臂机器人首次自主完成样本转移,这个看似简单的任务,却要求它像人一样感知、推理、执行。具体来说,需要通过多模态系统识别目标,依靠大模型规划路径,用仿生灵巧手精准抓取,实时协调双臂避免碰撞。这一刻,“大模型赋能具身智能”从概念变为现实,机器人具备了自主决策能力。
回顾研发过程,团队先是深耕机器视觉,让工业设备“看得准”,后又自主研发医药光谱快速检测仪器,实现“测得精”。然而,这些系统相互独立,如何将它们串联起来成为亟须解决的难题。近年来,我们攻克了将灵活的“机器人身体”与精密的“分析仪器大脑”结合的难题,并引入大模型作为智能中枢,实现全流程自主化,突破了“仿生驱动的一体化轻量化设计”与“大模型驱动的分层决策控制”两项前沿技术。
“仿生驱动的一体化轻量化设计”是我们首先要攻克的技术难题。实验室空间有限,而且需要长时间精密操作,传统机械臂因自重大、惯性强而难以胜任。我们借鉴人体肌肉—骨骼协同机制构建模型,提出单关节集成驱动、传感与控制的模块化方案。同时优化材料分布,使整机重量大幅减轻,在提升响应速度的同时,实现毫米级的抓取精度。
解决了机器人“身体”的灵活性,如何赋予“大脑”智能决策能力成为下一个挑战。我们提出大模型驱动的分层决策控制策略,构建“理解—规划—控制”闭环。初期测试中,机器人常因规划路径不合理导致碰撞。我们创新构建了“物理反馈学习”机制,自动记录碰撞点坐标、抓取力度等关键参数,将这些“失败经验”转化为训练数据反馈给大模型,使其不断修正认知,提升了成功率。
展望“十五五”,我们的目标很清晰。一是在仿生一体化结构上持续突破,引入软体材料与刚柔耦合设计;二是深化大模型与具身智能的融合,攻克长时序任务规划、多模态实时决策能力;三是构建“大模型—仿生本体—精密仪器”的智能系统示范,形成适用于实验室自动化、精密作业等场景的通用解决方案。
(作者为湖南大学人工智能与机器人学院院长,本报记者孙超采访整理)
■延伸阅读
如何让机器人更智能
具身智能是让机器人在物理世界中像人一样感知、思考与行动的前沿技术。与传统工业机器人只能执行预设程序不同,具身智能系统需要“看得见、想得通、做得准”,这要求仿生结构设计与大模型决策能力深度融合。仿生结构为机器人提供灵活的“身体”,大模型赋予机器人智慧的“大脑”,两者缺一不可。
人体的骨骼和肌肉能够协同工作,如何用机械结构模拟这种复杂协同,需要在材料科学、拓扑优化等多领域取得突破。其次是大模型的理解难题。尽管大模型能流畅对话,但它对物理世界的理解仍停留在文字层面。如何让大模型通过真实环境交互学会物理规律,是当前的核心挑战。面对这些难题,湖南大学机器人视觉感知与控制技术国家工程研究中心组建了跨学科团队,共同攻关,不断推动具身智能走向更广阔的应用场景。
(本报记者孙超整理)