• 最近访问:
发表于 2025-09-25 14:23:31 股吧网页版
车机AI智能体加速落地 不止“一句话点咖啡”
来源:21世纪经济报道

  9月24日,阿里巴巴集团CEO吴泳铭在云栖大会上抛出几个坚定的判断:AI会是下一代操作系统。AGI迟早到来,接下来要剑指ASI(Artificial Superintelligent,超人工智能)。当天,阿里巴巴港股盘中拉升,涨幅一度超过6%,创下2021年10月以来新高。

  市场的即时反应,印证了当下对一个更强大AI的关注和想象。今年云栖大会的主题是“云智一体碳硅共生”,21记者现场观察到,智能体(Agent)和具身智能,成为多个展台和分论坛的焦点。而在众多行业参与者中,车企的身影难以忽视。

  在云栖大会的一项分论坛上,理想汽车空间AI负责人江会星展示了一段演示视频:车主说了一句“点一杯星巴克”,车机屏幕里的智能体“理想同学”便开始调用星巴克小程序,选择门店,确认口味,最后刷脸支付。整个视频大约持续了一分多钟。

  除了理想,过去半年里,比亚迪、智己、蔚来等车企都已宣布将AI智能体引入智能座舱。车内智能体在加速落地,不少车主已经可以在行车过程中语音点餐,到达后无缝拿到餐食。

  而车企的野心不仅仅是“一句话点咖啡”。江会星在前述论坛提到,理想同学agent 2.0的期望还有环境感知和全信息记忆能力。车企最终期望,用户能通过车机智能体,完成“人—车—生活”的闭环。

  车机智能体的两种工作方式

  在大多数车企的宣传里,车机智能体的“第一步”应用场景不复杂:导航、点餐、叫代驾,核心任务还是辅助车主的日常消费活动。但要让这些功能真正跑起来,需要AI有连接外部生态的能力。

  车机智能体如何完成这项工作?江会星提到,目前“理想同学”有CUA(Cockpit Using Agent)和MCP/A2A两种框架。

  CUA也是目前多数车企的技术路线。简单概括,它指的是多模态大模型理解任务,生成动作,最终通过小程序或者APP执行任务。以理想7月更新的OTA7.5车机系统为例,其接入了理想智能体和支付宝车载助手,得益于支付宝的生态,车主可以通过语音唤起支付宝内的生活服务小程序。

  比亚迪子品牌方程豹和吉利汽车同样联合了车载支付宝。而蔚来与麦当劳合作的车内智慧点餐,则是绑定麦当劳API,直接调用麦当劳APP的点餐、支付功能。

  但CUA存在瓶颈。江会星坦言,如果需要截图识别APP,目前GUI Agent (图形用户界面智能体)准确率普遍比较低。“比如需要15步才能完成的任务,从市面上的评估来看,智能体的准确率大概也就30%左右。”这意味着,像登记停车、缴纳停车费等复杂任务,往往难以保证稳定体验。

  江会星表示,理想的方案是做“多步轨迹”的拆解。具体做法是,基于当前用户的想法、页面截图和新的对话状态,预测下一步的页面动作。不断提前预测在该页面里最可能发生的点击动作,这样一来,不再是开放式猜测,而是有限的集合预测,准确率会显著提高。

  另一种更具想象力的方式是MCP/A2A,即车机智能体把任务“分发”给第三方智能体来完成。

  江会星假设了肯德基点单的场景,“作为一家车企,我们不可能去深入了解肯德基的业务逻辑——它如何发放优惠券?怎样把不同的餐品组合成套餐?这些都是肯德基最熟悉的部分,所以也应该由他们自己的智能体来实现。我们只需把它的能力无缝接入车内,让车主直接体验最高效的服务。”

  不管选择哪种方式,最终的支付环节都是整个链条里比较敏感的一环。21记者此前试驾了多款智能汽车,大部分车企都在智能体支付时设置了额外干预:下单前需要刷脸或者语音确认,从而确保交易安全。

  以理想为例,如果车主想点一杯咖啡,需要先在应用中心下载支付宝车载助手和理想同学,下单过程可由语音全程完成。到了最后一步,智能体会提示用户确认支付,车主可以在屏幕输入密码,也可以抬头完成刷脸验证。对于小额支付,则可以启用免密支付,一句语音确认即可完成交易,此时限制相对较少。

  下一步是全记忆+全感知

  在前述论坛上,江会星发布了理想同学Agent 2.0的框架。这份未来蓝图里着墨最多的,是“全信息记忆”和“环境感知”。

  所谓全信息记忆,可以说涵盖了用户的所有车内动作。它既包括用户可见的常规操作,如屏幕点击和输入(程序记忆);也包括与环境的互动,比如每周一驶入同一停车场(情景记忆);最后还涉及对车内人物关系的认知(语义记忆),车主、家人、朋友的姓名、性别、兴趣偏好等等,车机智能体都被期望厘清。

  江会星表示,车机智能体不止步于“存档”用户行为,还应该学会模仿执行。例如,智能体识别出车主曾经在小程序里输入过车牌号,未来再遇到类似场景时,它就可以自动完成输入与提交。这让智能体从被动辅助,走向主动代劳。

  与此同时,“环境感知”能力被反复强调。在上述场景中,智能体如果通过摄像头识别到一个真实二维码,应当能自动调取信息,并完成任务。

  “获取到环境信息后,智能体会结合全信息记忆,分配给大模型进行规划与推理,从而完成整个任务。这种获取外界信息的能力其实非常关键。”江会星说。

  这一看法也在吴泳铭的开幕式演讲中得到了呼应。吴泳铭认为,AI要实现超越人类的突破,就需要直接从物理世界获取更全面、更原始的数据。以自动驾驶为例,目前新一代的自动驾驶就是直接从原始的车载摄像头数据中学习,才实现了更高水平的驾驶能力。只有让AI与真实世界持续互动,获取更实时、更丰富的信号,才能更好地理解和模拟世界。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500