技术从论文走向现实,不是动动手指那般简单,但有不少想象空间。9月25日,北京商报记者在云栖会场内外,听到了珊瑚保护从业者与大模型交叉的故事以及助盲眼镜创业者讲述的AI改变生活的实例。
“云RTC(即时通讯)技术能满足实时避障的低延迟需求,我们的AI眼镜可以在300毫秒内识别障碍。”杭州瞳行科技市场总监陈刚透露,公司的眼镜同时还整合了通义千问VL(视觉语言模型)、OCR(光学字符识别)模型。大模型可以打破学科壁垒,土木工程专业的个人开发者张子豪靠大模型一个人就能完成具身智能复杂系统开发。
据国际权威市场调研机构Omdia发布的《中国企业GenAI(生成式AI)采用格局,2025H1》报告,超七成的《财富》中国500强企业已采用GenAI。当大模型与产业需求碰撞,抽象的算法正变为触手可及的生产力工具,在田间地头、深海暗礁、城市角落书写技术普惠的新可能。
智能眼镜:300毫秒内识别
“成年人走一步大约37厘米,我们的眼镜可以在300毫秒内识别障碍,提醒视障用户。”陈刚用两个数字告诉大家,自家公司的“瞳者-助盲AI眼镜”可以在一步距离前告知视障用户前方是否有障碍。
陈刚所在的杭州瞳行科技是2025年4月注册的公司,初创团队基本都是技术男,其中一位创始人的孩子先天失明,十年照料经历让团队更懂视障群体的真实需求。
和市场上主流的AI眼镜相比,瞳者-助盲AI眼镜的核心优势在于实时交互能力:通过计算机视觉技术,能识别151类常见物体,在出行场景中引导用户走盲道,遇到共享单车等障碍时及时提示绕行,绕行后再引导用户重返盲道;生活场景中,可帮用户找药罐、读手机信息,还内置双频GPS与北斗模块,提升定位精度。它支持一键联系三位亲友,亲友可通过平台实时查看用户位置,远程提供指导。
“我们自己也有一些小模型,调研了很多云计算厂家后,最后确定用阿里云的RTC技术。眼镜还整合了通义千问VL、OCR模型和百炼平台的语音交互能力。”陈刚说。
他同时承认,实际生活中需要识别的远不止151类常见物体,“目前我们还是建议用户搭配盲杖使用,未来还计划接入Be my eyes公益服务,让用户在亲友无法及时响应时,也能获得帮助”。
智能体:珊瑚礁“监测仪”
中国科学院南海海洋研究所教授杨红强分享了自己和珊瑚礁的故事。
指着一张蓝色背景的照片,杨红强告诉北京商报记者:“这是我2020年在南沙群岛水下20米拍摄到的珊瑚,现在这个地方的珊瑚已经没有了。”另一张他在西海岸拍摄的鹿角珊瑚也已不复存在。全球第四次珊瑚白化危机正持续蔓延,大堡礁部分区域珊瑚死亡率甚至高达70%—80%。
过去十年,他和团队走遍南海300多座岛礁,积累了20多T水下影像资料和100万张照片。“这么多照片靠人分析是不可能的,传统方法分析100个样方,经验丰富的专家要花18.6小时,还容易出现误差。”杨红强说依靠AI是自己的内生驱动。
就拿潜水来说,作为潜水教练的他拥有700多天海上考察经历,但是,“原则上潜水员潜水不能超过40米,这就制约了我们对珊瑚更深入的研究”,专家目视分析的准确度也是局限之一。
多模态智能体系统可以解决这一问题。据他介绍,其团队以通义千问VL多模态大模型为基座,研发出“瑶华”珊瑚礁多模态AI大模型1.0版,珊瑚属级识别准确率达88%,针对有些属集90%以上甚至100%,比传统的方法性能高了20%。5月,该模型在南沙群岛完成海试,原本需要20多小时处理的500多张影像,AI仅用12小时就完成了,为珊瑚礁退化监测提供了精准数据支撑。
“上午听完Qwen3的论坛,我们已经计划升级模型,目标是把准确率提高到90%以上。”杨红强公开了团队的最新计划。
具身智能:零帧起手
宇树机器狗可以在瑜伽球上行走,参加过人形机器人半程马拉松的高擎机电机器人“小海”,面对台阶能自主平衡。B站UP主“同济子豪兄”张子豪把线上展示的机器人能力搬到了云栖现场。
这位土木工程专业出身的技术博主,靠着自学AI与机器人技术,如今拥有30万粉丝,视频累计播放量超1300万。他的视频围绕一个主题:几千元玩转具身智能。
据张子豪介绍,宇树机器狗在瑜伽球上站立,是通过虚拟环境几千万次强化学习训练后,再将算法部署到真机实现的,3D打印的SO ARM机械臂成本千元,能训练抓小龙虾。
“你是学什么专业的?我们普通人要具备什么能力才可以做具身智能开发?”面对观众提出的这个问题,张子豪透露自己不是科班出身,“通义大模型帮我打破了学科壁垒”。机器人开发涉及自动化、电子、视觉等多领域,编程语言涵盖C++、Python、OpenCV,“以前我只会一种语言,现在靠Qwen3 Coder Plus模型,能快速搞定多学科代码,一个人就能完成复杂系统开发。”他说。
对于有兴趣的普通人,张子豪也给出了自己的建议:“不用怕没基础,AI能帮你读代码、学知识,关键是明确自己的需求,做个‘好产品经理’。”
在云栖大会现场,人们不只听到这些“大模型+”实践,会场外还有更多“AI+”的故事上演。随着AI基础设施的加速普及与大模型技术的迭代升级,科技正不断催生出无法估量的价值。