• 最近访问:
发表于 2026-05-10 11:24:40 股吧网页版
“过去积累的数据已经消耗完了”,上海这家公司如何攻关AI时代新胜负手?
来源:上观新闻

  在西岸的一间办公室里,王长冕的桌上摊开着一份关于“具身智能数据合成”的报告,这是他与团队近期攻关的关键领域之一。2025年5月,这位在AI领域深耕多年的技术专家选择加入一家成立仅一年的年轻公司——上海库帕思科技有限公司,担任首席技术官。他看到了AI时代的趋势:数据,正成为新的胜负手。

  当下,大模型的竞争已从“拼算法”转向“拼数据”。模型能力的提升、行业应用的落地,越来越离不开高质量的语料。而王长冕团队面对的,正是这个核心而棘手的“数据瓶颈”。他们立足国家战略需求,努力构建覆盖语料全生命周期的综合性解决方案。

  “人类互联网过去二三十年积累的数据,基本上已被大模型‘消耗’得差不多了。”王长冕坦言。更关键的是,随着大模型、多模态模型、智能体的发展,AI对数据的需求正在从过去“给人看的数据”,转向“给AI用的数据”,也就是更适合模型训练和推理的AI Ready语料。

  库帕思的诞生,恰逢其时。2024年3月,这家人工智能语料数据平台型企业正式成立,成为中国首家专业AI语料公司。王长冕加入后,带领团队攻关“三个重构”:一是重构语料供数据方法体系,依靠语料魔方;二是重构语料基础设施,以AI Ready为导向;三是以供需闭环,重构语料行业生态。

  挑战巨大,但进展迅速。2025年11月,库帕思连续申请了“具身智能数据合成与标注方法”等多项专利。他们与智元机器人合作,完成了“数千万真机数据采集和数千万仿真数据合成”。库帕思还中标了临床医疗领域的人工智能语料集项目,为医疗AI模型构建高质量语料基座。

  “一些关键性的数据,比如医疗领域的数据,会交给我们去运营。”王长冕透露。这些天然稀缺的数据,经过库帕思的处理,能直接赋能前沿科研。他们与将加工后的高质量数据用于肠胃镜模型的训练,“让模型效果的表现非常惊艳”。

  在上海发展这项事业,王长冕觉得“天然具有优势”。上海不仅是AI企业和人才的聚集地,更重要的是政府对人工智能非常重视,且高瞻远瞩地早早布局。作为国有控股企业,库帕思承担了部分公共数据运营的职能,这为其提供了宝贵的数据资源和项目参与机会。同时,上海活跃的创新创业生态,尤其是大量涌现的OPC(一人公司),成为了库帕思服务的新对象。

  2026年3月,库帕思牵头发布了“模塑申城语料普惠计划2.0”,宣布将免费向中小企业、高校师生和创新创业者提供语料数据服务。计划到2027年底,链接500个创新主体,打造300个稀缺数据集,普惠提供价值不少于1.5亿元的语料。“这有助于带动整个上海AI产业的发展。”王长冕说。

  眼下,AI模型的迭代速度以月甚至以周计,让从业者都感到“很吃力”。但王长冕坚信,无论模型如何演进,高质量的数据需求是永恒且日益增长的底层动力。他与团队正继续以“全流程覆盖、多模态处理、高度自动化与智能化”为核心战略,努力推动人工智能产业数据基础设施建设,为上海打造国家级人工智能创新发展高地提供核心技术支撑,增强上海在人工智能数据要素领域的竞争力和话语权,助力构建具有全球影响力的人工智能产业生态。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500