“数据产业发展的关键是资本问题,以人工智能行业,当前热钱都在往具身智能涌,具身智能产业得到发展,进而也就带动了具身智能数据的发展。其实,更应该关注的是抓数据产业,而不是抓数据本身,数据产业怎么发展?更多需要产业的耐心资本。”12月10日,由《中国经营报》主办的“2025中国数据要素高质量发展论坛”在北京举办,北京清竞数智科技有限公司(以下简称“清竟数智”)CTO王吴越在会上表示。
公共数据资源具有巨大的开发利用潜力,要让公共数据资源“用得好”,首先必须确保其能够“供得出”,这是释放数据要素价值的基础环节。
聚焦如何实现让数据“供得出”这一问题,王吴越认为,在数据和人工智能模型的叠加效应(Data For AI,AI forData)之下,让数据“供得出”有以下两个要点:一是现在的数据热点已经从原来的数据库,做高频交易,转向了人工智能原生数据(AINet),高质量数据集的建设,包括国家数据局推动的数据行动计划也是通过“数据+模型”的方式去推动人工智能产业的发展。因此,“供得出”的先决条件是要把数据加工成AINet标准化的高质量数据集。二是在流通环节使用可信数据空间技术加速数据的流通。
据王吴越介绍,清竞科技业务模式包括为国家机关、地方政府和央企提供高质量数据集质量评测平台的技术支撑。
从技术的视角来看,王吴越认为,未来数据有两种壁垒:第一种是数据源的壁垒,别人没有,你有;第二种是数据进行深加工,大模型能够直接用来进行训练。数据就是为人工智能服务的。
“技术的理想往往是美好的,但是到落地的执行层就会发现,最后还是会回溯到溯源供给,也就是到哪儿去找数据。最大的问题还是在于数据源的供给目前是匹配不上数据的需求的。而技术层面,能够看到,大家技术的价值回归是朝着相同的路径上去迈进的。”王吴越称。