当前,人工智能加快融入经济社会发展各领域,深刻改变着生产与生活方式。在业内看来,模型能力提升只是基础,能否获得高质量数据支撑,进而打通数据流通和应用链条,形成安全可信的治理体系,是人工智能在更多场景落地应用的关键。
6月16日,“2026人民数据大会”专题交流会“数据要素×人工智能——词元(Token)赋能数据,智能驱动场景”在四川省自贡市举办。交流会围绕高质量数据集建设、具身智能数据和合规治理等议题展开交流。
多位参会嘉宾表示,人工智能发展正在从模型能力提升,进一步走向数据、场景、治理协同推进。推动“数据要素×人工智能”融合发展,要以高质量数据供给夯实基础,以场景需求牵引应用创新,以可信流通和合规治理提升数据价值释放水平,更好地赋能公共服务、产业升级和社会发展。
数据筑基,夯实人工智能发展基础
作为本次专题交流会举办地,自贡正把人工智能作为推动老工业城市转型升级的重要抓手。
自贡市人民政府副秘书长蔡国银出席专题交流并致辞。
人民网·人民数据总经理杨森滟表示,我国拥有海量数据资源和丰富应用场景,如何将数据资源优势真正转化为人工智能竞争新优势,仍需要各方共同探索。她提出,要建设“数据富矿”,促进高质量数据集规模化供给;聚焦“小而精”,以场景牵引数据价值深层释放;守好价值观底线,完善数据标准,确保人工智能发展“不越轨、不跑偏”。
据介绍,人民数据已汇集了产业链、电商、工商、舆情等43大类行业数据资源,形成了高质量数据集,提供海量、及时更新、源头合规的高质量数据服务。从互联网时代到人工智能时代,持续为数字经济发展提供富矿与燃料。
数据不仅服务产业,也服务民生。
“民生无小事,数据有温度。”国家发展改革委社会发展司原副司长、一级巡视员郝福庆表示,要充分利用数据服务国家战略、服务民生福祉、服务市场需求。推动跨部门数据协同、动态监测预警和依法开放应用数据,有助于提升公共服务决策的科学化水平。
从技术演进看,人工智能也面临新的发展要求。上海市人工智能战略咨询专家委员会荣誉委员、上海交大讲席教授、香港中文大学荣誉教授、欧洲科学院院士徐雷认为,当前大模型能力与生成式模型、Transformer架构、预训练和后训练等技术路径密切相关。随着规模化发展面临算力、能耗等约束,人工智能还需要面向实际应用和专业场景,在既有技术积累基础上持续创新。
场景牵引,促进数据价值转化
随着技术的不断提升,AI正从“锦上添花”的辅助工具,演变为“不可或缺”的生产力核心。
办公软件是人工智能落地应用的重要入口。北京金山办公软件股份有限公司副总裁王少康表示,金山办公正向智能办公时代转型。企业通过办公组件、知识库、行业AI等能力,推动人工智能在软件端从辅助写作、排版、生成公式,进一步走向理解目标、规划任务和协同执行。
高质量数据要发挥作用,还需要通过平台、产品和基础设施进入具体场景。
会议期间,“语料厨房”产品正式发布。据介绍,该平台结合人民网、人民科技多年主流价值语料库以及区域、行业高质量数据集建设经验,构建高质量数据集建设解决方案,赋能语料规划、采集、制作、审校、管理和输出全流程。
中国电信(人工智能)产业研究院副院长刘俊认为,产业智能化的关键,在于让数据真正参与模型生产,让模型服务业务场景,再由场景反馈驱动迭代优化。模数共振要构建高质量数据集、高效能模型、高价值应用之间的正向循环,让数据价值和模型价值可计量、可追溯、可运营。
中国电子云副总裁冯进则认为,产业智能化将加速数据治理和数据流通。当前部分数据流通场所停留在数据层面的撮合交易,未来将进化为基于AI原生的加速面向AI数智流通的创新范式,进而真正数智资产化运营。
治理护航,推动人工智能规范应用
人工智能应用不断拓展,围绕数据高质量发展,如何以场景驱动创新、以治理保障安全,成为业内讨论的重点。
深圳市优必选科技股份有限公司战略合作部部门负责人谢琨表示,传统人工智能更多与互联网和信息平台交互,具身智能则要让机器人进入真实物理世界。这意味着数据不再只是文字、图像和网页,还包括动作、接触、操作和场景经验。
知跃空间智能科技有限公司联合创始人张展认为,具身智能不能简单依赖扩大数据和算力规模。真实物理世界更加复杂,对智能体的学习能力、适应能力和自我迭代能力提出更高要求。
重庆菲利信科技有限公司总裁贝依林表示,数据标注行业正在从早期的文本、图像标注,走向音视频、3D点云、医疗、金融、包括工业图纸及设计建模等垂直领域的多模态复杂标注。词元成为可计量单位后,对数据服务的精细度、专业度和质量提出了更高要求。
天鹅到家创始人兼CEO陈小华认为,企业过去积累的数据大多是“面向人”使用的,需要通过系统、后台、报表来使用。进入AI智能体时代,企业应把高质量私域数据向员工和AI开放,让智能体理解企业规则、知识库、服务标准和历史处理记录,从而真正参与业务流程。
北京泽仪律师事务所主任周天喜表示,人工智能和数据应用必须有规则、有边界。无论是开发者、部署者还是使用者,都可能因算法缺陷、数据处理不当、个人信息保护不到位等承担相应责任。在当前法律框架下,人工智能本身还不是法律责任主体,责任仍由自然人、法人或其他组织承担。因此,要坚持事前预防、事后追责和全程合规。