• 最近访问:
发表于 2026-06-16 17:52:41 股吧网页版
徐雷:从AI需求出发推进数据资源建设
来源:人民网

  人民网自贡6月16日电 (记者焦磊)6月16日,由人民网·人民数据主办的“2026人民数据大会”在四川省自贡市举行。会上,上海市人工智能战略咨询专家委员会荣誉委员、上海交大讲席教授、香港中文大学荣誉教授、欧洲科学院院士徐雷在主旨发言中表示,人工智能的发展与语言、文字和数据表达方式密切相关。推进数据资源建设和应用,应进一步从人工智能需求出发,重视中文数据特征、行业专业数据价值以及数据流通中的安全边界。

  徐雷表示,人类智能与语言文字关系紧密。与西方拼音文字逐步抽象为符号语言、数学语言并延伸至计算机语言不同,中文文字具有形象结构,一个字往往包含符号、内容和意义。这一特点对人工智能的数据表达和模型训练具有启发意义。

  围绕数据建设,徐雷表示,当前在处理中文数据时,往往会将文字转化为编码、token等形式,若能够进一步考虑中文文字和中文语义结构特点,将其融入数据组织和模型处理过程,可能有助于提升人工智能训练和应用效果。数据工作不能只停留在传统大数据思路上,还要关注数据能否支撑模型训练、业务推理和实际任务落地。

  “真正有价值的数据,是行业和专业的。”在徐雷看来,真正有价值的数据更多蕴含在行业和专业场景中。通用数据固然重要,但越往行业应用深入,专业数据越成为企业和行业的关键资源。

  徐雷认为,推动数据要素流通和价值释放,既要看到行业专业数据对人工智能发展的重要支撑作用,也要认识到相关数据在交易、共享和合作中的边界。特别是在智能设备、机器人等可能持续采集真实环境数据的场景中,应更加重视数据采集、使用和流转过程中的风险防范。

  徐雷表示,面向人工智能发展新阶段,数据建设应更加关注模型需求、场景需求和产业落地需求,在保障安全和权益的基础上,推动高价值数据更好地服务人工智能创新发展。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500