• 最近访问:
发表于 2025-08-26 13:46:40 股吧网页版
魏亮:高质量数据集建设是提高人工智能性能的关键
来源:人民网

  人民网深圳8月26日电 (记者栗翘楚)人工智能技术的突破性进展正深刻重塑全球产业格局,而高质量数据集作为人工智能模型训练与应用的基石,已成为国家科技发展的核心要素。高质量数据集不仅是技术创新的“燃料”,更是推动超级人工智能、具身智能、自动驾驶等未来产业落地的关键引擎。

  8月26日,中国信息通信研究院副院长魏亮在“2025人民数据大会”发表主旨演讲时表示,在大模型为代表的人工智能技术发展过程中,数据是大模型智慧的来源,任何一个高性能大模型,都离不开高质量的数据集。多模态数据、具身智能数据、推理思维链数据和长视频数据是下一步高质量数据集建设的重点。

  随着人工智能加速迭代,大模型如雨后春笋般不断涌现,大模型需要的数据集增速远远高于高质量数据集生产和生成的速度,高质量、高价值密度的数据集将撑起一个企业差异化竞争,成为企业人工智能业务发展的护城河。

  “谁有高质量数据,就可以训练出一个好用的垂类模型。当垂类大模型在生产中规模使用,会生成更多高质量数据再反馈到该模型中,从而实现‘数据飞轮’效应。”魏亮认为,高质量数据的供给有三个方面的措施,即数据技术、数据工程以及数据治理:

  数据技术包含新一代标注技术与合成技术。当前,有高技术含量、高知识密度、高价值的应用,行业顶尖专家的高水平数据可能需要几十美元甚至上百美元,成为新一代标注技术的方向。合成技术从最初用来解决流通中隐私问题,如今也在应对训练集不足,包括用物理仿真、统计模型、机器学习等领域发挥更大作用。数据工程旨在提升模型数据集管理和效率,即能够规模化、高效生成好用的数据集,围绕管理体系、开发维护、质量控制、资源运行和合规可用五大要素搭建数据工程。数据治理即在控制数据过程中实现高质量和可靠,以及安全与合规,伦理要求都需要在数据治理中得到体现,从而使数据治理更好地服务数据集建设。

  魏亮表示,高质量数据集的建设是提高人工智能性能的关键,也是推动“人工智能+”行动落地的保证。随着“人工智能+”行动的发布,标志着人工智能进入一个数据驱动的新阶段。要通过AI的数据技术、数据工程、数据治理,能够共同推动高质量数据要素的高效能的供给。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500