• 最近访问:
发表于 2025-09-11 13:13:31 股吧网页版
“强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代”
来源:证券时报网 作者:张淑贤

  9月11日上午,在2025 Inclusion·外滩大会上,2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)发表主旨演讲,他认为,人类数据红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往。

  萨顿表示,大多数机器学习的目标,是把人类已有的知识转移到静态、缺乏自主学习能力的AI 上。“我们逐渐达到人类数据的极限,现有的方法不能生成新的知识,不适合持续学习,而持续学习对智能的效用至关重要。”他认为,我们正进入“经验时代”,需要一种新的数据源,由智能体与世界直接交互中生成。这正是人类和其他动物的学习方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在国际数学奥林匹克斩获银牌的路径。

  萨顿解释,“经验”指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。“知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”他同时指出,强化学习带领我们进入了新的经验时代,但要释放全部潜力,还需要两项目前尚不成熟的技术——持续学习(continual learning)和元学习(meta-learning)技术。

  面对外界对AI带来偏见、失业甚至人类灭绝的担忧,萨顿认为,这种对人工智能的恐惧被夸大了,目标不同的智能体,可以通过去中心化的协作实现双赢。“人类最卓越的超能力,就在于比其他任何动物都更擅长协作。人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物。”萨顿表示,人工智能和人类繁荣将来自于去中心化协作,“协作并非总能实现,却是世间一切美好事物的源泉,我们必须寻求协作、支持协作,并致力将协作制度化。”

  他认为,在人类的发展进程中,人工智能的替代将是不可避免的。而人类至少是催化剂,是助产士,更是开启宇宙第四大时代——“设计时代”的先驱。萨顿将宇宙历史分为四个时代:粒子时代、恒星时代、复制者时代和设计时代。

  “人工智能是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。”萨顿表示。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500