• 最近访问:
发表于 2026-06-05 14:01:40 股吧网页版
对谈实录 | 腾讯姚顺雨:AI是长期游戏,下半场刚刚开始
来源:财联社 作者:科创板日报记者 李佳怡


K图 00700_0

  《科创板日报》6月5日讯(记者李佳怡)今日,腾讯云AI产业大会如期举行。《科创板日报》记者赶到主论坛现场时,发现场内早已座无虚席,连入口处的过道也挤满了人,几乎无处落脚。记者了解到,不少参会观众都是慕腾讯首席AI科学家姚顺雨之名而来。

  姚顺雨,前OpenAI研究员,于2025年12月加入腾讯,担任“CEO/总裁办公室”首席AI科学家,直接向腾讯总裁刘炽平汇报。同时,他还兼任AI Infra部与大语言模型部负责人。

  大会现场,腾讯集团高级执行副总裁汤道生与腾讯首席AI科学家、混元大语言模型及AI Infra负责人姚顺雨展开深度对谈。姚顺雨围绕"AI下半场"分享了对行业趋势、模型演进与产品协同的核心判断。

  以下为对谈实录(有删减)

  ▎AI下半场的定义与选择腾讯的原因

  汤道生:为什么AI下半场会选择来腾讯?你认为AI下半场最重要的是什么?

  姚顺雨:首先解释一下什么叫做“下半场”我最近感觉这个词有点被滥用。这个概念是我去年的一个博客提出来的。我觉得在去年之前,AI已经发展了几十年,但是更加重要的是怎么去解决问题、去寻找好的方法。最近方法论已经变得非常成熟,但寻找问题变得更加困难。

  比如说过去我们发明AIphaGo下围棋,但是这个方法只适合下围棋或者下各种棋类。但是有了预训练和后训练之后我们发现,它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。

  我觉得加入腾讯很重要的一点是,这里有很多好问题、有很多产品。

  一方面,好的产品能够解决这一问题,即我们做预训练和后训练之后,到底要把它应用在什么地方产生价值;另一方面,环境非常重要,如果没有好的环境,Agent没有办法做各种各样的事情;最重要的是context,无论是企业还是个人。模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入,这一点腾讯有非常强的优势;最重要的原因是文化。我记得第一次和你、和其他总办老板聊天的时候,第一印象是大家都非常诚实——哪里做得好、哪里做得不好,非常直白,不会掩盖;此外,腾讯总体是一个基于trust、而不是基于metric去运转的公司,这一点对于做AI是非常重要的。包括我们的文化有非常low ego、非常solid的一面,这些文化对于长期做一个AI的组织是非常重要的。

  AI下半场最重要的是什么?我个人觉得,我们应该在中国建立一个长期的、基于AGI的组织。今天的AI主要有三部分:Foundation:我们怎么样把预训练和后训练最基础的东西做得非常solid;产品:我们怎么样把这样的技术真正为人和社会产生价值;Frontier:我们怎么样探索新的研究范式、探索新的机会。

  我觉得最重要的是,要构建一个非常均衡的三角形组织。做foundation,第一最重要的是有充足资源,第二是需要正确的做事方式。对于产品来说,有好的产品sense、有做产品的人是至关重要的。第三,在中国我们今天所做的前沿探索不够多,所以我希望能把frontier exploration的精神更多地注入到我们组织中。

  汤道生: 我觉得我们的做事方式、做产品的理念,其实也是实事求是的。毕竟AI赛道是长跑,我觉得有时候认知也很重要,做得好的和不好的都得认,关键是一个多维度的竞赛。我们看到现在模型有很多进步,做产品其实也有越来越多的形态,不同的场景有不同的需求,未来还是非常可期的。

  ▎Co-Design:产品与模型的相互成就

  汤道生:你提到模型和产品,产品可以说提供一个环境,给模型提供context上下文。我想问一个问题,我们经常讲Co-Design,即怎么把产品关模型能够比较紧密底结合起来。今天有元宝、AI搜索、智能客服、CodeBuddy、Workbuddy等丰富产品,对模型依赖很深,你怎么思考Co-Design?

  姚顺雨:第一,Co-Design的前提是模型本身做得solid。首先我觉得预训练是一个相对agnostic的事情,而且预训练它最大的特点是可泛化学习过程,它的进步可以带给各种各样下游任务持续的价值提升;后训练我觉得最重要一点是要设立好正确的Eval。中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得更重要的是如何实事求是,基于产品、基于真正的应用,构造更加真实的Eval。

  第二,要意识到“实用性”价值是大于刷榜价值,这一点我们做大量工作,跟各种各样产品进行了深度Co-Design,Co-Design很关键一点就是要产生相互信任;第三,LLM时代最本质的区别是泛化性。今天即使只做一个Coding Agent,也需要聊天、搜索、指令遵循、推理等复合能力。

  汤道生:内部Eval和外部榜单有什么区别?

  姚顺雨:首先benchmark还是有它的价值的,只是说这些榜非常容易 overfitting。真实世界数据能帮我们发现模型底线问题,预览版的目的就是获取真实反馈;另外,你对真实的Prompt distribution会有一个更深的了解。在现实场景中可能大家问的问题都是比较模糊的,它会不停追问,这能启发训练;我们甚至可以在这些产品上获得灵感,推进新榜单或新领域。我觉得产品和模型的互相成就,是越来越重要的AI话题。

  ▎产品第一性原理与混元3.0的改进

  姚顺雨: 您做过QQ空间、QQ音乐、云到元宝,toC和toB都有。您做产品的第一性原理是什么?哪些不变,哪些变?

  汤道生: 做产品,不变的是始终本着用户需求,解决痛点,创造价值。不同时代、不同行业都是如此。

  变化在于PC和移动时代,产品像“预制菜”,提供固定功能菜单;AI时代是开放式的,用户问什么你不知道,要靠模型理解、推理、调用工具,产品提供工具和环境。连研发流程都在变——今年大部分代码由AI生成,工程师更多做设计,测试左移,要对开放式答案做alignment。能力要求更全面了。

  汤道生: 混元Hy3 preview是你在腾讯的首秀,具体混元3.0做了什么改变?

  姚顺雨: 主要三点:第一,重建Infrastructure,无论是预训练还是强化学习预训练;第二,改变数据和Eval,如何去定义更真实的问题、丰富数据的taxonomy、提高数据的质量,这是一个永无止境的追求;第三,很多决策是taste driven的,没有很清晰的公式。我好奇您对Co-Design的边界怎么看——哪些该模型做,哪些该产品做?

  汤道生:Co-Design随模型能力变化。感受最深的是对齐:产品要解决某个问题,模型需要数据,但数据怎么标注、怎么奖惩、评测认不认同,如果各方没对齐,产品行为就不可预测。关键是让多个角色对开放式问题达成一致。

  姚顺雨:我觉得最难的是建立信任和同理心。做模型和做产品的目标有天然不align的地方。一个细节:我们曾派后训练最强骨干去帮元宝做后训练,当时预训练还没准备好,很多算法同学不理解,但现在看这个动作让产品团队意识到模型团队是真的为产品着想,为Hy3 preview在元宝上线起了重要作用。技术可以探讨,最难的反而是信任和换位思考。

  汤道生:Token的调用对于混元做下一代模型研发,你觉得有哪些地方比较重要?

  姚顺雨:今天我觉得Agent毫无疑问是每一家模型所发力的重点,我觉得我们做的方法可能会有几个区别:

  第一,即使今天Coding已经是最重要的事情,但是我们还是会强调体系的全面化。我始终认为要把Coding做好,其实需要远远不止Coding的数据,也需要聊天、推理,各种各样不同的东西,因为大模型最重要的点是泛化性。

  第二,很显然产品作用越来越重要,如何利用好线上回流,我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多CoDesign经验变得非常重要。

  第三,我觉得还需要更多想像力,无论是技术演进,还是产品演进,甚至下一个范式演进,我们需要做探索性甚至不确定性的工作。

  ▎从ReAct到智能体

  汤道生:你是ReAct架构提出者,博士研究围绕语言智能体。几年前的观点到今天兑现了吗?

  姚顺雨: 我重读了自己的博士论文(《Language Agent: from next token prediction to digital automation》,2019年)。那时GPT2只能做next token prediction,输出不流畅、还有毛刺。当时我的狂野想象是:GTP有一天潜力不仅仅是在于吐出下一个Token,而在于把这个世界上所有的事情全部automate,我当时想的还不够大,我想的是digital automation,但是现在看起来也有可能是digital and physical automation。

  博士期间做了两部分:一是如何建立一个Agent方法论,最重要的工作是ReAct。2022年7月,我第一次把Palm 2 API和Wikipedia API连在一起,让LLM基于网页多轮回答问题,那一刻感觉像微弱的电灯突然亮了,人类第一次把LLM和互联网连在一起做多轮交互。二是定义digital automation任务,如WebShop、InterCode、SWE-bench。

  现在看,Agent最重要的就是外部Agent和Coding Agent。我博士论文结尾的future work——train models for Agent、robust deployment、scientific discovery、help human,我很感慨我现在很幸运确实在做当时列的future direction。

  ▎Token效率、Agent产品与组织变革

  汤道生: 现在大家有Token焦虑、Token成本爆发式增长。你怎么看待优化Token效率?

  姚顺雨: 在中国讨论性价比不能只看模型架构。第一是performance——更好的模型一次做对,反而更省钱。尤其今年简单任务的robustness很重要。第二是成本,中国是领先于世界的,最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,脚手架有很多需要做的事情。

  我很好奇,您觉得Agent,你是什么时候意识到它是一个什么新的产品的机会,以及你现在认知是什么,你觉得现在我们离一个好用的Agent bottlenck在哪里呢?

  汤道生:在不同场景中,Agent的设计需充分发挥模型能力。模型越强,Agent需承担的中间工作越少。随着模型能力提升,产品可更简化,转而提供更多工具、技能和记忆。不同场景(如编码、办公协作)需要不同的相关信息,关键在于理解场景中哪些内容与当前任务最相关,让模型获得所需信息,从而高效完成任务。

  姚顺雨: Workbuddy等产品背后是小团队快速迭代。您觉得AI时代的研发和组织管理发生了什么变化?

  汤道生: Workbuddy是非常扁平化的组织,三五个人围绕一个领域攻坚,大量试验,也要包容团队试错,我觉得这是做原生AI产品需要的组织形态。另外,工程师把写代码交给AI,更像驱动多个Coding Agent的leader,针对我们想要的产品需求去做研发、开发,同时要参与评测、测试,也能用好AI能力,把这些质量保证工作、对齐工作要做到前面来。

  ▎AI是长期游戏,下半场刚刚开始

  汤道生:很多人说腾讯在AI上慢了。你觉得我们真的慢了吗?

  姚顺雨: 应该是我问您的问题。AI今天有两个判断:第一,Al是一个长期游戏,而非短期窗口。他指出,硅谷部分从业者认为需要"赶快赚两年钱退休"的心态并不可取,AI才刚刚开始,ChatGPT和Claude Code不会是仅有的超级应用,未来将持续诞生新的产品机会,"今天可能就像70年代PC刚刚产生的时候";第二,AI将走向多元而非单一路径。过去几年行业沿着预训练、后训练、Agent的清晰主线推进,但未来Coding Agent之外,多模态、具身智能等大量新方向正在或即将形成,整个世界"还有很多空间没有被填满"。

  汤道生: 腾讯是多业态公司,有快有慢,有失败有探索。但就像你说的,这是长跑。腾讯有丰富的场景和context积累,我们在长跑中,也请大家多提醒、多提建议、多用我们的产品。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500