对谈实录 | 腾讯姚顺雨：AI是长期游戏，下半场刚刚开始_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-06-05 14:01:40 股吧网页版

对谈实录 | 腾讯姚顺雨：AI是长期游戏，下半场刚刚开始

来源：财联社作者：科创板日报记者李佳怡

　　《科创板日报》6月5日讯（记者李佳怡）今日，腾讯云AI产业大会如期举行。《科创板日报》记者赶到主论坛现场时，发现场内早已座无虚席，连入口处的过道也挤满了人，几乎无处落脚。记者了解到，不少参会观众都是慕腾讯首席AI科学家姚顺雨之名而来。

　　姚顺雨，前OpenAI研究员，于2025年12月加入腾讯，担任“CEO/总裁办公室”首席AI科学家，直接向腾讯总裁刘炽平汇报。同时，他还兼任AI Infra部与大语言模型部负责人。

　　大会现场，腾讯集团高级执行副总裁汤道生与腾讯首席AI科学家、混元大语言模型及AI Infra负责人姚顺雨展开深度对谈。姚顺雨围绕"AI下半场"分享了对行业趋势、模型演进与产品协同的核心判断。

　　以下为对谈实录（有删减）

　　▎AI下半场的定义与选择腾讯的原因

　　汤道生：为什么AI下半场会选择来腾讯？你认为AI下半场最重要的是什么？

　　姚顺雨：首先解释一下什么叫做“下半场”我最近感觉这个词有点被滥用。这个概念是我去年的一个博客提出来的。我觉得在去年之前，AI已经发展了几十年，但是更加重要的是怎么去解决问题、去寻找好的方法。最近方法论已经变得非常成熟，但寻找问题变得更加困难。

　　比如说过去我们发明AIphaGo下围棋，但是这个方法只适合下围棋或者下各种棋类。但是有了预训练和后训练之后我们发现，它是一个通用方法论，可以解决各种各样的问题，反而更困难的是怎么寻找好的问题去解决。

　　我觉得加入腾讯很重要的一点是，这里有很多好问题、有很多产品。

　　一方面，好的产品能够解决这一问题，即我们做预训练和后训练之后，到底要把它应用在什么地方产生价值；另一方面，环境非常重要，如果没有好的环境，Agent没有办法做各种各样的事情；最重要的是context，无论是企业还是个人。模型越来越擅长把一个非常复杂的输入变成输出，很多时候你的竞争壁垒就在于你有没有最原始的输入，这一点腾讯有非常强的优势；最重要的原因是文化。我记得第一次和你、和其他总办老板聊天的时候，第一印象是大家都非常诚实——哪里做得好、哪里做得不好，非常直白，不会掩盖；此外，腾讯总体是一个基于trust、而不是基于metric去运转的公司，这一点对于做AI是非常重要的。包括我们的文化有非常low ego、非常solid的一面，这些文化对于长期做一个AI的组织是非常重要的。

　　AI下半场最重要的是什么？我个人觉得，我们应该在中国建立一个长期的、基于AGI的组织。今天的AI主要有三部分：Foundation：我们怎么样把预训练和后训练最基础的东西做得非常solid；产品：我们怎么样把这样的技术真正为人和社会产生价值；Frontier：我们怎么样探索新的研究范式、探索新的机会。

　　我觉得最重要的是，要构建一个非常均衡的三角形组织。做foundation，第一最重要的是有充足资源，第二是需要正确的做事方式。对于产品来说，有好的产品sense、有做产品的人是至关重要的。第三，在中国我们今天所做的前沿探索不够多，所以我希望能把frontier exploration的精神更多地注入到我们组织中。

　　汤道生： 我觉得我们的做事方式、做产品的理念，其实也是实事求是的。毕竟AI赛道是长跑，我觉得有时候认知也很重要，做得好的和不好的都得认，关键是一个多维度的竞赛。我们看到现在模型有很多进步，做产品其实也有越来越多的形态，不同的场景有不同的需求，未来还是非常可期的。

　　▎Co-Design：产品与模型的相互成就

　　汤道生：你提到模型和产品，产品可以说提供一个环境，给模型提供context上下文。我想问一个问题，我们经常讲Co-Design，即怎么把产品关模型能够比较紧密底结合起来。今天有元宝、AI搜索、智能客服、CodeBuddy、Workbuddy等丰富产品，对模型依赖很深，你怎么思考Co-Design？

　　姚顺雨：第一，Co-Design的前提是模型本身做得solid。首先我觉得预训练是一个相对agnostic的事情，而且预训练它最大的特点是可泛化学习过程，它的进步可以带给各种各样下游任务持续的价值提升；后训练我觉得最重要一点是要设立好正确的Eval。中国大家有个不好的倾向是大家喜欢刷榜，但是我觉得更重要的是如何实事求是，基于产品、基于真正的应用，构造更加真实的Eval。

　　第二，要意识到“实用性”价值是大于刷榜价值，这一点我们做大量工作，跟各种各样产品进行了深度Co-Design，Co-Design很关键一点就是要产生相互信任；第三，LLM时代最本质的区别是泛化性。今天即使只做一个Coding Agent，也需要聊天、搜索、指令遵循、推理等复合能力。

　　汤道生：内部Eval和外部榜单有什么区别？

　　姚顺雨：首先benchmark还是有它的价值的，只是说这些榜非常容易 overfitting。真实世界数据能帮我们发现模型底线问题，预览版的目的就是获取真实反馈；另外，你对真实的Prompt distribution会有一个更深的了解。在现实场景中可能大家问的问题都是比较模糊的，它会不停追问，这能启发训练；我们甚至可以在这些产品上获得灵感，推进新榜单或新领域。我觉得产品和模型的互相成就，是越来越重要的AI话题。

　　▎产品第一性原理与混元3.0的改进

　　姚顺雨： 您做过QQ空间、QQ音乐、云到元宝，toC和toB都有。您做产品的第一性原理是什么？哪些不变，哪些变？

　　汤道生： 做产品，不变的是始终本着用户需求，解决痛点，创造价值。不同时代、不同行业都是如此。

　　变化在于PC和移动时代，产品像“预制菜”，提供固定功能菜单；AI时代是开放式的，用户问什么你不知道，要靠模型理解、推理、调用工具，产品提供工具和环境。连研发流程都在变——今年大部分代码由AI生成，工程师更多做设计，测试左移，要对开放式答案做alignment。能力要求更全面了。

　　汤道生： 混元Hy3 preview是你在腾讯的首秀，具体混元3.0做了什么改变？

　　姚顺雨： 主要三点：第一，重建Infrastructure，无论是预训练还是强化学习预训练；第二，改变数据和Eval，如何去定义更真实的问题、丰富数据的taxonomy、提高数据的质量，这是一个永无止境的追求；第三，很多决策是taste driven的，没有很清晰的公式。我好奇您对Co-Design的边界怎么看——哪些该模型做，哪些该产品做？

　　汤道生：Co-Design随模型能力变化。感受最深的是对齐：产品要解决某个问题，模型需要数据，但数据怎么标注、怎么奖惩、评测认不认同，如果各方没对齐，产品行为就不可预测。关键是让多个角色对开放式问题达成一致。

　　姚顺雨：我觉得最难的是建立信任和同理心。做模型和做产品的目标有天然不align的地方。一个细节：我们曾派后训练最强骨干去帮元宝做后训练，当时预训练还没准备好，很多算法同学不理解，但现在看这个动作让产品团队意识到模型团队是真的为产品着想，为Hy3 preview在元宝上线起了重要作用。技术可以探讨，最难的反而是信任和换位思考。

　　汤道生：Token的调用对于混元做下一代模型研发，你觉得有哪些地方比较重要？

　　姚顺雨：今天我觉得Agent毫无疑问是每一家模型所发力的重点，我觉得我们做的方法可能会有几个区别：

　　第一，即使今天Coding已经是最重要的事情，但是我们还是会强调体系的全面化。我始终认为要把Coding做好，其实需要远远不止Coding的数据，也需要聊天、推理，各种各样不同的东西，因为大模型最重要的点是泛化性。

　　第二，很显然产品作用越来越重要，如何利用好线上回流，我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多CoDesign经验变得非常重要。

　　第三，我觉得还需要更多想像力，无论是技术演进，还是产品演进，甚至下一个范式演进，我们需要做探索性甚至不确定性的工作。

　　▎从ReAct到智能体

　　汤道生：你是ReAct架构提出者，博士研究围绕语言智能体。几年前的观点到今天兑现了吗？

　　姚顺雨： 我重读了自己的博士论文（《Language Agent: from next token prediction to digital automation》，2019年）。那时GPT2只能做next token prediction，输出不流畅、还有毛刺。当时我的狂野想象是：GTP有一天潜力不仅仅是在于吐出下一个Token，而在于把这个世界上所有的事情全部automate，我当时想的还不够大，我想的是digital automation，但是现在看起来也有可能是digital and physical automation。

　　博士期间做了两部分：一是如何建立一个Agent方法论，最重要的工作是ReAct。2022年7月，我第一次把Palm 2 API和Wikipedia API连在一起，让LLM基于网页多轮回答问题，那一刻感觉像微弱的电灯突然亮了，人类第一次把LLM和互联网连在一起做多轮交互。二是定义digital automation任务，如WebShop、InterCode、SWE-bench。

　　现在看，Agent最重要的就是外部Agent和Coding Agent。我博士论文结尾的future work——train models for Agent、robust deployment、scientific discovery、help human，我很感慨我现在很幸运确实在做当时列的future direction。

　　▎Token效率、Agent产品与组织变革

　　汤道生： 现在大家有Token焦虑、Token成本爆发式增长。你怎么看待优化Token效率？

　　姚顺雨： 在中国讨论性价比不能只看模型架构。第一是performance——更好的模型一次做对，反而更省钱。尤其今年简单任务的robustness很重要。第二是成本，中国是领先于世界的，最重要的事情是怎么用一个更小的模型把更高的价值任务做好，在这基础上架构创新，脚手架有很多需要做的事情。

　　我很好奇，您觉得Agent，你是什么时候意识到它是一个什么新的产品的机会，以及你现在认知是什么，你觉得现在我们离一个好用的Agent bottlenck在哪里呢？

　　汤道生：在不同场景中，Agent的设计需充分发挥模型能力。模型越强，Agent需承担的中间工作越少。随着模型能力提升，产品可更简化，转而提供更多工具、技能和记忆。不同场景（如编码、办公协作）需要不同的相关信息，关键在于理解场景中哪些内容与当前任务最相关，让模型获得所需信息，从而高效完成任务。

　　姚顺雨： Workbuddy等产品背后是小团队快速迭代。您觉得AI时代的研发和组织管理发生了什么变化？

　　汤道生： Workbuddy是非常扁平化的组织，三五个人围绕一个领域攻坚，大量试验，也要包容团队试错，我觉得这是做原生AI产品需要的组织形态。另外，工程师把写代码交给AI，更像驱动多个Coding Agent的leader，针对我们想要的产品需求去做研发、开发，同时要参与评测、测试，也能用好AI能力，把这些质量保证工作、对齐工作要做到前面来。

　　▎AI是长期游戏，下半场刚刚开始

　　汤道生：很多人说腾讯在AI上慢了。你觉得我们真的慢了吗？

　　姚顺雨： 应该是我问您的问题。AI今天有两个判断：第一，Al是一个长期游戏，而非短期窗口。他指出，硅谷部分从业者认为需要"赶快赚两年钱退休"的心态并不可取，AI才刚刚开始，ChatGPT和Claude Code不会是仅有的超级应用，未来将持续诞生新的产品机会，"今天可能就像70年代PC刚刚产生的时候"；第二，AI将走向多元而非单一路径。过去几年行业沿着预训练、后训练、Agent的清晰主线推进，但未来Coding Agent之外，多模态、具身智能等大量新方向正在或即将形成，整个世界"还有很多空间没有被填满"。

　　汤道生： 腾讯是多业态公司，有快有慢，有失败有探索。但就像你说的，这是长跑。腾讯有丰富的场景和context积累，我们在长跑中，也请大家多提醒、多提建议、多用我们的产品。

（文章来源：财联社） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》