腾讯姚顺雨谈AI下半场命题：“找好问题”比“找好方法”更有价值

作者：梅雅鑫责任编辑：梅雅鑫 2026.06.08 17:13 来源：通信世界网

通信世界网消息（CWW）当下AI行业早已告别“拼算法、堆模型”的初级阶段。

近日，腾讯高级执行副总裁汤道生与腾讯首席AI科学家、混元大模型及AI基础设施负责人姚顺雨展开深度对话，围绕AI下半场核心逻辑、混元3技术升级、模型与产品协同（Co-Design）、智能体Agent落地、行业争议与长期布局等核心话题，完整披露腾讯AI的思考、方法论与未来规划。

作为ReAct框架提出者、曾任职OpenAI的行业资深技术专家，姚顺雨也首度系统解读了“AI下半场”这一核心概念，并首次完整阐述其加入腾讯的原因、混元团队方法论及行业判断。

下半场命题：为什么“找好问题”比“找好方法”更难？“AI下半场”这个概念由姚顺雨在2024年的一篇博客中首次提出，这一概念也成为整场对话的核心基调。

在AI发展的前数十年，行业的核心目标是探索解决问题的新技术、新方法。彼时技术高度垂直：为围棋打造的模型只能下棋，为翻译研发的模型仅能处理文本转换，工具与场景深度绑定。但随着预训练、后训练技术走向成熟，大模型变成了一把“万能锤子”，通用技术框架可以适配各类场景，研发方法论不再是门槛，寻找有价值的落地问题，反而成为全行业最大的挑战。

谈及为何选择加入腾讯深耕AI，姚顺雨直言两大核心原因：其一，腾讯拥有海量真实产品与业务场景，恰好能承接通用大模型的落地需求，解决“技术何处产生价值”的行业痛点；其二，腾讯的企业文化是AI长期发展的沃土——团队坦诚务实、以信任而非单一数据指标驱动工作，秉持长期主义，摒弃浮躁短期思维。

在业务层面，他认为腾讯的核心优势在于上下文（context）。无论企业还是个人，模型能力趋同的背景下，竞争壁垒越来越取决于是否拥有最原始的输入、是否了解用户的真实场景。他强调，这是腾讯"非常强的优势"。

在他看来，健康的AI体系必须是基础模型、产品落地、前沿探索三足鼎立的均衡结构，三者缺一不可：基础模型需要充足资源与严谨的研发体系；产品落地离不开优秀的产品思维；而国内行业普遍短板的前沿探索，更需要团队保持想象力与试错精神。

姚顺雨直言，“在中国我们今天所做的前沿探索不够多”，希望能把frontier exploration的精神更多注入组织。

模型的实用性，远高于榜单分数

作为腾讯自研大模型的最新力作，混元3 Preview一经亮相便备受关注。姚顺雨坦言，如今做大模型的算法本身已趋于常规，真正拉开差距的是底层能力。混元3的升级集中在三大方向：

一是重建底层基础设施，全面优化预训练与强化学习整套技术架构；

二是重构数据与评测体系，持续丰富数据分类、严控数据质量，坚持围绕真实业务定义问题；

三是精细化权衡各项决策，从人才招聘到模型迭代节奏，没有固定公式，依靠行业判断与经验持续优化。

行业内“刷榜单”风气盛行，但腾讯明确提出：模型的实用性，远高于榜单分数。外部评测榜单存在明显短板：题目描述标准、场景单一，极易让模型出现“过拟合”问题，无法反映真实使用情况。

为此腾讯采用“预览版上线”模式，主动收集真实用户反馈：一方面能挖出榜单无法发现的底层缺陷，在正式版中完成修复；另一方面可以摸清用户真实提问习惯——现实中用户的问题往往表述模糊、伴随多轮追问，这也反向指导模型训练。不仅如此，元宝等C端产品的用户反馈，还为上下文学习等前沿研究提供了全新灵感，形成“产品反哺技术、技术赋能产品”的正向循环。

汤道生提出，腾讯有元宝、AI搜索、CodeBuddy（编程助手）、WorkBuddy（办公协作智能体）等丰富产品形态，如何让模型与产品紧密结合？

姚顺雨强调，LLM时代和传统AI最大的区别就是超强泛化能力。哪怕是编程智能体，也不能只依靠代码数据，还需要聊天、搜索、逻辑推理等复合能力。腾讯的全品类产品矩阵形成了独特优势：元宝打磨出的对话、搜索能力，可以快速迁移至办公、编程类产品；不同场景产生的多元数据又能相互赋能，让整体模型能力持续迭代升级。

汤道生补充，Co-Design的难点在于“对齐”：从数据标注的颗粒度、奖励与惩罚的边界，到评测标准是否与产品体验一致，都需要多角色共同参与。“如果没有做到对齐，产品行为会不可预测。”

行业标配之下，如何破解Token焦虑？

作为ReAct框架创始人，姚顺雨早在2019年的博士论文中，就提出了“从文本预测走向全流程数字化自动化”的愿景。他回忆，2022年7月的一个夜晚，他第一次将PaLM 2的API与手写的Wikipedia API连接，实现LLM与互联网的多轮交互，"当时感觉就像微弱电灯丝突然亮起来一样"。

从2022年首次实现大模型与互联网多轮交互，到如今Web智能体、编程智能体成为行业主流，当年的研究构想已全面落地。尤其是Agent、编程智能体（Coding Agent）已经成为大模型的基础标配。由于具备“图灵完备”的特性，编程智能体可以操控文件系统、独立运行任务，是实现自动化的核心载体。

针对全行业普遍存在的Token成本焦虑，团队也给出了务实解法：

第一，模型性能优先于单纯降本。不少企业陷入“盲目选用小模型控成本”的误区，实际上性能更强的模型能一次性解决问题，反而减少反复试错带来的额外Token消耗，综合性价比更高；2026年，简单任务的稳定性（Robustness），会成为降本增效的关键。

第二，走轻量化路线。国内团队在成本优化上已处于全球领先水平，腾讯重点研发小尺寸高性能模型，用轻量化模型对标大模型能力，配合架构创新、长文本优化等手段，实现成本与效果的平衡。

在产品与组织层面，不同场景的Agent需要定制化配置：编程场景注入代码上下文，办公场景补充协作、内容信息，核心是让模型获取精准有效的场景信息。同时，Agent时代的团队架构也迎来变革：传统大型团队拆解为3-5人的扁平化小团队，鼓励快速试验、包容试错；工程师不再单纯写代码，转型为需求设计者、AI任务调度者，全员深度贴近用户需求。

回应争议：腾讯AI走得慢？我们瞄准的是十年长跑一直以来，外界常有“腾讯AI布局偏慢”的评价，两位负责人也正面回应了这一争议。

姚顺雨表示，首先要厘清两大行业判断：AI是短期风口，还是长期赛道？未来发展是单一主线，还是多元生态？腾讯坚定认为，AI是一场数十年的长跑，当下仅仅是下半场的开端。如今的行业现状，如同上世纪70年代个人电脑刚诞生的阶段，远未走到终局。如果行业全部跟风追逐单一赛道（预训练、Agent），只会陷入同质化内卷；未来AI必然走向多元化，多模态、具身智能等新方向才刚刚起步，全新机会会持续涌现。

他强调，AI下半场的核心竞争力，不在于一时的快慢，而在于直面问题的坦诚、接收反馈的执行力、长期坚守的耐心。

汤道生也坦言，腾讯业务线庞大、赛道众多，不同团队进度有快有慢，出现试错与探索都属于正常现象。丰富的产品生态和场景积累，是腾讯AI最大的底气，海量业务沉淀的上下文，能持续为大模型提供落地土壤。面对年初的Agent热潮，腾讯也快速响应，WorkBuddy等产品更是经过长期迭代打磨，收获市场认可。

对话尾声，汤道生宣布腾讯将发布一套效率智能体工具集，帮助企业更安全、高效地部署智能体应用，其背后依托三大能力：场景联接能力、工程驾驭能力、模型驱动力。同期，正式启动腾讯AI共创营（二期），联合ISV、MSP等生态伙伴，共同打造行业AI解决方案与标杆案例，共建AI产业生态。

此外，腾讯还同步上线20余款AI新产品、新能力，围绕个人提效、企业服务等场景，开设多场技术、生态分论坛，全面开放AI技术与产品能力。

通信世界网版权及免责声明:

1、凡本网注明“来源：通信世界全媒体”及标有原创的所有作品，版权均属于通信世界网。未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载我方内容的单位，也必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和本站来源。
2、凡本网注明“来源：XXX（非通信世界网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。

发表评论请先登录

发表评论

评价

共0条评论

...

热点文章

...

技术文章

...

会议活动