腾讯姚顺雨谈AI下半场命题:“找好问题”比“找好方法”更有价值

作者:梅雅鑫 责任编辑:梅雅鑫 2026.06.08 17:13 来源:通信世界网

通信世界网消息(CWW)当下AI行业早已告别“拼算法、堆模型”的初级阶段。

近日,腾讯高级执行副总裁汤道生与腾讯首席AI科学家、混元大模型及AI基础设施负责人姚顺雨展开深度对话,围绕AI下半场核心逻辑、混元3技术升级、模型与产品协同(Co-Design)、智能体Agent落地、行业争议与长期布局等核心话题,完整披露腾讯AI的思考、方法论与未来规划。

1780911583225043204.png

作为ReAct框架提出者、曾任职OpenAI的行业资深技术专家,姚顺雨也首度系统解读了“AI下半场”这一核心概念,并首次完整阐述其加入腾讯的原因、混元团队方法论及行业判断。

下半场命题:为什么找好问题找好方法更难?“AI下半场”这个概念由姚顺雨在2024年的一篇博客中首次提出,这一概念也成为整场对话的核心基调。

在AI发展的前数十年,行业的核心目标是探索解决问题的新技术、新方法。彼时技术高度垂直:为围棋打造的模型只能下棋,为翻译研发的模型仅能处理文本转换,工具与场景深度绑定。但随着预训练、后训练技术走向成熟,大模型变成了一把“万能锤子”,通用技术框架可以适配各类场景,研发方法论不再是门槛,寻找有价值的落地问题,反而成为全行业最大的挑战。

谈及为何选择加入腾讯深耕AI,姚顺雨直言两大核心原因:其一,腾讯拥有海量真实产品与业务场景,恰好能承接通用大模型的落地需求,解决“技术何处产生价值”的行业痛点;其二,腾讯的企业文化是AI长期发展的沃土——团队坦诚务实、以信任而非单一数据指标驱动工作,秉持长期主义,摒弃浮躁短期思维。

在业务层面,他认为腾讯的核心优势在于上下文(context)。无论企业还是个人,模型能力趋同的背景下,竞争壁垒越来越取决于是否拥有最原始的输入、是否了解用户的真实场景。他强调,这是腾讯"非常强的优势"。

在他看来,健康的AI体系必须是基础模型、产品落地、前沿探索三足鼎立的均衡结构,三者缺一不可:基础模型需要充足资源与严谨的研发体系;产品落地离不开优秀的产品思维;而国内行业普遍短板的前沿探索,更需要团队保持想象力与试错精神。

姚顺雨直言,“在中国我们今天所做的前沿探索不够多”,希望能把frontier exploration的精神更多注入组织。

模型的实用性,远高于榜单分数

作为腾讯自研大模型的最新力作,混元3 Preview一经亮相便备受关注。姚顺雨坦言,如今做大模型的算法本身已趋于常规,真正拉开差距的是底层能力。混元3的升级集中在三大方向:

一是重建底层基础设施,全面优化预训练与强化学习整套技术架构;

二是重构数据与评测体系,持续丰富数据分类、严控数据质量,坚持围绕真实业务定义问题;

三是精细化权衡各项决策,从人才招聘到模型迭代节奏,没有固定公式,依靠行业判断与经验持续优化。

行业内“刷榜单”风气盛行,但腾讯明确提出:模型的实用性,远高于榜单分数。外部评测榜单存在明显短板:题目描述标准、场景单一,极易让模型出现“过拟合”问题,无法反映真实使用情况。

为此腾讯采用“预览版上线”模式,主动收集真实用户反馈:一方面能挖出榜单无法发现的底层缺陷,在正式版中完成修复;另一方面可以摸清用户真实提问习惯——现实中用户的问题往往表述模糊、伴随多轮追问,这也反向指导模型训练。不仅如此,元宝等C端产品的用户反馈,还为上下文学习等前沿研究提供了全新灵感,形成“产品反哺技术、技术赋能产品”的正向循环。

汤道生提出,腾讯有元宝、AI搜索、CodeBuddy(编程助手)、WorkBuddy(办公协作智能体)等丰富产品形态,如何让模型与产品紧密结合?

姚顺雨强调,LLM时代和传统AI最大的区别就是超强泛化能力。哪怕是编程智能体,也不能只依靠代码数据,还需要聊天、搜索、逻辑推理等复合能力。腾讯的全品类产品矩阵形成了独特优势:元宝打磨出的对话、搜索能力,可以快速迁移至办公、编程类产品;不同场景产生的多元数据又能相互赋能,让整体模型能力持续迭代升级。

汤道生补充,Co-Design的难点在于“对齐”:从数据标注的颗粒度、奖励与惩罚的边界,到评测标准是否与产品体验一致,都需要多角色共同参与。“如果没有做到对齐,产品行为会不可预测。”

行业标配之下,如何破解Token焦虑?

作为ReAct框架创始人,姚顺雨早在2019年的博士论文中,就提出了“从文本预测走向全流程数字化自动化”的愿景。他回忆,2022年7月的一个夜晚,他第一次将PaLM 2的API与手写的Wikipedia API连接,实现LLM与互联网的多轮交互,"当时感觉就像微弱电灯丝突然亮起来一样"。

从2022年首次实现大模型与互联网多轮交互,到如今Web智能体、编程智能体成为行业主流,当年的研究构想已全面落地。尤其是Agent、编程智能体(Coding Agent)已经成为大模型的基础标配。由于具备“图灵完备”的特性,编程智能体可以操控文件系统、独立运行任务,是实现自动化的核心载体。

针对全行业普遍存在的Token成本焦虑,团队也给出了务实解法:

第一,模型性能优先于单纯降本。不少企业陷入“盲目选用小模型控成本”的误区,实际上性能更强的模型能一次性解决问题,反而减少反复试错带来的额外Token消耗,综合性价比更高;2026年,简单任务的稳定性(Robustness),会成为降本增效的关键。

第二,走轻量化路线。国内团队在成本优化上已处于全球领先水平,腾讯重点研发小尺寸高性能模型,用轻量化模型对标大模型能力,配合架构创新、长文本优化等手段,实现成本与效果的平衡。

在产品与组织层面,不同场景的Agent需要定制化配置:编程场景注入代码上下文,办公场景补充协作、内容信息,核心是让模型获取精准有效的场景信息。同时,Agent时代的团队架构也迎来变革:传统大型团队拆解为3-5人的扁平化小团队,鼓励快速试验、包容试错;工程师不再单纯写代码,转型为需求设计者、AI任务调度者,全员深度贴近用户需求。

回应争议:腾讯AI走得慢?我们瞄准的是十年长跑一直以来,外界常有“腾讯AI布局偏慢”的评价,两位负责人也正面回应了这一争议。

姚顺雨表示,首先要厘清两大行业判断:AI是短期风口,还是长期赛道?未来发展是单一主线,还是多元生态?腾讯坚定认为,AI是一场数十年的长跑,当下仅仅是下半场的开端。如今的行业现状,如同上世纪70年代个人电脑刚诞生的阶段,远未走到终局。如果行业全部跟风追逐单一赛道(预训练、Agent),只会陷入同质化内卷;未来AI必然走向多元化,多模态、具身智能等新方向才刚刚起步,全新机会会持续涌现。

他强调,AI下半场的核心竞争力,不在于一时的快慢,而在于直面问题的坦诚、接收反馈的执行力、长期坚守的耐心。

汤道生也坦言,腾讯业务线庞大、赛道众多,不同团队进度有快有慢,出现试错与探索都属于正常现象。丰富的产品生态和场景积累,是腾讯AI最大的底气,海量业务沉淀的上下文,能持续为大模型提供落地土壤。面对年初的Agent热潮,腾讯也快速响应,WorkBuddy等产品更是经过长期迭代打磨,收获市场认可。

对话尾声,汤道生宣布腾讯将发布一套效率智能体工具集,帮助企业更安全、高效地部署智能体应用,其背后依托三大能力:场景联接能力、工程驾驭能力、模型驱动力。同期,正式启动腾讯AI共创营(二期),联合ISV、MSP等生态伙伴,共同打造行业AI解决方案与标杆案例,共建AI产业生态。

此外,腾讯还同步上线20余款AI新产品、新能力,围绕个人提效、企业服务等场景,开设多场技术、生态分论坛,全面开放AI技术与产品能力。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容