姚顺雨交出的首份研究成果,或成为腾讯AI决战获胜关键
创始人
2026-02-07 21:20:32

2026年春节未至,国内AI大厂的用户争夺战已率先打响,腾讯元宝大手笔发红包,阿里千问推出30亿免单活动,字节豆包依托春晚流量做内容生成,各大厂商纷纷烧钱抢占市场。

但相较于短期的营销动作,腾讯此前挖来前OpenAI研究员、清华姚班的姚顺雨,或许才是其布局AI赛道的长远之计。

近日,姚顺雨执掌腾讯AI后交出首个署名研究成果,由腾讯混元团队联合复旦大学完成,这份聚焦大模型上下文学习能力的研究,直指AI“听不懂人话”的核心痛点,也让腾讯在与国内外厂商的AI竞争中,走出了一条差异化的技术攻坚路线。

这份研究将目光对准了大模型上下文处理技术,得出的结论令人意外:当把大模型从记背知识的“背书模式”,切换到根据新信息实时推理的“现学现卖模式”时,即便是目前全球最先进的AI模型,正确率也仅有23.7%。

这一发现直接解释了普通用户使用AI时遇到的“死脑筋”“胡说八道”等问题,而上下文处理能力,也成为当下全球大模型的共同难题。

要理解这一研究的价值,需先看清大模型的两大运作阶段。

第一阶段是预训练,模型通过学习互联网海量静态数据积累通用知识,这是其回答常规问题的基础,但这些知识仅截止到训练完成前,无法适配动态的真实世界。

第二阶段是情境学习,也就是上下文处理,要求AI跳出预训练的知识储备,根据用户给出的全新、专属信息实时推理判断,比如依据公司内部会议纪要、游戏新活动规则作答。

可以说,上下文处理能力是AI的灵魂,一旦处理不好,AI就会脱离具体规则编造答案,出现常见的“幻觉”问题。

为测试大模型的上下文学习能力,混元团队打造了CL-bench评测体系,构建了近2000个从未在互联网公开的全新情境,让模型在无通用知识可参考的情况下作答。测试结果显示,表现最好的GPT-5.1(High)正确率仅23.7%,Claude Opus 4.5约21.1%,国内的千问、豆包等模型正确率也在10%-14%之间,所有测试模型的平均正确率仅17.2%。

这意味着,当要求AI只根据给出的新信息作答时,绝大多数情况下都会出错,如同固执的学生无视黑板上的新规则,仍按旧知识答题。

研究还揭示了大模型上下文学习能力薄弱的两大原因:一是预训练知识过于根深蒂固,面对新信息时无法有效抑制旧认知;二是复杂逻辑推演能力不足,即便能处理超长文本,也难以从海量信息中精准提取关键,简单的知识检索尚能应对,一旦涉及复杂推理,正确率便会暴跌。

而这一痛点,也成为国内外AI厂商的竞争分水岭,各家的攻坚方向因自身生态截然不同。

国内来看,阿里千问依托电商、本地生活的完整履约体系,核心攻坚大模型与B端商业体系的整合能力,其30亿免单活动就是考验模型在实体消费场景的落地执行,而非底层的上下文处理;

字节豆包背靠短视频生态,侧重AI生成内容的能力,争夺用户注意力时长,技术发力点更多在多模态内容创作、实时交互体验上;

百度文心一言则坚守搜索核心,重点提升大模型的知识检索和通用问答效率,围绕搜索场景做技术优化。

这几家大厂的技术布局均围绕自身核心生态,在大模型上下文处理这一底层痛点上,尚未有深度的专项研究和攻坚。

海外厂商则走上了另一条路,OpenAI、Google虽在模型参数、长上下文窗口上持续发力,比如Google Gemini支持200万tokens的超长文本、GPT-4-turbo有128k tokens处理能力,但此次测试显示,Gemini 3 Pro正确率仅15.8%。

可见其虽提升了上下文窗口的长度,却忽视了模型对新信息的实时推理能力,陷入“能装下更多信息,却读不懂信息”的困境。

而腾讯之所以聚焦这一技术痛点,与其自身的业务布局密不可分。和其他厂商不同,腾讯的核心业务扎根于社交、内容领域,同时布局游戏与企业服务,这些场景对AI的上下文处理能力要求极为苛刻。

微信、QQ的碎片化对话流,需要AI精准理解封闭语境中的人际关系和隐含逻辑;游戏场景要求AI根据实时局势做出反应,而非机械背诵预训练内容;企业微信、腾讯会议则需要AI基于私有文档做精准分析,通用知识在此不仅无用,还可能因“幻觉”造成误导。

各大厂的AI营销战只是短期的用户争夺,而姚顺雨的这份研究,让腾讯跳出了“生态适配”的固有竞争思路,直击全球大模型的核心技术痛点。

对坐拥海量应用场景的腾讯而言,一个能在复杂上下文中保持逻辑严密的AI模型,远比只会死记硬背知识的模型更具商业价值,而这一差异化的技术布局,也成为腾讯决战AI赛道的关键一步。

[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

曝光:广东科德投资顾问返还服务... 曝光:广东科德投资顾问返还服务费可以退费!有法可依!误导性宣传欺诱导股民缴费投资有风险,投资需谨慎!...
北京中富金石四川返还服务费荐股... 中富金石不可信,推荐的股票不靠谱,交的服务费是可以退的,虚假宣传推荐垃圾票亏损严重,维权已退款,退款...
曝光:广东科德投资顾问服务费能... 曝光:广东科德投资顾问服务费能退回吗?能退!退费有法可依!误导性宣传欺骗股友!成功退款流程公布!投资...
和.信投研交的服务费能退!服务...  和.信投研确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
四川中富金石可靠吗服务费怎么退... 中富金石不可信,推荐的股票不靠谱,交的服务费是可以退的,虚假宣传推荐垃圾票亏损严重,维权已退款,退款...
中.广云智投炒股推荐是真是假?... 投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒数字...
曝光:杭州顶点财经导性宣传套路... 曝光:杭州顶点财经导性宣传套路,附专业退费指引,黑幕曝光!为骗服务费不择手段!维权已追回!投资有风险...
亚.商投顾服务费可以退!投顾收...  亚.商投顾确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
和讯投资交了29800稳赚吗?... 投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒数字...
曝光:万隆证券29800元怎么... 曝光:万隆证券29800元怎么追回?业务员违规操作!想要退费的朋友抓紧了投资有风险,投资需谨慎!针对...
高能云科技有限公司推荐股票是真...   高能云投顾退款怎么退?答案是:能退的,误导性宣传欺骗股民已退费! 高能云科技有限公司推荐股...
中.广云智投服务费怎么退?可以...  中.广云智投确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业...
椰海订购app白银订购不正.规... 椰海订购app白银订购不正.规赔的钱怎么退回?骗的依法可退!醒醒吧,退费者道出残酷真相追回亏损教程椰...
万.隆证券交的服务费能退!怂恿... 投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒数字...
曝光:北京指南针科技是真的吗投... 曝光:北京指南针科技是真的吗投顾服务费误导真相曝光!被误导交费后亏损皆可退费!投资有风险,投资需谨慎...
四川钱坤云智能科技有限公司退费... 钱坤证券确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
海.能投顾服务费可以退吗?只需...  海.能投顾确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
股.掌柜证券服务费能退吗?可以... 投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒数字...
曝光:海南港澳资讯可靠吗虚假宣... 曝光:海南港澳资讯可靠吗虚假宣传,诱导缴费?荐股不靠谱,夸大宣传诱导交费,已维权退款!投资有风险,投...
和讯投资交的服务费能退!只需一...  和讯投资确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员...
万隆证券3800退费步骤荐股机...   万隆证券收费3888元可靠吗?虚假宣传欺诈消费者荐高位股!误导性宣传坑惨股友!专业人士教你一招退...
ABC亚商投顾不靠谱! 交费冰... ABC亚商投顾不靠谱! 交费冰火两重天,业务员精心设计收费陷阱,服务费能退吗?退款流程公布!已退费!...
博.众投顾服务费可以退!被诱导... 投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒数字...
曝光:股掌柜证券能退服务费吗?... 曝光:股掌柜证券能退服务费吗? 退费流程公布!误导性宣传欺骗股友服务费!被骗交费已退投资有风险,投资...
全城掘金APP白银订购骗我的贵... 全城掘金APP白银订购骗我的贵金属亏损了怎么追回亏损?骗的依法可退!追回亏损不是空谈,真实经历教你避...