腾讯AI实验室和南洋理工大学联手破解AI推理的"记忆困境"
创始人
2026-03-14 11:50:21

这项由腾讯AI实验室和南洋理工大学联合开展的研究发表于2026年2月11日,论文编号为arXiv:2602.08030v2。研究团队发现了当前AI推理模型面临的一个根本性问题,并提出了一个名为FreeLM的创新解决方案。

想象一下你的大脑就像一间书房,当你在解决复杂问题时,会不断地往书桌上放各种参考资料、草稿和笔记。起初这些材料都很有用,帮助你推进思考。但随着时间推移,书桌上积累的纸张越来越多,其中很多已经过时或冗余,最终整个桌面被杂乱的文件覆盖,你反而找不到真正需要的信息了。这就是当前AI推理模型面临的核心困境。

研究团队深入观察了现有的AI推理模型,特别是那些通过增加"思考时间"来解决复杂问题的模型。他们发现了一个令人惊讶的现象:这些模型就像只会往书桌上添加文件、却从不清理的学者一样,它们只有"申请新内存"的能力,却缺乏"释放无用内存"的机制。用计算机术语来说,这些模型只会执行malloc(内存分配)操作,却缺少相应的free(内存释放)功能。

这种"malloc-only"的工作模式导致了一个严重问题:当AI模型试图解决复杂问题时,虽然一开始会产生有用的推理步骤,但随着推理过程的延长,模型会产生越来越多的冗余信息、重复计算和错误尝试。这些"垃圾信息"不断堆积,最终会压垮模型的推理能力,导致性能急剧下降甚至完全失效。

研究团队通过大量实验验证了这一现象。他们使用Qwen3-8B模型在数学竞赛题目上进行测试,发现当模型的推理过程超过16000个词汇单位时,出现错误和重复循环的比例急剧上升。更令人震惊的是,在480个测试案例中,有31个达到了模型的最大处理长度限制,其中84%都陷入了重复循环的陷阱。当推理长度达到48000词汇单位时,模型的失效率达到了100%,完全无法正常工作。

这个发现揭示了当前AI推理的一个根本性悖论:我们原本期望通过让AI"思考"更长时间来获得更好的答案,但实际上过度的思考往往会带来更多的噪音,反而降低了解决问题的能力。就像一个人如果在解决问题时想得太多太杂,反而可能把自己绕糊涂一样。

面对这个挑战,研究团队提出了一个革命性的解决方案:FreeLM。这个方案的核心思想非常直观——既然问题出在模型只会积累信息而不会清理,那就教会它如何主动"遗忘"那些无用的信息。

FreeLM的工作原理就像给AI配备了一位专业的图书管理员。这位管理员会定期检查书桌上的所有文件,识别出哪些是过时的草稿、哪些是重复的计算、哪些是已经解决的子问题,然后果断地将这些无用信息清理掉,只保留对后续推理真正有价值的内容。

具体来说,FreeLM通过一个称为"Free-Module"的附加组件来实现这一功能。这个组件就像一个可拆卸的智能清理器,可以随时安装到现有的AI模型上。当清理器激活时,模型会暂停正常的推理过程,转入"清理模式",扫描整个推理历史,识别出冗余部分,并生成精确的删除指令。

这个删除过程非常巧妙。不同于简单的全文搜索替换,Free-Module会生成结构化的清理指令,指定要删除内容的开始和结束标记。比如,它可能会识别出一段从"让我重新计算这个方程"开始到"实际上这个方法行不通"结束的无效推理,然后精确地将这整段内容移除。这种方法既高效又准确,能够以最小的计算成本清除大段的冗余内容。

清理完成后,Free-Module会自动卸载,模型重新进入正常推理模式,在清洁过的环境中继续思考。这个过程会周期性地重复,确保推理环境始终保持整洁高效。

研究团队面临的一个关键挑战是如何训练这个清理系统。毕竟,判断哪些信息是"有用"的、哪些是"冗余"的,这本身就是一个复杂的认知任务。他们不能简单地告诉系统"删除所有看起来无用的内容",因为这种判断需要深度的语义理解。

他们采用了一种聪明的训练策略。首先,研究团队收集了大量真实的推理过程案例,然后使用先进的AI助手(如Gemini-2.5-Pro)来初步标注哪些部分可能是冗余的。但这还不够,因为即使是最先进的AI也可能出错,误删重要信息。

为了确保训练质量,研究团队设计了一套严格的验证机制。对于每一个候选的删除操作,他们都会进行多轮测试:保留删除建议的推理过程继续运行,看看最终能否得到正确答案。只有那些删除后不影响甚至能改善最终结果的操作才会被纳入训练数据。这个过程就像反复测试一个清理方案,确保清理掉的确实是垃圾,而不是有用的资料。

通过这种严格的筛选,研究团队从最初的8000个候选训练样本中筛选出了6648个高质量的训练实例。每个实例都经过了严格验证,确保删除操作的安全性和有效性。

研究团队在多个规模的AI模型上测试了FreeLM的效果,从80亿参数的小型模型到6850亿参数的超大型模型。测试结果令人鼓舞:FreeLM在所有测试的基准数据集上都取得了一致的性能提升。

在数学竞赛题目的测试中,FreeLM相比基础模型平均提升了3.3%的准确率。更重要的是,它在保持甚至提高准确率的同时,大幅减少了推理过程的长度。例如,在Qwen3-8B模型上,FreeLM将平均推理长度从17500词缩短到13800词,压缩了21.1%,但准确率却从44.24%提升到了48.14%。

这种"用更少的话说更准确的话"的能力正是FreeLM的核心价值。它证明了在AI推理中,质量比数量更重要,精炼比冗长更有效。

最令人印象深刻的是FreeLM在长期推理任务上的表现。研究团队测试了一些需要超过80000词推理的复杂问题,标准的Qwen3-235B模型在这些问题上完全失效,准确率降到了0%。但FreeLM却能够维持约50%的准确率,成功挽救了模型在长期推理中的崩溃。

这个对比就像两个人解同一道复杂的数学题:一个人不断地在纸上写满各种尝试和草稿,最后被自己的笔记搞得头晕脑胀,完全找不到思路;而另一个人会定期整理笔记,清除无用信息,始终保持思路清晰,最终成功找到答案。

研究团队还发现了FreeLM的一个意外优势:跨模型通用性。他们训练的清理组件不仅能在原始的Qwen模型家族上工作,甚至能够成功应用到完全不同架构的DeepSeek-V3.2模型上。在DeepSeek模型上,Free-Module同样实现了2.3%的准确率提升和45.99%的推理长度压缩。

这种跨架构的通用性暗示着Free-Module学到的可能是某种通用的推理清理能力,而不是针对特定模型的专门技巧。这为未来的应用开启了一个有趣的可能性:也许可以开发一个"通用推理清理服务",任何AI模型都可以调用这个服务来清理自己的推理过程。

为了深入理解FreeLM的工作机制,研究团队进行了详细的案例分析。他们发现,FreeLM能够精准识别出各种类型的冗余信息:重复的计算步骤、已经被证明错误的尝试、过度详细的中间解释,以及偏离主题的思考分支。

在一个几何证明题的案例中,FreeLM识别出模型在某个步骤后开始了一段关于"也许可以用坐标系方法"的思考,但随后又回到了原来的几何方法。FreeLM精准地删除了这段无关的坐标系探索,让推理过程保持聚焦。而相比之下,其他清理方法要么删除过头,把有用信息也清掉了,要么删除不够,留下了太多噪音。

研究团队还测试了FreeLM在不需要长期推理的常规任务上的表现,担心清理机制可能会对正常任务造成负面影响。结果显示,FreeLM在这些任务上基本维持了原有性能,甚至略有提升。这表明清理机制足够智能,知道何时该介入、何时该保持沉默。

从工程实现的角度,FreeLM展现出了良好的实用性。虽然增加了约56%的延迟成本,主要来自清理过程和重新处理修改后内容的开销,但它同时减少了45%的内存使用。在实际的AI服务部署中,内存往往是更紧张的资源,因此这种权衡通常是值得的。研究团队还指出,通过进一步的工程优化,延迟开销有望降低到约20%。

FreeLM的研究意义远不止于技术层面的改进。它挑战了AI发展中的一个基本假设:更多的计算时间总是带来更好的结果。研究表明,在AI推理中,就像在人类思考中一样,学会遗忘与学会思考同样重要。

这个发现可能会重新塑造我们对AI能力增长的理解。传统观点认为,AI的智能水平主要取决于模型规模和计算资源。但FreeLM的成功表明,智能的关键可能在于有效的信息管理,而不仅仅是信息处理能力。

从更广阔的视角来看,FreeLM触及了认知科学中的一个核心问题:遗忘在智能中的作用。人类大脑会自然地遗忘无关信息,专注于重要内容,这种能力对我们的认知效率至关重要。FreeLM可以看作是让AI获得类似能力的一次重要尝试。

研究团队的工作也为AI推理的未来发展指明了方向。他们提出,未来的AI系统应该从"malloc-only"的模式转向"malloc + free"的模式,既要有获取和处理信息的能力,也要有选择性遗忘和清理的能力。这种平衡可能是构建真正智能的推理系统的关键。

说到底,FreeLM告诉我们一个简单而深刻的道理:在追求AI智能的道路上,学会遗忘和学会思考一样重要。正如人类需要睡眠来整理和清除大脑中的无用信息一样,AI系统也需要主动的"清理"机制来维持推理的清晰和高效。这项研究不仅提供了一个实用的技术解决方案,更重要的是,它为我们重新思考智能的本质提供了新的视角。未来的AI发展可能不再是单纯的规模扩张,而是学会如何在复杂性和简洁性之间找到完美的平衡。对于普通人来说,这意味着未来的AI助手将变得更加高效和可靠,能够在处理复杂问题时保持思路清晰,避免被自己的"思考"过程拖累。这项研究的完整论文可以通过编号arXiv:2602.08030v2进行查询。

Q&A

Q1:FreeLM具体是如何工作的?

A:FreeLM就像给AI配备了一位专业清理员。它通过一个叫Free-Module的附加组件,定期扫描AI的推理过程,识别出重复计算、错误尝试等冗余信息,然后精确删除这些内容。整个过程分为两个模式:推理模式下正常思考,清理模式下识别和删除无用信息,然后继续推理。

Q2:为什么说现有的AI推理模型是"malloc-only"的?

A:现有AI模型就像只会往书桌上添加文件却从不整理的人。它们在解决问题时会不断产生各种推理步骤、尝试和中间结果,但缺乏清理无用信息的机制。就像计算机只会申请新内存(malloc)但不会释放无用内存(free)一样,这导致有用信息被大量垃圾信息掩埋。

Q3:FreeLM的效果有多好?

A:FreeLM在所有测试中都取得了显著提升,平均准确率提高3.3%,同时大幅减少了推理长度。最重要的是,在需要超长推理的复杂问题上,标准模型完全失效(0%准确率),但FreeLM能维持约50%的准确率。它证明了"用更少的话说更准确的话"的价值。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

和讯投顾误导交费有内幕,欺骗股... 和讯投顾误导交费有内幕,欺骗股民缴费炒股导致亏损,现可依法退费! 和讯信息科技有限公司服务费是可以退...
在上海汇正财经交了服务费能退吗... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
巨丰投顾会员费多少钱?股民真实... 巨丰投顾会员费多少钱?股民真实经历提醒,别被话术忽悠,费用可退款!  在巨丰投顾交了服务费可以退!教...
汇正16800跟投是真的赚钱吗...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
被骗!汇正财经是正规公司吗被坑... 被骗!汇正财经是正规公司吗被坑害后如何追回损失?退费指南来了,退费流程公布及注意事项讲述!投资有风险...
高能云智投可以退费吗?高额投顾... 高能云智投可以退费吗?高额投顾费叠加炒股亏损,骗局曝光,均可合规退款!投资有风险,投资需谨慎!针对网...
股多多软件靠谱吗?炒股亏损人为... 股多多软件靠谱吗?炒股亏损人为操控,介入维权,大批股民退款成功!  在天相财富交了服务费可以退!教你...
汇正财经29800元靠谱吗?收... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
国诚投顾服务费怎么追回?交费荐... 追损法援寄语:望所有投资者谨慎投资,远离不正规平台,远离所谓的分析师带单,已经不幸陷入的受.害者应在...
和众汇富交的19999元靠谱吗... 和众汇富交的19999元靠谱吗?保本高收益全是话术,股民真实被骗经历全网曝光!  在北京和众汇富交的...
被骗!和汇众富科技是正规的吗老... 被骗!和汇众富科技是正规的吗老年股民维权无门,专业协助快速实现退款成功投资有风险,投资需谨慎!针对网...
汇正580是不是?收服务费承诺...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
亚商投资股票靠谱吗?荐股服务纯... 亚商投资股票靠谱吗?荐股服务纯收割套路,业务员洗脑交费全程曝光!投资有风险,投资需谨慎!针对网上素未...
上海汇正财经牛人掌股靠谱吗?股... 汇正财经确实是一家正规的财经公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务员完...
凯石证券服务费怎么退?白交服务... 凯石证券服务费怎么退?白交服务费还亏钱,股民已找到快速退费渠道!1
爱赢投顾不给退费怎么办?投顾荐... 爱赢投顾不给退费怎么办?投顾荐股骗局揭秘,买入就跌,想退款直接对接!投资有风险,投资需谨慎!针对网上...
上海九方智投真的能赚钱吗?误导... 九方智投涉及虚假宣传,诱导消费导致亏损惨重!九方智投虚假宣传,欺诈消费者亏的血本无归!九方智投收取高...
在杭州高能怎么退还服务费?理性... 在杭州高能怎么退还服务费?理性防范投顾骗局,交26800费用亏损,快速退款!  在杭州高能交了服务费...
上海海能投顾交的服务费可以退吗... 上海海能投顾交的服务费可以退吗?误导性宣传!缴费亏损推脱市场部好!交费荐股套路防不胜防!退费流程我来...
震撼!和汇众富科技服务费怎么追... 震撼!和汇众富科技服务费怎么追回?承诺收益不兑现反被套,老股民教你维权退费!投资有风险,投资需谨慎!...
上海海能投资可靠吗?收服务费承...   海能证券投资顾问怎么样?虚假宣传欺诈消费者荐高位股!股民交费炒股真的很后悔!服务费可以退!
汇阳投资退费?服务费成功追回实... 汇阳投资退费?服务费成功追回实录,股民避坑干货全分享!  在成都汇阳投顾交了服务费可以退!教你怎么退...
利多星服务费能退吗?退款流程详... (欢迎来电或添加:185 0274 8116)咨询了解如何收集证据并追回被骗资金!利多星智投的智慧星...
股掌柜投顾退费?投顾会员暗藏陷... 股掌柜投顾退费?投顾会员暗藏陷阱,吃亏股民全部成功止损!投资有风险,投资需谨慎!针对网上素未谋面的网...
金证智股帮可信吗?理性防范投顾... 金证智股帮可信吗?理性防范投顾骗局,交26800费用亏损,快速退款!  在湖南金证交了服务费可以退!...