九章云极DataCanvas加速AI应用 助力新一代AI技术框架发布
创始人
2025-03-19 14:13:06
0

强化学习(RL)领域再迎技术革新。继上周发布大模型慢思考推理技术获系列成果之后,九章云极DataCanvas联合研究团队再次发布新一代AI强化学习框架R1-Searcher及全链路工程代码。

近日,中国人民大学STILL项目团队、九章云极DataCanvas研究人员联合发布新技术论文称,提出了一种全新的强化学习方法R1-Searcher。据官方论文介绍,这是一种用于AI大型语言模型(LLMs)可自主调用外部搜索系统且可通过模型自我学习进行训练的强化学习(RL)方法,通过两阶段奖励机制(何时检索 + 如何利用)解决了现有模型处理知识密集型问题时的不足,在多跳问答、实时信息处理等场景展现出颠覆性潜力。

据公开资料显示,九章云极创始人方磊以联合研究者身份参与论文。该框架开源代码在GitHub上一经发布,引发AI界高度关注。

九章云极DataCanvas联合研究团队公布了该框架全参数开源方案,完整开放了从模型训练到推理部署的全链路工程代码,同步公开实践验证过的技术实例,为开发者提供可直接部署的工业化级大模型训练框架。论文实验结果显示,相比于最好的基线ReARTeR,R1-Searcher在2WikiMultiHopQA上提升了21.7%,在Bamboogle上准确率提升4.0个百分点(LLM-as-Judge评测集)。

该框架开源代码在GitHub上一经发布,引发了“模型框架与工程化部署”的深度探讨。讨论热点围绕论文公开的规模化部署方法——九章云极DataCanvas AIaya NeW智算操作系统支持的一键构建‌“检索-推理-反馈”闭环系统,通过将动态检索能力深度植入大型语言模型(LLMs)的推理本能;并通过全链路优化实现动态知识更新与实时性能调优,从根本上解决了域外/域内数据难度分布和数据多样性对训练的影响,在提高推理速度的同时、降低预训练成本,而不会牺牲性能方面起到关键贡献,使该R1-Searcher模型能够直接处理代码仓库或多轮对话(如客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。

九章云极DataCanvas研究团队这一“对症下药”式创新性设计,不仅解决了大模型知识时效性问题,更通过强化学习实现了检索策略的自主优化,在经济层面实现低成本高性能。有AI技术专家认为,该算法为垂直领域大模型开发提供了新范式,未来或催生更多实时智能应用。对于AI应用企业而言,这不仅意味着更准确的搜索结果,更代表着一种企业自主可运营的AI基础设施——像“水电煤”一样实时适配业务变化。

公开资料显示,RL(即Reinforcement Learning,强化学习)是一种通过智能体与环境的交互来学习最优策略的机器学习方法。RAG(即Retrieval Augmented Generation,检索增强生成)是将大量外部数据与基础模型相结合,进而增强了大语言模型(LLMs)的能力。

来源:中国日报中文网

(来源:财商资讯)

相关内容

热门资讯

什么是合资车 什么是合资车 什... 合资汽车是指国内汽车公司和外国汽车公司合作组建的汽车公司生产的轿车。在合作中,国内汽车公司出让土地使...
科目二85分合格吗 科目二85... 85分是否合格要看所考取的驾照类型。如果报考的是大型客车、牵引车、城市公交车、中型客车、大型货车准驾...
新车车门排水孔是默认打开吗 新... 新车的车门排水孔并不是默认打开的,需要车主自行打开。一般情况下,新车的排水孔都会用胶带或其他物品进行...
异地怎么注销驾校档案 异地怎么... 想要注销异地驾校档案?不用担心,本文为您解答!注销异地驾校档案有以下两种方式:本人或委托原驾校的代理...
自动驻车故障还能开吗 自动驻车... 自动驻车故障还能开。在不妨碍行车安全时,可正常行驶,但应尽快修复。自动驻车故障的原因及解决方法: ...
开空调很费油吗 开空调很费油吗... 开空调制冷时,车辆时速低于60公里/小时,若天气不是非常闷热,可以选择开窗通风。当车速超过80公里/...
红绿灯掉头要不要看红绿灯 红绿... 在汽车驾驶时,掉头时需要特别注意红绿灯。一般来说,只有在红灯时才可以掉头,否则会面临违规行为。但是,...
me5是什么车 me5是什么车... me5是什么车me5是天际汽车旗下的一款紧凑型车。以天际ME5的2021款1012为例,它的车身尺寸...
车胎压报警怎么办 车胎压报警怎... 当车胎压报警时,我们可以采取以下解决办法: 1. 如果是轮胎被扎,可以进行补胎或更换。如果扎钉孔径小...
车牌被撞凹陷了扣分吗 车牌被撞... 如果汽车的车牌被撞凹陷进去了,但车牌号码仍然清晰明了,那么车主可以选择继续使用,不会扣分。但需要注意...