全球首个AI智能体「自进化」开源框架来了!一次部署,终生可用
创始人
2025-05-30 14:10:28

新智元报道

编辑:LRST 好困

【新智元导读】多AI智能体系统的复杂构建与优化,长期以来是用智能体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架EvoAgentX,通过引入自我进化机制,打破了传统多智能体系统在构建和优化中的限制!

在大语言模型技术迅猛发展的今天,各类AI智能体已广泛应用于科研和工业场景。然而,在实际应用中,构建一个高效、稳定的多智能体系统仍面临诸多挑战:从智能体选型、提示词调试到工作流设计,流程复杂,成本高昂。

更重要的是,当前多智能体系统通常「部署即固化」,缺乏自我演化机制。

每当目标调整,开发者往往需要手动修改提示词、重构系统结构,陷入「搭建—调试—重构」的低效循环,严重制约了智能体系统的规模化落地。

项目地址:https://github.com/EvoAgentX/EvoAgentX

文档链接: https://evoagentx.github.io/EvoAgentX

EvoAgentX针对目前多智能体系统应用搭建和优化过程中存在的痛点,推出全球首个AI智能体自进化开源框架!

支持一键搭建工作流,用户只需提供任务目标或场景描述,系统即可自动完成智能体配置和工作流搭建。

同时,EvoAgentX引入了「自进化」机制,使得多智能体系统可在实际运行中根据环境与目标的变化,持续优化系统结构与整体性能。

该开源平台旨在为研究者与工程人员提供统一实验和部署土壤,促进多智能体系统从静态设计迈向动态演化,推动AI多智能体系统从「人工调试」迈向「自主进化」的新范式。

框架介绍

EvoAgentX是一个开源的、以自我进化为导向的AI智能体研究框架,专为探索具备自我优化能力的多智能体系统而设计,旨在构建一个开放、可进化的智能体生态。

项目亮点

EvoAgentX旨在打破当前多智能体系统在构建与优化上的壁垒,从三大维度切入关键问题:自动化构建+自进化机制+系统性评估。

通过整合建模、执行与反馈链路,EvoAgentX不仅让智能体系统的搭建更轻,更快,也为其演化能力奠定了基础。无论是科研探索还是原型开发,它都能作为核心工具链,帮助用户高效验证策略设计与协同机制,加速多智能体能力从「可用」走向「可靠」。

一句话智能体自动构建:告别繁琐手工设计

痛点:构建一个高效的多智能体工作流通常需要专业知识、复杂配置和大量的人工干预,搭建过程耗时耗力。

EvoAgentX方案:提供任务驱动的一键式工作流生成能力,自动完成任务拆解、智能体配置与交互建模,显著降低系统搭建门槛,加快实验验证与原型开发。

协作智能体持续自我进化:让系统「越用越强」

痛点:传统的多智能体系统一旦搭建完成,难以持续优化,无法灵活适应新任务或者变化的运行环境,严重依赖人工调整

EvoAgentX方案:集成面向智能体提示词、工作流结构和记忆机制的多维度进化算法,实现AI智能体的持续自我优化,提升长期适应性和协同效率。

环境自动评估及反馈:灵活对接任务场景提供量化反馈

痛点:缺乏统一的评估机制,导致系统表现难以量化,优化方向不明确,实验结果也难以复现和对比。

EvoAgentX方案:内置标准任务环境和评估指标,支持对多智能体系统的表现进行量化分析,同时支持MCP对接场景工具实现垂类环境交互及快速反馈,为系统性优化和科研实验提供一致、可复现的测试基准。

自动化构建工作流展示

研究人员通过两个具代表性的应用场景,系统性展示了EvoAgentX在多智能体工作流自动化构建方面的能力与适用性:

以下视频来源于

ClayX AI

场景1:根据候选人的PDF简历内容,从互联网上检索并推荐匹配的职位信息

场景2:A股股票的可视化分析

自进化性能验证

为了验证不同任务场景下的自我进化能力,EvoAgentX选取了三个具有代表性的AI任务数据集,涵盖多跳问答(HotPotQA),代码生成(MBPP)和数学推理(MATH)。

在这些任务中,EvoAgentX以一个预设的初始智能体系统为基础,结合其自进化机制,从提示词生成策略与工作流结构配置两个维度出发,持续对系统性能进行迭代优化。

优化过程中,智能体能够基于大语言模型(LLM)的反馈以及任务执行结果,动态调整提示词内容与工作流拓扑结构,从而实现闭环自我改进。

优化前后系统在各项任务中的性能表现如下图所示,清晰展示了自进化机制在提升智能体系统整体效能方面的实际效果。

实验结果显示,EvoAgentX 在多跳问答(HotPotQA)、代码生成(MBPP)和数学推理(MATH)三类具有代表性的任务中均实现了稳定且显著的性能提升,平均提升幅度高达 8%~13%

这一成果不仅验证了其进化机制在跨任务场景中的广泛适应性,也进一步印证了 EvoAgentX 在构建可持续优化的多智能体系统方面的实际效能,展现出强大的泛化能力与工程应用价值。

值得一提的是,当前的优化尚未充分利用框架的全部潜力,随着未来策略优化、模块扩展和生态协同能力的不断增强,EvoAgentX仍具备广阔的性能提升与应用扩展空间。

实际应用

为了进一步验证 EvoAgentX 在优化现有AI智能体工作流方面的能力,该框架也优化GAIA基准测试上现有的多智能体系统,包括了GAIA排行榜中开源且可复现的代表性多智能体框架:Open Deep Research

该框架由Huggingface团队开发的可实时进行网络搜索回答问题的多智能体系统。基于这些智能体的原始结构,EvoAgentX对其提示词进行自动优化。

优化后的在GAIA基准测试验证集上的性能如下图所示:

优化后的实验结果显示,EvoAgentX能够在不同基础系统上均带来稳定且显著的性能提升,进一步验证了该框架在提升现有智能体通用能力与任务适应性方面的实际效用。

完整报告与实验细节:https://github.com/eax6/smolagents

框架架构

为了支持AI智能体的持续优化与自我演化,EvoAgentX构建了一个由多个功能层组成的模块化架构,涵盖了从AI智能体的底层组件到进化机制的完整链路。系统的整体架构如下:

EvoAgentX的架构一共包括:

基础组件层:提供框架运行的通用能力支持,如基础模块、日志管理等,确保系统具备良好的适用性和可扩展性。

智能体层:包含构建AI智能体的核心模块,包括大语言模型、记忆模块、动作执行组件等,用于定义AI智能体的核心功能与外部交互能力。

工作流层:构建和管理一个面向复杂任务的多智能体系统,包括工作流图、智能体管理等组件,适用于多阶段、多任务、多角色的智能体任务。

进化层:聚焦AI智能体系统的优化功能,提供针对智能体提示词、工作流结构及记忆机制的多维度优化器,助力AI智能体的持续进化。

评估层:提供灵活的性能评估机制,支持对AI智能体系统的有效性和泛化能力进行可定量的评估。

期望和愿景

EvoAgentX团队认为,AI不应依赖繁复的人工干预,而应该成为能够自主感知需求、动态规划目标、持续迭代策略的智能伙伴。

该团队致力于构建一个真正具备自主进化的AI智能体生态系统。

在这一生态中,每个智能体都具备根据任务自动搭建和优化工作流与策略的能力,并通过开放协议实现经验与知识的全局共享。

通过开源社区的协同进化机制,EvoAgentX将重新定义AI系统的开发范式:开发者无需从零构建复杂的工作流,只需要给出目标,系统就能自主生成执行并持续优化方案;科研用户不再受限于静态的AI模型,便可实时获取生态中最新进化的智能体能力。

这种「需求即指令、使用即进化」的模式,使得每个参与者的实践反馈都将加速智能体的智慧成长,突破当前AI系统的能力边界,让智能体能够自主拆解复杂问题、动态重组技能模块,并持续反馈学习。

这是通向可持续智能未来的必经之路:一个越用越聪明、越共享越强大的自进化AI智能体,终将成为赋能各行业创新的进化引擎。

未来里程碑

为了实现以上愿景,EvoAgentX将循序推进以下关键里程碑:

阶段一: 工作流自动构建与模块化组件集成

  • 搭建和持续优化一键生成多智能体工作流功能;

  • 集成典型任务模板与AI智能体模块;

  • 提供可视化的工作流图结构展示与编辑接口;

  • 持续扩展开源的组件库以支持快速重用和复合任务构建。

阶段二:多维度自进化能力与反馈学习机制

  • 集成提示词、工作流结构和记忆模块等维度的AI智能体自进化算法

  • 引入性能反馈驱动的策略优化机制

  • 支持系统在多次任务执行中进行自适应优化

  • 提供任务间迁移能力与演化路径记录机制

阶段三:开放智能体生态与协同进化机制

  • 构建面向开发者与研究者的智能体与工作流「市场」,支持上传、共享与复用高质量智能体模块与优化工作流

  • 支持用户将本地优化成果(如改进的提示词、结构配置、策略方案)上传至生态,实现系统级协同进化

  • 建立跨任务、跨用户的进化轨迹追踪与知识融合机制,让每一次实践反馈都能反哺整个生态系统

  • 设计开放协议与标准接口,推动形成智能体能力共享、经验迁移的生态循环

参考资料:

https://github.com/EvoAgentX/EvoAgentX

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

华-通-交易交易平台是正规吗?... 华-通-交易交易平台是正规吗?在华-通-交易交易平台合法吗?答案能退!已协助数万人追回,咨询不收费!...
可怕!北京和众汇富科技怎么样荐... 可怕!北京和众汇富科技怎么样荐股不赚反亏欺骗股友!可以能退!怎么退款流程及注意事项公布!误导性宣传欺...
必看』北京和众汇富科技交费后与... 必看』北京和众汇富科技交费后与宣传差距大,详细处理步骤分享投资有风险,投资需谨慎!针对网上素未谋面的...
当心!海能投顾怎么样?吹嘘收益... 当心!海能投顾怎么样?吹嘘收益诱骗交费,已维权退费!投资有风险,投资需谨慎!针对网上素未谋面的网友、...
金鳞订购APP交易平台是正规吗...   金鳞订购APP交易平台是正规吗?在金鳞订购APP亏损了怎么追回来?可以退!教你一招快速追回!  ...
金.证投顾股民买了炒股会员服务... 金.证投顾股民买了炒股会员服务,交费荐股被能退款!29800元已退费! 证券投资咨询行业的本质在于为...
当心!北京和众汇富科技误导性宣... 当心!北京和众汇富科技误导性宣传、承诺收益、无证投顾提供服务,交费股民赶紧申请退费!投资有风险,投资...
掌-上-银牛APP交易平台合法...   掌-上-银牛APP交易平台合法吗?在掌-上-银牛APP输的钱可以要回来吗安全吗?可以全额!全额被...
智易购APP交易平台正规吗?在...  智易购APP交易平台正规吗?在智易购APP亏损可以要白银吗安全吗?可以全额!教你1招追回损失,咨询...
惊异』神光投顾正规合法吗?忽悠... 惊异』神光投顾正规合法吗?忽悠投资者购买服务后一直推荐烂股!服务费已追回!投资有风险,投资需谨慎!针...
微银订购APP交易软件合法吗?... 微银订购APP交易软件合法吗?在微银订购APP亏损能退款吗?当然可以依法退款!退款流程详解!投资者投...
被骗!海能投资退款怎么退?虚假... 被骗!海能投资退款怎么退?虚假宣传欺骗股民,交会员费真相揭秘,有内部票都是的投资有风险,投资需谨慎!...
上海海能投顾打广告荐牛股的,从... 上海海能投顾打广告荐牛股的,从被骗到成功退款,我经历了这些步骤! 在监管的灰色边缘,众多投资顾问依然...
富禄订购app交易平台合法吗?... 富禄订购app交易平台合法吗?在富禄订购app亏损了怎么退?可以退!教您如何止损/快速追金!我们是资...
举报!海能投顾荐股票真相曝光,... 举报!海能投顾荐股票真相曝光,29800换来的都是垃圾股,被骗亏损真相曝光已退费投资有风险,投资需谨...
掌-上-生财APP交易平台是正...   掌-上-生财APP交易平台是正规吗?在掌-上-生财APP亏损了怎么追回来?可以全额!全额被骗追回...
当心!云南约牛证券靠谱吗?事实... 当心!云南约牛证券靠谱吗?事实清楚依法追回服务费!所有股民引以为戒。投资有风险,投资需谨慎!针对网上...
上海汇正财经业务员夸大荐股收益... 上海汇正财经业务员夸大荐股收益,投顾服务费误导真相曝光!被误导交费后亏损皆可退费! 可以退!很多投资...
雪花订购APP交易平台正规吗?... 雪花订购APP交易平台正规吗?在雪花订购APP亏损了怎么退?可以退!教你一招快速追回! 期货和现货的...
必看』云南约牛软件夸大不实宣传... 必看』云南约牛软件夸大不实宣传诱导消费者,交费炒股被骗经历讲述!服务费能退投资有风险,投资需谨慎!针...
拇指订购APP交易软件是正规吗... 拇指订购APP交易软件是正规吗?在拇指订购APP输的钱可以要回来吗安全吗?当然可以依法退款!退款流程...
哈易购APP交易平台是合法吗?...  哈易购APP交易平台是合法吗?在哈易购APP交易平台合法吗?答案能退!教你一个简单方法找回!投资有...
被骗!山东神光服务费被骗怎么办... 被骗!山东神光服务费被骗怎么办?简单方法,帮你追回!投资有风险,投资需谨慎!针对网上素未谋面的网友、...
震惊』云南约牛证券行业黑幕曝光... 震惊』云南约牛证券行业黑幕曝光,误导股民交费,费用可依法追回!投资有风险,投资需谨慎!针对网上素未谋...
萝卜订购APP交易平台合法吗?... 萝卜订购APP交易平台合法吗?在萝卜订购APP交易平台合法吗?当然可以依法退款!全额被骗追回损失!现...