AI智能体也有「蜘蛛感应」,防御延时骤降至8.3%
创始人
2026-02-14 16:48:34

新智元报道

编辑:LRST

【新智元导读】不再依赖像「安检站」一样每步必停的外部插件,首创「内源感知+分层筛选」机制,将Agent防御延时从200%+降至8.3%,安全与效率均达到SOTA级表现!

传统的Agent防御机制通常采用强制进行安全检查的方式,即在 Agent 执行的特定阶段,包括Query、Plan、Action、Observation等阶段,都强制插入外部安全检测。这种做法虽然有效,但会切断了Agent的思维流,导致严重的延时积累,成本高昂且反应迟钝。

来自上海财经大学、新加坡国立大学、卡耐基梅隆大学等高校和学术组织的研究者们联合重磅推出Spider-Sense智能体防御框架,通过两大核心技术打破了这一僵局:利用Intrinsic Risk Sensing将风险意识植入Agent认知流,实现全链路的内源性感知;配合Hierarchical Adaptive Screening机制,动态平衡向量检索与深度推理,实现威胁的自适应筛选。

论文链接:https://arxiv.org/abs/2602.05386

开源链接:https://github.com/aifinlab/Spider-Sense

基准链接:https://huggingface.co/datasets/aifinlab/S2Bench

该框架让Agent告别了被动防御,在 Mind2Web和EICU这些主流数据集上在大部分评估标准下均取得最优,在构建出的攻击数据集上实现了SOTA级的安全与效率双优表现。

Spider-Sense提出了一种变革性的思路:防御应该是内源的、选择性的,而非外挂的、强制的。

该框架赋予Agent一种维持内源性感知风险的能力。Agent 在执行任务的过程中,会自主进行内源性风险感知。

只有当Agent 「感觉」到工具输出可疑或者指令中有陷阱等异常的时侯,才会像蜘蛛侠感知到危险一样,动态触发防御机制。随后,系统通过分层自适应筛选,在效率和精度之间找到最佳平衡点。

关于Spider Sense的解释:蜘蛛侠平时总是保持放松且高效的行进状态,只有在突发危险引发「激灵」预警的瞬间,才会下意识地触发闪避或拦截动作。

核心优势与技术突破

内源性风险感知

IRS(Intrinsic Risk Sensing)赋予Agent 「原生直觉」,从「外挂监控」到「原生直觉」的进化,传统防御强制进行安全检查,笨重且迟钝。而 Spider-Sense 的灵魂——IRS,则是将安全意识通过指令微调植入 Agent 的推理逻辑中。

  • 全链路无死角感知: IRS 并不只盯着用户的输入,而是渗透在 Agent 执行任务的四个关键生命周期中:

    • Query 阶段:审视用户指令是否存在陷阱。

    • Plan 阶段:监控记忆检索和规划生成,防止记忆中毒或恶意规划。

    • Action 阶段:审计工具参数是否存在风险。

    • Observation 阶段:检查工具的返回结果,如网页内容、API 返回值等。

  • 按需触发: Agent 只有在感知到异常时,才会自主生成特定的感知信号,如会在 Action 阶段触发。 这说明在 99% 的安全交互中,防御机制是「隐形」的,零延时损耗;只有在真正的危机时刻,它才会像蜘蛛侠的感应一样瞬间激活。

分层自适应筛选

当IRS感知到风险后,HAS(Hierarchical Adaptive Screening)就发挥作用了。

  • 粗粒度检测(Coarse-grained)

    • 机制:系统维护了四个阶段的攻击向量数据库(Attack Vector Databases)。HAS将可疑内容向量化,与已知攻击模式进行余弦相似度匹配。

  • 细粒度分析(Fine-grained)

    • 机制:只有当相似度低于阈值,但又不完全安全时,系统会检索 Top-K 相关案例,并调用 LLM 进行深度对比分析。

全生命周期防护

不同于以往仅关注文本输入输出的防御,Spider-Sense 覆盖了 Agent 交互的 全链路——从用户输入(Query)、内部记忆规划(Plan)、工具参数审计(Action)到观察工具调用后(Observation),无死角防御。

实验结果

兼并速度与安全

为了验证效果,研究团队构建了一个包含多场景、真实工具调用、多阶段攻击以及高质量假阳性样本的高质量基准测试集

高质量假阳性样本指那些在结构与操作模式上酷似恶意攻击、但本质意图完全无害的「高难度」测试用例,专门用于考验防御系统是否会因过度敏感而误伤合法的用户操作

在实验中,Spider-Sense展现了令人印象深刻的性能优势,特别是在处理复杂的多步Agent交互时:

  1. 极低的延迟损耗:相比于基线方法以及 Guardagent 和 AGrail 动辄 197% 到 381% 的额外时间开销,Spider-Sense 仅多了8.3%的延时。

  2. 主流数据集的表现:框架在Mind2Web和EICU这些主流数据集上展现了卓越的综合性能。除少数指标外,该方法在大部分评估标准下均取得最优。

  3. SOTA 级防御表现:在全新构建的基准测试中,Spider-Sense取得了最低的攻击成功率(ASR)

  4. 极低的误报率:实现了最低的误报率(FPR),证明了它不仅防得住,而且不会因为过度防御而打断用户的正常操作。

    案例研究

    一次真实的攻击拦截

    看一个具体的工具返回注入攻击(Tool Return Injection)案例:

    1. 场景:一个临床分析 Agent 调用工具获取患者记录。

    2. 攻击:工具返回的内容被篡改,包含隐藏的恶意代码(import fake_module),试图诱导 Agent 执行。

    3. 感知:Agent 在 Observation(工具调用后阶段) 敏锐地感知到了工具返回值的异常,触发 信号。

    4. 筛选首先进行数据库检索,发现与已知攻击模式相似,随即调用深度对比分析,判定该代码与上下文无关且具有危害性。

    5. 结果:Agent自主决定终止执行,攻击失败。

    整个过程Agent自主完成,既没有因噎废食,也没有漏过任何蛛丝马迹。

    结论与展望

    内源驱动,降本增效,Spider-Sense将安全防御从「外挂监控」转变为「原生直觉」。依靠IRS和HAS两大机制,以仅8.3%的延时代价在

    上实现了 SOTA 级防御效果,完美解决了安全与效率的冲突。

    参考资料:

    https://arxiv.org/abs/2602.05386

    秒追ASI

    ⚠️
    本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

    相关内容

    热门资讯

    湖南股掌柜投顾能退款吗?退费流... 湖南股掌柜投顾能退款吗?退费流程有法可依!误导性宣传欺骗股民,被骗交费可以退款! 可以退,告诉大家一...
    海能投顾推荐股票是真的吗?荐股... 海能投顾推荐股票是真的吗?荐股真的稳赚吗?背后黑幕曝光!已有人成功退费! 在监管的灰色边缘,众多投资...
    九方智投旗舰版29800能退吗... 九方智投旗舰版29800能退吗投顾虚假宣传揭秘!不仅没赚反倒严重亏损!这样可以退费! 证券投资咨询行...
    海能投顾交的费用能退吗?答案是... 海能投顾交的费用能退吗?答案是:可以退的!退款流程公布!误导性宣传欺骗股民已退费! 在监管的灰色边缘...
    湖南金.证投顾老师荐股亏损会员... 湖南金.证投顾老师荐股亏损会员费可挽回,兼股不可靠,真相令人胆战心惊! 证券投资咨询行业的本质在于为...
    海能投顾DK智投服务不靠谱!可... 海能投顾DK智投服务不靠谱!可以退费!有法可依!误导性宣传欺诱导股民缴费! 在监管的灰色边缘,众多投...
    爱.赢投顾半年收费29800元... 爱.赢投顾半年收费29800元靠谱吗?投顾收费乱象,揭秘退费成功的秘密!这些标榜为投资顾问的企业,外...
    杭州高能云公司业务员虚假宣传欺... 杭州高能云公司业务员虚假宣传欺骗消费者,投顾服务名不副实!受害者真实退费经历全解析 在跟高能智投有限...
    九方智投服务费退款期是多久?误...   九 方智投服务费退费多久到账?误导性宣传!夸大收益诱导投资者!退费有戏了!这些关键证据你可千万别...
    汇正财经炒股服务费怎么退?误导...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
    海南港澳资讯产业股份有限公司投... 海南港澳资讯产业股份有限公司投顾服务费能退吗?误导性宣传坑惨股友真相曝光,被骗服务费已退 港澳资讯点...
    高能智投29800元靠谱吗?误...   高能智投交了29800稳赚吗?误导性宣传骗取股民服务费!夸大收益诱导投资者!退费有戏了!这些关键...
    博众投资399元给的股票咋样?...   博众投资交29800买大阳智投靠谱吗?与想象中不同!误导性宣传交费!学会这几步,轻松办理退费
    ABC亚.商交费168000私... ABC亚.商交费168000私人定制能退吗?退款流程详细公布! 上海亚商投资确实是一家正规的投顾公司...
    和众汇富是正规公司吗?误导性宣...   和众汇富交1980元咨询费是真的吗?误导性宣传骗取股民服务费!夸大收益诱导投资者!这份退费指南让...
    高能智投服务费能退吗?误导夸大...   高能智投交了29800稳赚吗?误导性宣传骗取股民服务费!夸大收益诱导投资者!退费有戏了!这些关键...
    大决策投资顾问有限公司怎么样?...   四川大 决策证券投资顾问有限公司靠谱吗?如何投诉退回荐股服务费?  投资有风险,投资需...
    股掌柜付费服务不可信!承诺高收... 股掌柜付费服务不可信!承诺高收益欺骗股民已退费! 可以退,告诉大家一个好消息,在股掌柜证券交费的,只...
    上海汇正财经服务费怎么退?误导...   汇正财经确实是一家正规的投顾公司。但这并不能说明他们公司的宣传就符合实际,从案例中不难看出,业务...
    博众投资交29800靠谱吗?误...   博众投资交29800买大阳智投靠谱吗?与想象中不同!误导性宣传交费!学会这几步,轻松办理退费
    和讯投资可靠吗?误导交费!投顾... 和讯投资可靠吗?误导交费!投顾服务缩水?主动维权,顺利退费有方法 和讯信息科技有限公司服务费是可以退...
    博众证券投资咨询公司怎么样?误...   博众投资交29800买大阳智投靠谱吗?与想象中不同!误导性宣传交费!学会这几步,轻松办理退费
    顶点财经四分公司怎么样?误导性...   杭州顶 点财经八分公司怎么样?只讲赚不说亏?误导性宣传!别再浪费时间!退费路径曝光  ...
    杭州顶点财经八分公司怎么样?误...   杭州顶 点财经八分公司怎么样?只讲赚不说亏?误导性宣传!别再浪费时间!退费路径曝光  ...
    中富金石投顾服务怎么样?荐股黑... 中富金石投顾服务怎么样?荐股黑幕曝光!真相震惊股民,可退费! 中富金石服务费是可以退的。如果认为中富...