AIPress.com.cn报道
12月23日消息,OpenAI 针对其于今年 10 月推出的 Atlas AI 浏览器发布了关键安全警示。
OpenAI 坦言,尽管公司正在持续升级防御机制,但这类浏览器可能永远无法完全屏蔽“提示词注入(Prompt Injection)”攻击。此类攻击通过在网页或电子邮件中隐藏恶意指令,能诱导 AI 智能体背离用户意图,执行危险操作。
OpenAI 在官方博客中指出,提示词注入风险类似于互联网上的诈骗和社交工程学,在技术层面上很难被彻底“解决”。
事实上,自 Atlas 浏览器发布以来,其安全性便面临严峻挑战。研究人员曾演示通过 Google Docs 中的特定词汇成功篡改浏览器的底层行为。包括 Brave 在内的技术同行也指出,这种间接提示词注入是所有 AI 驱动浏览器共同面临的系统性难题。
为了在这场技术攻防战中占据主动,OpenAI 采取了层次化防御策略,其中包括开发一种“基于大语言模型的自动化攻击者”。该系统利用强化学习模拟真实黑客行为,在受控环境中预先挖掘 AI 代理的潜在漏洞,以便在恶意手段扩散至现实世界前先行封堵。
面对这一长期风险,OpenAI 强烈建议用户通过以下措施降低安全隐患:首先应尽量限制 AI 浏览器对个人账户的长效登录访问权限;其次,在 AI 智能体执行关键确认请求时,务必进行人工审查;最后,向智能体下达指令时应尽量具体化,避免给出过于宽泛的模糊命令,以减少隐藏恶意内容影响系统的机会。
随着 AI 智能体逐渐接管复杂的网络任务,OpenAI 表示将把提示词注入视为一项长期挑战,通过快速响应周期不断强化防御防线,力求在攻击者利用漏洞之前将其在内部化解。(AI普瑞斯编译)