速递|黑箱倒计时:Anthropic目标在2027年构建AI透明化,呼吁AI巨头共建可解释性标准
创始人
2025-04-25 12:47:31

图片来源:Anthropic

4月24日,Anthropic 公司首席执行官 Dario Amodei 发表了一篇文章,强调研究人员对全球领先 AI 模型内部运作机制知之甚少。

为解决这一问题,Amodei Anthropic 设定了一个雄心勃勃的目标:到 2027 年能够可靠地检测出大多数 AI 模型问题,到 2027 年揭开 AI 模型的黑箱。

Amodei 承认面临的挑战。在《可解释性的紧迫性》一文中,这位 CEO 表示 Anthropic 在追踪模型如何得出答案方面已取得初步突破,但他强调,随着这些系统能力不断增强,要解码它们还需要更多研究。

"Amodei 在文中写道:‘我非常担忧在缺乏更好可解释性手段的情况下部署这类系统。这些系统将成为经济、技术和国家安全的核心,且将具备如此高度的自主性, 以至于我认为人类对其运作原理全然无知是根本不可接受的。’ "

Anthropic 是机械可解释性领域的先驱公司之一,该领域致力于揭开 AI 模型的黑箱,理解其决策背后的原因。

尽管科技行业的 AI 模型性能快速提升,我们对这些系统如何做出决策仍知之甚少。

例如,OpenAI 最近发布了新的推理 AI 模型 o3 o4-mini,在某些任务上表现更优,但相比其他模型也更容易产生幻觉。公司并不清楚这一现象的原因。

“当生成式 AI 系统执行某项任务,比如总结一份财务文件时,我们无法在具体或精确的层面上理解它为何做出这样的选择——为何选用某些词汇而非其他,又为何在通常准确的情况下偶尔犯错,”Amodei 在文章中写道。

文章中,Amodei 提到 Anthropic 联合创始人 Chris Olah AI 模型“更像是被培育而非建造出来的”。 换言之,AI 研究者已找到提升模型智能的方法,但对其深层原理仍不完全明了。

在文章中,Amodei 指出,若在未理解这些模型运作原理的情况下实现人工通用智能(AGI)——他称之为“数据中心里的天才国度”可能带来危险。早前的一篇文章里,Amodei 曾预言科技行业可能在 2026 2027 年达成这一里程碑,但他认为人类距离完全理解这些 AI 模型还有很长的路要走。

Anthropic 一直致力于可解释性研究的投入,并首次投资了一家专注于该领域的初创公司。虽然目前可解释性主要被视为安全研究的分支,但 Amodei 指出,最终阐明 AI 模型如何得出答案可能带来商业优势。

在文章中,Amodei 呼吁OpenAI 和谷歌 DeepMind 加大在该领域的研究投入。除了友好的推动外,Anthropic CEO 还请求政府实施“轻触式”监管以鼓励可解释性研究,例如要求企业披露其安全实践。阿莫迪同时提出,美国应对中国实施芯片出口管制,以降低失控的全球 AI 竞赛风险。

Anthropic 始终因其对安全的专注而区别于 OpenAI 和谷歌。当其他科技公司抵制加州颇具争议的 AI 安全法案 SB 1047 时,Anthropic 对该法案表示了适度支持并提出建议,该法案旨在为前沿 AI 模型开发者设定安全报告标准。

在此情况下,Anthropic 似乎正推动全行业共同努力以更深入理解 AI 模型,而不仅仅是提升其性能。

参考资料

https://techcrunch.com/2025/04/24/anthropic-ceo-wants-to-open-the-black-box-of-ai-models-by-2027/

编译:ChatGPT

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

河南宸邦数据技术有限公司意向合... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!随着互联网金融的蓬...
河南宸邦长富数据技术有限公司申... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!当“成为服务代理商...
致远老师直播间认购河南宸邦数据... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!在投资市场中,不少...
和众汇富石昊楠1980靠谱吗?... 和众汇富石昊楠1980靠谱吗?收费荐股就是陷阱,多名股民实测退费成功!投资有风险,投资需谨慎!针对网...
河南宸.邦数据技术有限公司启动... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!随着互联网金融的蓬...
万隆投顾收费荐股怎么样?202... 万隆投顾收费荐股怎么样?2026年用退费方法公布 广州万隆证券不正规!推荐股票一直亏损如何退还服务费...
筑梦人讲堂直播间赵东交流圈推荐... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 “原始股”三个字...
顶,点财经柯友浪荐股可靠吗? ...   投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒...
四川大决策退费收30%合法么?... 四川大决策退费收30%合法么?维权退款选正规渠道,线上办结,无需跑腿奔波! 投资有风险,投资需谨慎!...
广东盈泰证券秦老师联合竞标中签... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 “原始股”三个字...
小鹅通直播间认购河南宸.邦数据... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!当“成为服务代理商...
河南宸.邦数据技术智能设备服务... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!随着互联网金融的蓬...
河南宸邦数据技术有限公司能兑现... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!对于渴望通过炒股实...
北京和众汇富科技的费用真的可以... 北京和众汇富科技的费用真的可以退费吗?收费荐股就是陷阱,多名股民实测退费成功!投资有风险,投资需谨慎...
先锋商学院周老师推荐河南宸.邦... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!随着互联网金融的蓬...
河南宸.邦数据技术智能设备服务... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!当“成为服务代理商...
河南宸邦数据委托承租江苏时代算... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 “原始股”三个字...
九方智投交了学费能退吗?合法合... 九方智投交了学费能退吗?合法合规理性维权,稳妥追回炒股服务费用! 投资有风险,投资需谨慎!针对网上素...
四川大决.策会员费给退吗? 投...   投资有风险,投资需谨慎!针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒...
河南宸联网络技术服务有限公司多... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!在投资市场中,不少...
家族茶话会股票群认购河南宸邦数... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!对于渴望通过炒股实...
博众投资服务要能退吗?投顾荐股... 博众投资服务要能退吗?投顾荐股骗局拆解,手把手教你合规退费回款!投资有风险,投资需谨慎!针对网上素未...
先锋商学院私董会周聪河南宸.邦... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!对于渴望通过炒股实...
致远联盟直播间认购河南宸邦数据... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合。 “原始股”三个字...
河南宸联网络技术服务有限公司股... 本文旨在进行投资风险教育,不针对任何特定企业。以下案例为拟情景,如有雷同纯属巧合!在投资市场中,不少...