《国际AI安全报告》第二版更新发布,聚焦通用AI风险管理与技术缓解措施
创始人
2025-11-26 10:45:25

(全球TMT2025年11月26日讯)《国际AI安全报告》(International AI Safety Report)第二版关键更新现已发布,及时更新了通用AI的风险管理与技术缓和措施。该报告由图灵奖得主、计算机科学家Yoshua Bengio主持,汇集了百余位国际专家的参与,并获得包括欧盟、经合组织和联合国在内的30多个国家和国际组织的支持。

第二版关键更新涵盖了提升可靠性与防范滥用的技术方法概述,以及风险管理领域新兴的制度化方法。其核心重点包括:在训练模型抵御恶意攻击方面虽有所进展,但仍存在不足。技术娴熟的黑客仍能在约50%的案例中仅用10次尝试即可突破防护。开源鸿沟正在缩小,开放权重模型如今与行业领先产品的差距已不足一年。行业在安全方面的承诺有所增加,但其成效仍不明确。

相关内容

热门资讯

《国际AI安全报告》第二版更新... (全球TMT2025年11月26日讯)《国际AI安全报告》(International AI Saf...
一次性奖励最高1000万元!四... 封面新闻记者 冷宇 徐湘东 11月25日,四川省攀枝花市举行创新与人才发展大会。会上,攀枝花市委常委...
对话北汽罗伟基:在AI与电动时... 在汽车设计的浪潮中,未来已不再是遥不可彻的想象,而是正在被具象化为一台台凝聚思考与美学的原型车。罗伟...
华尔街大佬警告AI泡沫,英伟达... 近期,华尔街著名投资者迈克尔·伯里发表专栏文章,将当前AI热潮与20世纪90年代末互联网泡沫相提并论...
AI塑造银行理财“最强大脑” 本报记者 杨洁 熊悦 想象一下,当你打开手机银行,向智能财富管家提出需求——“用5万元本金,在控制风...