《国际AI安全报告》第二版更新发布,聚焦通用AI风险管理与技术缓解措施
创始人
2025-11-26 10:45:25

(全球TMT2025年11月26日讯)《国际AI安全报告》(International AI Safety Report)第二版关键更新现已发布,及时更新了通用AI的风险管理与技术缓和措施。该报告由图灵奖得主、计算机科学家Yoshua Bengio主持,汇集了百余位国际专家的参与,并获得包括欧盟、经合组织和联合国在内的30多个国家和国际组织的支持。

第二版关键更新涵盖了提升可靠性与防范滥用的技术方法概述,以及风险管理领域新兴的制度化方法。其核心重点包括:在训练模型抵御恶意攻击方面虽有所进展,但仍存在不足。技术娴熟的黑客仍能在约50%的案例中仅用10次尝试即可突破防护。开源鸿沟正在缩小,开放权重模型如今与行业领先产品的差距已不足一年。行业在安全方面的承诺有所增加,但其成效仍不明确。

相关内容

热门资讯

马斯克重磅发声:三年内部署AI... 马斯克抛出大胆预测,认为受限于地球电力瓶颈, 三年内太空将成为AI推理最具经济效益的场所,并描述了通...
中关村AI北纬社区启动“一人公... 聚焦“一人公司”、构建全球顶级AI生态圈。日前,中关村AI北纬社区启动“Token Camp人工智能...
原创 小... 一、当代家长的共同困扰:辅导作业的崩溃瞬间 每当夜幕降临,无数家庭都会上演同样的剧情——家长盯着孩...
姚顺雨交出的首份研究成果,或成... 2026年春节未至,国内AI大厂的用户争夺战已率先打响,腾讯元宝大手笔发红包,阿里千问推出30亿免单...
从“手搓”到AI+硬件赛道,华... 近日,“手搓经济”在网络走红,而华强北作为“中国电子第一街”,其深厚的“手搓”技术底蕴早已受到国内外...