红杉中国推出全新AI基准测试xbench
创始人
2025-05-26 20:17:29

新榜讯 5 月 26 日,红杉中国重磅宣布推出全新的 AI 基准测试 xbench,同时发布相关论文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。据悉,这是首个由投资机构发起,联合国内外十余家高校以及研究机构的数十位博士研究生共同打造的 AI 基准测试,其采用双轨评估体系与长青评估机制。xbench 不仅能评估并推动 AI 系统能力提升上限及技术边界,还将重点量化 AI 系统在真实场景中的效用价值,并长期追踪 Agent 产品的关键突破。

相关内容

热门资讯

美股AI应用软件股涨跌不一 每经AI快讯,2月11日,美股AI应用软件股涨跌不一,Cloudflare绩后大涨超10%,Spot...
AI智能体通过链接预览泄露敏感... AI智能体可以为你购物、编程,甚至在消息应用中代你聊天。但要小心:攻击者可以利用恶意提示来诱骗AI智...
ZAST.AI获得600万美元... 2026年1月5日,美国西雅图——ZAST.AI宣布完成600万美元Pre-A轮融资。本轮投资来自知...
顶点软件:公司已积极布局AI技... 有投资者向顶点软件(603383.SH)提问,我们发现2026年01月28日有位投资者的提问到现在都...
GEO服务商哪家好?2026年... 随着生成式AI技术重塑用户获取信息的方式,生成引擎优化(GEO)已成为品牌在AI原生时代营销的“必选...