红杉中国推出全新AI基准测试xbench
创始人
2025-05-26 20:17:29

新榜讯 5 月 26 日,红杉中国重磅宣布推出全新的 AI 基准测试 xbench,同时发布相关论文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。据悉,这是首个由投资机构发起,联合国内外十余家高校以及研究机构的数十位博士研究生共同打造的 AI 基准测试,其采用双轨评估体系与长青评估机制。xbench 不仅能评估并推动 AI 系统能力提升上限及技术边界,还将重点量化 AI 系统在真实场景中的效用价值,并长期追踪 Agent 产品的关键突破。

相关内容

热门资讯

美国AI泡沫担不起“化作春泥”... 崔传刚 随着人工智能(AI)技术成为全球科技竞争的核心赛道之一,美国资本市场对AI的投资热情也达到空...
【深圳特区报】AI参与“双十一... 随着“双十一”到来,消费市场的热力如期而至。比起营销活动本身,更引人注意的是今年AI在电商中的参与度...
阿里巴巴集团与万豪国际集团达成... 11月10日,阿里巴巴集团与万豪国际集团宣布达成AI战略合作,双方将在中国市场围绕云基础设施、AI应...
原创 馆... 台湾特别有名的网红“馆长”陈之汉,去大陆参观访问之后,说了句“再给台湾人一些时间”,这话一出来,可把...