记者从市经信局获悉,在国际权威医学多模态推理评测集MedXpertQA的多模态子集测试中,由北京企业缘启智慧自主研发的医疗AI智能体MentX斩获全球第二、中国第一,成为中国唯一进入第一梯队的医疗智能体。
记者了解到,MedXpertQA是一项面向全球开放的标准化医学多模态能力评测体系,涵盖复杂临床场景下的影像识别、病历理解与诊断推理能力评估,测试数据来自多国临床案例,具有高度的专业性与国际公信力,被业内誉为“医疗AI领域的奥林匹克”。此次评测中,有来自中美欧多地的主流AI模型参与。
评测结果显示,MentX在“多模态推理”和“医学理解”两项核心指标上分别取得69.38%和72.36%,综合得分达70.19%,仅次于GPT-5,且大幅领先于GPT-4o、GPT-5-mini及人类预执业专家水平。MentX实现对国际主流模型的超越,展现出中国企业在医疗人工智能领域的重要技术突破。
据介绍,MentX由北京企业缘启智慧自主研发,其训练与优化深度依托国家卫生健康委临床医学指南和医学共识,涵盖电子病历、医学影像、实验室检查等多源信息。MentX采用链式思维推理架构,可模拟医生循证医学决策过程,输出可解释的诊断逻辑链,将在全科辅助医疗中展现出良好的临床适用性与安全性。
业内专家认为,MentX在国际化评测项目中脱颖而出,标志着中国医疗AI已从“跟跑”迈向“并跑”甚至局部“领跑”阶段。 MentX在保持国际先进技术水平的同时,具备更强的本土适配性,将为提升基层医疗诊断能力、推动智慧医院建设提供助力。下一步,相关企业将持续优化模型在真实医疗环境中的泛化能力,推动AI辅助诊断系统在各级医疗机构落地应用。
来源:北京日报客户端
记者:杨天悦