阿里云通义开源首个多模态推理模型QVQ
创始人
2025-03-08 06:14:30
0

新京报贝壳财经讯(记者罗亦丹)12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。多项评测数据显示,QVQ超越了此前的视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前,开发者可在魔搭社区和HuggingFace平台上直接体验。

人类的推理能力植根于语言思维和视觉记忆中,正因此,利用视觉理解增强大模型推理能力,成为AI技术的前沿探索之一。阿里云方面表示,QVQ是一个会基于视觉进行深度思考推理的大模型。QVQ不但能感知更准确的视觉内容,并据此作出更细致的分析推理,还会质疑自身假设,仔细审视其推理过程的每一步,经过深思熟虑后给出最后结论。QVQ可以轻松识别“梗图”内涵;看真实照片可合理推断出物体个数及高度等信息;在面对数学、物理、化学等各科学领域难题,QVQ能像人甚至科学家一样,给出思考过程和准确答案。

编辑 李铮

校对 杨利

相关内容

热门资讯

车辆上的esp是什么意思 车辆... ESP,全称为Electronic Stability Program,即车身电子稳定控制系统,是汽...
科二坡道停车要求 科二坡道停车... 在科目二考试中,上坡定点停车是非常重要的一项考试内容。考生需要精准地将车辆停在坡道上,并且保证车辆前...
停车不留电话怎么联系车主 停车... 当遇到停车不留电话的情况时,可以尝试以下方法来联系车主:1、拨打114查询电话:提供对方车辆的车牌号...
后备箱报警声怎样关 后备箱报警... 后备箱报警声的关闭方法当汽车后备箱无法关闭并发出报警声时,有以下几种可能的原因:1. 后备箱内装载过...
倒车影像显示无信号怎么回事 倒... 当倒车影像显示无信号时,可能有以下原因:1. 如果车辆刚刚启动,倒车影像可能受到影响。尝试重新启动车...
汽车刹车片到什么程度要换 汽车... 当汽车刹车片需要更换时,通常前刹车片需要在三万公里左右更换,后刹车片需要在三到五万公里左右更换。然而...
路边停车位可以停多久 路边停车... 路边停车位的停放时间规定主要分两种:限时停车和不限时停车。限时停车的情况下,具体的停车时间应根据停车...
摩托车怎么申请牌照 摩托车怎么... 办理摩托车牌照需要哪些证件呢?以下是一些必备证件: 个人身份证 摩托车销售发票、车辆合格证、车辆...
没显示屏的车载蓝牙是哪个键 没... 没显示屏的车载蓝牙是蓝牙标志和Bluetooth或BL这三个符号中的其中一个。以下是相关介绍:1、车...
哪些车有颗粒捕捉器 哪些车有颗... 大多数车型都安装了颗粒捕捉器,以达到排放标准。其中包括凯迪拉克、林肯、雪佛兰、沃尔沃、雪铁龙、奔驰、...