海量财经|阿里千问3登顶全球最强开源模型 性能超越DeepSeek-R1
创始人
2025-04-29 16:47:00
0

海报新闻记者 孙杰 济南报道

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3)。值得一提的是,千问3参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。海报新闻记者了解到,千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

千问3性能图

据介绍,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3还提供了丰富的模型版本。所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧丝滑部署应用;32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。

相关内容

热门资讯

兰博基尼门怎么开 兰博基尼门怎... 要打开兰博基尼的车门,您需要先找到车门上的长条按键。当您轻轻按住这个按键时,车门会开始向上方斜向提起...
科目二扣分明细 科目二扣分明细... 以下是科目二考试扣分点的详细介绍:1、倒车入库。如果未按照规定路线行驶,将扣100分。在倒车过程中,...
中石化的油和小加油站的区别 中... 中石化的油和小加油站的区别: 1. 质量不同:作为国营大加油站,中石油的油品质量绝对让人放心。由于使...
宝马音响用的什么品牌的 宝马音... 宝马车音响的品牌有:美国Bose、哈曼卡顿、丹麦BO音响。汽车音响是为减轻驾驶员和乘员旅行中的枯燥感...
教练证需要几年驾龄 教练证需要... 学车教练证在2015年已经取消,现在需要考的是等级资格证。报考的基础条件是五年的驾龄并且三年无重大事...
h2s可以拆吗 h2s可以拆吗... h2s可以拆吗?h2s不可以拆,因为氢硫酸属于弱酸,不能拆。h2s是一种无机化合物,化学式为h2s,...
曲轴后油封在哪个位置 曲轴后油... 曲轴后油封的位置是在与变速箱连接处。曲轴油封损坏,会导致渗油,严重时导致发动机渗油,造成发动机运转不...
拖车需要注意什么 拖车需要注意... 拖车需要注意哪些方面?拖车需要注意以下几个方面: 拖车杆的选择:拖车行驶分为软拖和硬拖。软拖是在被...
预约科目二显示未参加培训 预约... 当您尝试预约机动车驾驶证科目二考试时,系统提示“未参加培训”,这可能是由多种因素造成的:首先,可能是...
临牌怎么申请流程 临牌怎么申请... 申请临时牌照的流程如下: 1. 首先,需要填写一份临时车牌申请表,表格中填写车辆的相关信息和车主的个...