阿里发布最强开源模型Qwen 3,参数量仅为DeepSeek-R1的1/3
创始人
2025-04-30 14:16:02

蓝鲸新闻4月30日讯(记者 武静静)赶在了五一节前,阿里巴巴开源新一代通义千问模型 Qwen3。据介绍,其参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,但性能表现不错。

报告显示,Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,超过了与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球顶尖模型。成为了全球最强的开源模型。

通过模型架构的改进、训练数据的增加以及更有效的训练方法,Qwen3实现了模型体积更小情况下,性能表现也比更大参数规模的Qwen2.5基础模型要好。特别是在 STEM、编码和推理等领域,Qwen3 Dense 基础模型的表现甚至超过了更大规模的 Qwen2.5 模型。

博客中,阿里称,Qwen3 Dense 基础模型的整体性能与参数更多的Qwen2.5基础模型相当。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 表现相当。

有意思的是,除了拥有235B参数的MoE模型外,Qwen 3还配备了一个小型MoE模型,即Qwen3-30B-A3B。该模型的激活参数量为3B,不及QwQ-32B模型的10%,然而其性能却更为出色。

我们可以把MoE架构理解为一个大型的客服中心,其中有许多专门处理不同问题的专家——有的专家专门处理技术问题,有的专家处理账单查询,还有的专家负责解答产品使用问题。在大模型训练过程中,当数据进入模型中后,大模型会像“客服中心”一样,根据问题的性质被分配给最合适的专家来解决,可以提高查询的计算效率。

此次,阿里开的源模型有Dense模型,也有MoE模型。其中,开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。可以直接商用。

Qwen 3系列的其中一个创新点在于其"混合型"模型设计,可以在深度思考这种慢思考模式(用于复杂的逻辑推理、数学和编码)和快思考模式(用于高效、通用的聊天) 之间的无缝切换 ,确保在各种场景下实现最佳性能。

这意味着,用户终于不需要手动操作开启并关闭“深度思考”功能,且担心模型过度思考的问题了,此前,很多大模型用户反馈称,大模型动不动就深度思考输出长篇大论,很多小问题也如此完全没必要。

关键在于,这种快慢思考灵活切换的模式能有效的降低成本,阿里在博客中称:这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。

在部署方面,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。这意味着相比相比满血版deepseek R1,部署成本大降75%~65%。

阿里介绍称,Qwen3经过了四阶段的训练流程,相当于,先教基础→再练深度思考→混合快慢模式→最后全面优化。阿里表示,Qwen3在工具调用、指令执行和数据格式处理方面表现优秀。建议搭配Qwen-Agent使用,它能简化工具调用的代码实现。

此次,阿里还专门优化了Qwen3 模型的 Agent 和 代码能力,同时也加强了对 MCP 的支持。在示例中看到, Qwen3 可以丝滑的调用工具。

开源正在成为阿里核心的AI战略,从2023年起,阿里通义团队就陆续开发了覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款「全尺寸」大模型。

在此前的一次采访中,通义相关负责人曾告诉蓝鲸新闻,“开源不是目的而是结果。只有做出真正有竞争力的产品,开源才有意义。这倒逼我们必须做到两点:一是模型性能要达到全球SOTA水平,二是要能媲美甚至超越闭源模型。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

上海亚商ABC吹嘘荐股实力,投... 亚.商投顾服务费怎么退?答案是可以退,能退!保留相关证据即可追回! 那些疯狂拉群洗脑的营销...
深圳国.诚投顾上海分公司欺骗消... 深圳国.诚投顾上海分公司欺骗消费者,可以退费!有法可依!误导性宣传欺诱导股民缴费! 国诚荐股服务没有...
上海凯石26800实战班服务费... 上海凯石证券服务费如何才能退?退款流程公布!投顾被亏骗真相曝光!简单退款流程! 困扰股民...
广东博.众智能投顾荐股服务费打... 广东博.众智能投顾荐股服务费打水漂,退费流程有法可依!误导性宣传欺骗股民,被骗交费可以退款!证券投资...
金证金点股2999还能相信吗?... 金证投顾正规吗?退费流程公布!误导性宣传欺骗股友服务费!被骗交费已退 股市行情持续低迷,...
愤怒!爱.赢投顾退费流程详解亏... 愤怒!爱.赢投顾退费流程详解亏损内幕大曝光!误导性宣传欺骗股民可以退!高收益利诱被骗交费已退款!这些...
德迅证券荐股没实力,坑害投资者... 那些疯狂拉群洗脑的营销模式,浮夸的收益数据,还有一个个不靠谱的“证券专家”,处理投诉和恶评的风控团队...
杭州顶点财经公司怎么样?曝光收... 顶点财经服务费可以退款吗?可以退!有法可依维权可退!退款流程详解及注意事项公布!顶点财经服...
广东博.众投资大阳智投的投顾服... 广东博.众投资大阳智投的投顾服务,被误导交费后亏损皆可退费!证券投资咨询行业的本质在于为投资者提供公...
警惕,在线曝光,在股掌柜交了服... 股掌柜证券财富赢家亏损内幕大曝光!投顾服务不靠谱,背后真相曝光已退费。荐股收费常见陷阱公开。
九方投顾余洋靠谱吗?虚假宣传害... 九方投顾余洋靠谱吗?虚假宣传害股民!服务费可退回! 证券投资咨询行业的本质在于为投资者提供公平、客观...
上海凯石会员费怎么退?虚假盈利... 上海凯石证券服务费如何才能退?退款流程公布!投顾被亏骗真相曝光!简单退款流程! 困扰股民...
杭州顶点财经公司怎么样?跟着操... 顶点财经服务费可以退款吗?可以退!有法可依维权可退!退款流程详解及注意事项公布!顶点财经服...
九方智投服务费能退吗怎么退?缴... 九方智投服务费能退吗怎么退?缴费前画大饼,退费为何百般赖?超详细退费攻略来袭!退款流程公布 证券投资...
港澳资讯荐股亏损惨重,服务费该... 在港澳资讯交的服务费怎么退?答案是:可以能退费!有法可依!申请退款流程公布!海南港澳资讯老...
在上海海能投顾交了服务费荐股被... 在上海海能投顾交了服务费荐股被骗,套路揭秘,退费经验总结! 在监管的灰色边缘,众多投资顾问依然疯狂揽...
爱赢投顾交了48000是可以退... 爱赢投顾正规吗可靠吗?荐股只亏不赚!想退费看这里!核心答案:符合条件可全额退回! 若你在湖...
湖南金.证投顾订制老师骗取会员... 湖南金.证投顾订制老师骗取会员费,投顾"名师”带你频繁买卖,亏了九万服务费,教你合规维权退! 证券投...
杭州顶点财经公司怎么样?曝光收... 顶点财经服务费可以退款吗?可以退!有法可依维权可退!退款流程详解及注意事项公布!顶点财经服...
杭州顶点摇钱树9800没效果,... 顶点财经服务费可以退款吗?可以退!有法可依维权可退!退款流程详解及注意事项公布!顶点财经服...
在顶点投顾交的服务费可以退吗?... 在顶点投顾交的服务费可以退吗?误导性宣传坑惨股友真相曝光,被骗服务费已退 投资本是一场自我的修行,只...
上海凯石会员费怎么退?警惕荐股... 上海凯石证券服务费如何才能退?退款流程公布!投顾被亏骗真相曝光!简单退款流程! 困扰股民...
指南针VIP投顾服务垃圾的,背... 指南针VIP投顾服务垃圾的,背后圈套细思极恐!股友愤怒不已! 北京指南针正规吗?北京指南针靠谱吗?北...
和众汇富服务费怎么退?误导性宣... 和众汇富投顾交了服务费可以退吗?揭秘荐股内幕!亏损惨重背后真相曝光!不少投资者在与和众汇富...
杭州高能26800能退回吗?警... 杭州高能云VIP投顾服务垃圾的,黑幕曝光!为骗服务费不择手段!维权已追回! 在跟高能智投有...