阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一
创始人
2025-04-29 20:16:04

新浪科技讯 4月29日上午消息,阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,极大节省了算力消耗。

据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。(文猛)

责任编辑:郝欣煜

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

热门资讯

“砸”了数十亿元,春节AI红包... 多年以后,当我们回望中国AI(人工智能)发展史,2026年的春节一定会被反复提起。 随着阿里、腾讯和...
牛刀凤凰博客 牛刀介绍牛刀,中央电视台财经评论员,财经专栏作家,是中国房地产最具影响力的独立评论家,中国地产营销实...
凤凰知音官网 基本介绍作为星空联盟成员之一,中国国际航空股份有限公司携手星盟成员航空公司,共同为旅客搭建起覆盖全球...
AI鬼故事“突袭”美股! 作者 | 深水财经社 韩峻 一个虚幻的故事带来了一场真实的金融风暴! 2月23日,道指单日狂泻821...
阿里开源三款中型千问3.5新模... 新京报贝壳财经讯(记者罗亦丹)2月25日,继除夕开源Qwen3.5-397B-A17B之后,阿里继续...