阿里开源新一代通义千问模型Qwen3
创始人
2025-04-29 09:45:07

【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。

小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹,Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

相关内容

热门资讯

华为哈勃入股语音AI大模型公司... 企查查APP显示,近日,深圳市安菲翁科技有限公司发生工商变更,新增华为旗下深圳哈勃科技投资合伙企业(...
合盛硅业涨6.67%,开源证券... 今日合盛硅业(603260)涨6.67%,收盘报58.51元。 2025年9月17日,开源证券研究员...
原创 金... 11月8日,国民党主席郑丽文在台北马场町出席“白色恐怖政治受难者追思慰灵大会”,并向吴石将军鞠躬献花...
清华团队开源DISCOVERS... 当前端到端机器人学习目前受制于三个突出问题:仿真环境还原真实场景的能力不足,造成“仿真到现实(Sim...
奥尔特曼:OpenAI计划直接... 11 月 10 日消息,行业媒体 Business Insider 于 11 月 7 日发布博文,报...