阿里云开源Qwen3系列模型
创始人
2025-04-30 10:16:36

2025-04-30 01:20:17 作者:狼叫兽

阿里云于近日正式开源了Qwen3系列模型,其参数量仅为DeepSeek-R1的三分之一,显著降低了使用成本。同日晚间,国家级算力服务平台——超算互联网宣布迅速上线了Qwen3系列的全部模型。

此次上线的Qwen3系列包含六个Dense模型版本,分别为Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,同时推出两款MoE模型:Qwen3-235B-A22B(总参数超过2350亿,激活参数达220多亿)和Qwen3-30B-A3B(总参数为300亿,激活参数为30亿)。

该系列模型基于Apache 2.0协议开源,开发者与企业用户均可通过超算互联网平台下载模型文件,实现快速开发与部署。

平台还表示,正在筹备上线Qwen3系列的模型镜像及应用体验服务,届时用户无需配置环境即可零代码体验Qwen3的对话系统,享受云端开箱即用的便捷操作。

在性能方面,Qwen3-235B-A22B在编码、数学及通用能力等基准测试中展现出强劲实力,可媲美当前多款主流大模型。而小型MoE模型Qwen3-30B-A3B也展现出明显优势,在激活参数数量上超过QwQ-32B十倍之多;即便是Qwen3-4B这一轻量级模型,其性能也可与Qwen2.5-72B-Instruct相匹敌。

相关内容

热门资讯

蓝墨云班课 1.什么是云班课?云班课是在移动网络环境下,利用移动智能设备开展课堂内外即时反馈互动教学的云服务平台...
珍爱网登录 一、珍爱网登陆的种类1、手机号登陆;2、会员ID登陆;3、qq邮箱登陆;二、真爱网登陆步骤1、百度真...
企业AI应用的痛点(二)算力不... 今天是开年第一个工作日,不过我还是选择在家里办公,因为下午要见一个合作伙伴,就懒得跑来跑去了。实际上...
AI语料板块大幅调整,掌阅科技... AI语料板块大幅调整,掌阅科技跌停,中文在线跌超10%,视觉中国、上海电影、人民网、读客文化、华策影...
火狐Firefox浏览器148... IT之家 2 月 24 日消息,Mozilla 今天(2 月 24 日)发布火狐 Firefox 浏...