9月28日,全球最大 AI 开源社区 Hugging Face 公布了新一期模型榜单。
全球前十开源模型榜单中,阿里通义7款大模型入选,其中刚刚开源的全模态大模型 Qwen3-Omni 登顶。
图片来源:Hugging Face 官网
9月26日,阿里通义千问正式发布 Qwen3-Omni。据通义千问介绍,Qwen3-Omni是原生全模态大模型,预训练全模态不降智。在36个音视频基准测试中,Qwen3-Omni 系列模型有22项达到SOTA水平,其中32项取得开源模型最佳效果,语音识别、音频理解与语音对话能力可比肩 Gemini2.5-Pro。
作为全模态模型,Qwen3-Omni 能够实现全模态输入和全模态输出。类似于人类婴儿一出生就全方位感知世界,Qwen3-Omni一开始就加入了“听”“说”“写”多模态混合训练。在预训练过程中,Qwen3-Omni 采用混合单模态和跨模态数据,在实现强劲音频与音视频能力的同时,单模态文本与图像性能均保持稳定,这是业内首次实现这一训练效果。
上一篇:AI“精准”匹配舍友,高效背后谨防“教育懒政”| 新京报快评
下一篇:没有了