超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了
创始人
2025-09-19 19:18:17
0

机器之心报道

机器之心编辑部

在 AI 领域,亚马逊云科技有着自己的打法,模型选择权交给用户。

「云计算一哥」亚马逊云科技又「收」新模型了。

就在刚刚过去的 8 月,亚马逊云科技宣布,其 Amazon Bedrock 和 Amazon SageMaker 两大 AI 平台开始支持 OpenAI 新开源模型。

紧接着今天又传出新消息,两大重量级国产大模型 Qwen3 和 DeepSeek-V3.1 也被亚马逊云科技收入 Amazon Bedrock。

目前这两款模型均已在 Amazon Bedrock 全球上线,可用区域包括美国西部(俄勒冈)、亚太地区(孟买、东京)、欧洲(伦敦、斯德哥尔摩)等。

这一连串快速上新的动作,展现了亚马逊云科技在全球 AI 竞赛中的敏锐嗅觉和执行力。无论是来自 Meta、Mistral AI 和 OpenAI 等国际顶尖的开放模型,还是国产开源模型,亚马逊云科技都在第一时间将其纳入生态版图,为开发者与企业用户提供了前所未有的多样化选择。

这也恰恰是亚马逊云科技长期坚持的 「Choice Matters(选择大于一切)」战略的最佳注解:没有一个大模型可以解决所有问题,唯有通过多模型的互补与协同,才能让 AI 真正匹配现实世界的复杂需求。

此外,大家关心的模型安全问题,在亚马逊云科技这里也得到了保障:客户对他们自己的数据拥有完全的控制权,亚马逊云科技不会将模型的输入和输出数据与模型提供商共享,也不会用于改进基础模型。

两大顶尖国产模型登陆 Amazon Bedrock

随着 Qwen3 和 DeepSeek-V3.1 两大国产 AI 模型的正式发布,Amazon Bedrock 进一步扩展了其平台上管理完善、行业领先的模型阵容。

这两款模型的加入,不仅丰富了现有的开放权重模型选择,为全球客户提供更多创新的可能和灵活的应用场景,也进一步加强了亚马逊云科技在生成式 AI 领域的竞争力和影响力。

Qwen3 模型首次上线 Amazon Bedrock

作为国产 AI 模型的扛把子,Qwen3 模型首次亮相 Amazon Bedrock,成为该平台第 14 个模型提供商。此举不仅标志着中国 AI 开源生态与国际云计算的深度融合,也进一步推动了全球 AI 技术的合作与发展。

Qwen3 模型是阿里巴巴开源的新一代通义千问模型,在推理、指令遵循、多语言支持和工具调用等方面均大幅提升,创下了国产和全球开源模型的新性能纪录。与同类模型相比,Qwen3 模型的部署成本大幅下降,仅需 4 张 H20 便能实现其满血版部署,显存占用也只有性能相近模型的三分之一,极大地降低了硬件需求。

此次上线的 Qwen3 模型包括四个版本:Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 和 Qwen3-32B-Dense,并分别针对不同应用场景进行优化。

  • Qwen3-Coder-480B-A35B-Instruct 专为复杂的软件工程任务设计,擅长高级代码生成、代码库分析和集成外部工具;
  • Qwen3-Coder-30B-A3B-Instruct 特别优化了代码补全、重构及编程相关问题解答,适用于多种编程语言;
  • Qwen3-235B-A22B-Instruct-2507 则提供了强大的通用推理和指令跟随能力,适用于需要平衡性能与效率的任务;
  • Qwen3-32B-Dense 则适用于要求稳定性能、低延迟和成本优化的场景,如移动设备和边缘计算。

在模型架构方面,Qwen3 模型采用了 MoE 和密集型架构。其中,MoE 模型如 Qwen3-Coder-480B-A35B-Instruct 和 Qwen3-Coder-30B-A3B-Instruct,通过动态激活部分参数,实现高效推理,适用于复杂编程和智能体任务。而密集型 Qwen3-32B 则在所有参数上提供稳定一致的性能,适合低延迟和资源受限的环境。

同时,Qwen3 模型还具备强大的智能体能力,能够执行多步推理和结构化规划,可以在一次模型调用中生成输出并调用外部工具或 API,支持与外部环境的标准化通信,且能够在长时间会话中维持扩展上下文。

此外,Qwen3 还引入了混合思维模式,支持思维模式和非思维模式两种推理方式,思维模式适用于需要逐步推理的复杂任务,而非思维模式则提供快速响应,适合对速度要求更高的场景。这一创新帮助开发者在复杂任务和对响应速度要求高的任务之间找到平衡。Qwen3-Coder 模型原生支持 256K 个 token 的上下文窗口,使用外推方法可扩展到 100 万个 token,使其能够处理大规模的代码库、技术文档或长时间对话历史,进一步提升了长上下文处理的能力。

DeepSeek-V3.1 上线 Amazon Bedrock

除了 Qwen3,在提到国产开源模型时,DeepSeek 无疑是绕不开的名字。凭借高效的推理性能、极具竞争力的性价比以及活跃的社区生态,DeepSeek 已经成为企业在大规模应用 AI 时的重要选择。

亚马逊云科技也是首家提供全托管式 DeepSeek 模型的海外云厂商。

早在今年三月,亚马逊云科技率先在云服务商中以无服务器(serverless)的方式提供 DeepSeek-R1,并在 Amazon Bedrock 上将其作为完全托管、全面可用的模型正式上线。

延续这一先行一步的策略,亚马逊云科技在对合作伙伴最新大模型的支持上始终保持着及时快速响应。也正因如此,当 DeepSeek 发布新一代模型 DeepSeek-V3.1 时,他们便在第一时间官宣全面支持,将其迅速纳入Amazon Bedrock 的模型版图。

DeepSeek-V3.1 是一个混合推理模型,同时支持思考模式与非思考模式。在思考效率上,相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案。这种可调节的推理机制,不仅提升了模型在不同应用中的适配性,也让 AI 的使用更加可控和高效。

与此同时,DeepSeek-V3.1 在代码生成、Agentic AI 工具调用等方面展现出强劲的性能。在模型上线 Amazon Bedrock 后,用户可借助其强大的代码生成、补全、调试能力,显著提升开发效率。此外,其优秀的工具调用能力,使开发者能够构建更智能、更自主的 AI Agent ,处理更复杂任务。

幸运的是,DeepSeek-V3.1 这些功能,现在全部都能在 Amazon Bedrock 上体验。

Qwen3 和 DeepSeek 最新模型的加入,Amazon Bedrock 上完全托管的大模型家族又进一步壮大。到目前为止,Amazon Bedrock 已提供了 249 款大模型,覆盖从通用对话、生成,到多语言理解与代码助手等多个应用类型,用户都能在此找到最适合自身业务的模型。

随着不断引入更多大模型厂商并扩充托管模型阵列,Amazon Bedrock 已汇聚包括 Anthropic 、DeepSeek、亚马逊云科技自研 Nova 模型在内的十四家主流厂商,构建起多模型并存、多场景适配的开放格局。这不仅极大丰富了技术多样性与选择空间,也为亚马逊云科技在未来 AI 生态中的话语权奠定了坚实基础。

大模型选型实战:性能稳定高速

机器之心迫不及待地上手体验了一波。

在 Amazon Bedrock 上用于测评对比和挑选最合适业务的大模型的「大模型选型实战」Playground,我们测试了最新上线的 Qwen3 和 DeepSeek 模型。

先让 DeepSeek-V3.1 写一篇科幻微小说来简单测试一下可行性。

从生成的故事来看,Amazon Bedrock 版 DeepSeek-V3.1 的表现可圈可点,故事悬念和文笔都相当不错。

「大模型选型实战」Playground 还提供了「比较模式」,让我们可以直接让两个模型同台竞技,看它们在同样提示词下会有怎样的表现。

接下来我们就让 DeepSeek-V3.1 和 Qwen3-235B-A22B-Instruct-2507 同时登台,演示一下它们的混合推理能力,看看它们究竟能否根据任务难度自行决定是否推理和深度思考。先来个简单任务:

小明有 3 个苹果,吃掉了 1 个,还剩几个?请直接回答。

对于这个简单问题,两个模型几乎都是瞬时完成了任务 —— 都在半秒左右(模型名右侧第三个数据,前两个数据分别是输入和输出的 token 数量)给出了正确答案。很显然,对于这个简单任务,这两个模型都没有(也无需)进行深度思考。

接下来上一个难度更大一点、涉及到多步计算的任务:

小明有 24 个苹果。他先吃掉 1/3,剩下的平均分给 3 个朋友。后来,每个朋友又把自己的一半苹果还给小明。最后,小明手里一共有多少个苹果?请逐步推理。

可以看到,这两个模型同样正确地完成了任务并给出了整个推理过程。而仔细观察,我们又能发现这两个混合推理模型的回答各有风格。比如 Qwen3-235B-A22B-Instruct-2507 的计算过程分成了 5 步,而 DeepSeek-V3.1 用了 4 步;另外前者的推理过程中的 LaTeX 并没有渲染,而后者的完成了渲染。用户可以根据自身的业务流程需求及偏好选择合适的模型。

最后我们再让 Qwen3-Coder-480B-A35B-Instruct 上场,为我们编写一个「俄罗斯方块 + 贪吃蛇」游戏:

用 Python(使用 pygame)编写一个融合俄罗斯方块和贪吃蛇的小游戏:画面分为上下两部分,上半部分有一条会自动移动的蛇,玩家需控制下落方块左右移动以躲避蛇;当方块进入下半部分后,按照俄罗斯方块规则继续下落,玩家需要把它放入合适位置以消除整行。若方块与蛇相撞则游戏结束;支持方向键移动、空格键加速下落;蛇可随机改变方向。程序需包含初始化、事件处理、逻辑更新和渲染绘制等模块,并写清注释。

该模型仅用半分钟就完成了任务!下面将代码复制出去运行一下。

这个 Qwen3-Coder 首次完成的代码就基本正确地完成了提示词所述的所有游戏逻辑,即使不修改也基本可玩。对于其中显示不出的字符,我们也只需对代码中的字体设置做简单微调,即可解决。

整个过程中,Amazon Bedrock 提供的服务都非常稳定高速,提供的全量模型的性能也能得到充分保证。

亚马逊云科技:我们也很看重开放权重模型

我们不难发现,Qwen3 以及 DeepSeek-V3.1 都是国产开源阵列中的佼佼者,加上之前的 gpt-oss(120b 和 20b),亚马逊云科技都将它们纳入 Amazon Bedrock 平台,彰显了其对开源生态的重视与支持

在亚马逊云科技看来,向客户提供多样化的专有模型和开源模型是解锁全球客户在生成式 AI 领域创新自由的关键。

一方面用户无需在不同供应商、不同环境之间辗转,即可在同一个平台上实验、比较、部署和优化来自多方的顶级模型能力。

另一方面,相比闭源模型,开源模型有着独特的优势,特别是在定制化开发和透明性方面,给用户带来了更大的灵活性和控制权。

举例来说,在 Amazon Bedrock 上,用户可以通过开源模型直接调用经过优化的托管推理服务,实现快速应用部署,而无需从头开始搭建基础设施。这种便捷的方式,可以帮助用户迅速将生成式 AI 集成到自己现有的工作流程和业务场景中。

此外,开源模型的真正价值不仅仅在于其即用性,更在于其开放权重的特性。用户可以在原始模型的基础上,利用自己的行业数据和特定需求,进行二次开发和定制训练。例如,某些行业可能需要更精确的语义理解,通过开源模型,用户可以根据自身的实际情况调整训练集、优化模型架构,甚至引入新的技术与算法。这种能力使得企业能够打造高度个性化、符合行业特色的智能解决方案,进而在市场中获得竞争优势。

更重要的是,开源模型拥有很高的透明性。企业和用户可以清晰了解模型的结构、训练数据和算法流程,这不仅增强了对模型行为的预测能力,也提高了在合规性和道德方面的可控性,真正体现了亚马逊云科技以用户为中心的服务理念。

正如 Amazon Bedrock 总监 Luis Wang 所言:「开放权重模型代表着 AI 创新的重要前沿,因此我们投入大量精力,致力于将亚马逊云科技打造为安全、大规模且经济高效地运行这些模型的最佳平台。我们认为,不存在一个适合所有用例的最佳模型…… 许多客户喜欢使用开放模型,而开放模型的优势之一就是您可以拥有更大的灵活性来使用它。」

Choice Matters

没有一个模型可以一统天下,选择更重要

在最近一次采访中,亚马逊云科技 CEO Matt Garman 将 AI 描述为「几十年来见过的可能发展最快的技术」。他认为,AI 不仅会像互联网和云计算一样引发深刻变革,未来几十年也将是持续创新的黄金期。

为了帮助各类公司在 AI 浪潮中不断创新和落地,亚马逊云科技一直秉持「Choice Matters」(选择大于一切)理念。

「Choice Matters」并非空洞的口号,而是根植于亚马逊云科技对技术演进和客户需求的深刻洞察。AI 应用场景复杂多样,没有任何一个 AI 模型能够成为所有问题和场景的「万能钥匙」,企业客户受性能、成本、具体任务、数据隐私与合规等多重因素影响,需求更是千差万别。因此,将客户锁定在单一技术路径,无异于限制其创新潜力。

正是在此背景下,亚马逊云科技推出了能够承载多样化模型的 Amazon Bedrock 和 Amazon SageMaker 两大平台,并于 2024 年 re:Invent 大会上正式将「Choice Matters」确立为其生成式 AI 的核心战略,旨在将选择权和技术自由度彻底交还给客户。

截至目前,亚马逊云科技在 Amazon Bedrock 和 SageMaker 上构建了一个拥有超过 400 款模型的模型库,让客户能够像在超市挑选商品一样,根据自身独特的业务需求,灵活比较、测试并组合最适合的模型,从而构建出端到端的 AI 应用。

于企业客户而言,这一策略意味着最大化业务价值与加速实现落地。企业无需削足适履地去适应某个固定模型,而是可以像搭积木一样,以多模型协作的方式,将不同模型精准应用于营销、客服、编程等不同环节,推动 AI 驱动的业务转型,形成 Matt 所言的「飞轮效应」。

对亚马逊云科技自身乃至整个行业来说,「Choice Matters」构成了其最核心的差异化竞争优势。它避免了亚马逊云科技与模型提供商陷入正面竞争,转而专注于其最擅长的领域,即成为中立、丰富且可靠的 AI 基础设施层

这种开放共赢的策略,吸引了包括初创公司、大型企业在内的多样化客户生态,使各类企业都能找到适合自身的创新路径,从而巩固了亚马逊云科技作为 AI 时代创新基座的地位,为其长期增长奠定了坚实基础。

最后,想在Amazon Bedrock上尝试这两款模型的小伙伴,指路:https://dev.amazoncloud.cn/experience/cloudlab?id=67bc1b7c8ea6eb2ae682bde3&visitfrom=1P_social_0919&sc_medium=owned&sc_campaign=cloudlab&sc_channel=1P_social_0919

相关内容

热门资讯

拖油塔是什么车 拖油塔是什么车... 拖油塔实际上是指丰田(TOYOTA)汽车品牌。TOYOTA并非专指丰田的某一款车型,而是这个日本汽车...
手动挡停车要踩离合吗 手动挡停... 手动挡的车型在停车时是否需要踩离合,这取决于具体情况。如果汽车速度较快,只是为了减速,就不需要踩离合...
传祺GS3用什么机油 传祺GS... 传祺GS3官方推荐使用5w30机油,这款机油以其出色的低温流动性和优异的润滑能力而广受好评,能够在各...
朗逸6at变速箱是什么牌子 朗... 对于大众朗逸6AT变速箱,它采用的是爱信6速手自一体变速箱。对于1.4T车型,它则采用了大众自主研发...
汽车n代表什么意思 汽车n代表... 在汽车领域中,N代表的是空挡。对于手动挡车型,N挡是空挡的俗称。而对于自动挡车辆,N挡通常用于短暂停...
北京新能源汽车排号怎么知道自己... 想要了解北京新能源汽车排号进度,可以参考以下步骤: 首先,访问北京市小客车摇号信息管理系统,这是获取...
科目二考试下雨怎么办教你轻松应... 科目二考试下雨怎么办?教你轻松应对科目二考试下雨需要注意: 1、穿平底防滑鞋:下雨天考试,鞋底如果...
有a的是内循环还是外循环 有a... 有a的汽车空调既不是内循环也不是外循环,实际上这个a按键可以开启自动模式,传感器会自动根据空气质量来...
柴油机高温的解决方法 柴油机高... 关于柴油机高温的解决方法,以下是几个实用的建议:1.如果柴油机高温是由于冷却液不足导致的,需要在降温...
科目三线路是随机抽吗 科目三线... 驾校科目三考试的路线是随机的,不能自己选择。 根据《机动车驾驶人考试内容和方法》(GA1026—20...