腾讯混元-A13B 模型开源,极端条件 1 张中低端 GPU 卡即可部署
创始人
2025-06-27 17:10:48
0

IT之家 6 月 27 日消息,腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源

混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。

腾讯混元表示,这对个人开发者和中小企业来说,无疑是个好消息,极端条件下仅需 1 张中低端 GPU 卡即可部署。用户可以在 Github、HuggingFace 等技术社区下载使用,模型 API 已在腾讯云官网上线。

混元-A13B 模型通过 MoE 架构,为每个输入选择性地激活相关模型组件,号称与同等规模的密集模型相比“又快又省”,而且为个人开发者和中小企业提供了一个“可扩展且高效的替代方案”。

预训练中,模型用了 20 万亿高质量网络词元语料库,提升了模型推理能力的上限;完善了 MoE 架构的 Scaling Law (即规模定律)理论体系,为 MoE 架构设计提供了可量化的工程化指导,提升了模型预训练效果。

用户可以按需选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考模式涉及更深、更全面的推理步骤。这优化了计算资源分配,兼顾效率和准确性。

混元还开源了两个新数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 主要用于代码评估,构建了一个包含 1825 个任务的新基准;C3-Bench 针对 Agent 场景模型评估,设计了 1024 条测试数据,以发现模型能力的不足。

从具体效果来看,数学推理方面,例如输入“9.11 和 9.9 谁大”,模型可准确完成小数比较,并展现分步解析能力。

对于时下热门的智能体(Agent)应用,模型可调用工具,生成出行攻略、数据文件分析等复杂指令响应。

再看数据和效果。在多个公开数据测试集上,模型在数学、科学和逻辑推理任务上表现出“领先效果”。

IT之家附开源地址:

相关内容

热门资讯

奥迪a6正时皮带是皮带的还是链... 奥迪A6的正时系统采用的是正时链条。正时链条与传统的正时皮带有所不同。正时链条由齿轮、链条和涨紧器等...
宝马523电子水泵四插各是什么... 宝马523电子水泵四插线分别是:两根粗线,其中一根为水泵提供12V电源,另一根则是搭铁线;而两根细线...
摩托为什么挂档就灭火? 摩托为... 摩托车挂档灭火的原因可能有离合器调整不当、机油粘度大以及部件磨损过大等问题。离合器调整不当可能是离合...
手动挡的车在市区一般用几档? ... 在市区驾驶手动挡车辆时,一般推荐使用2挡或3挡。这两个挡位提供了适当的动力和速度,有助于在繁忙的交通...
宝马535le不充电有影响吗?... 对于问题“宝马535le不充电有影响吗?”,答案是肯定的。不充电会导致530le的燃油消耗增加,动力...
国道走非机动车道扣分吗? 国道... 在国道上行驶时,如果误入非机动车道,确实会面临扣分和罚款的处罚。这是因为非机动车道是专为非机动车设计...
昂科旗优盘插哪? 昂科旗优盘插... 如果您想知道昂科旗优盘接口的位置,它位于中央扶手箱内部。当然,我们也要客观地看待昂科旗的缺点。高速行...
审车需要带灭火器和三脚架吗? ... 根据相关法规规定,汽车审车需要配备三脚架,但并没有强制要求携带灭火器。具体规定如下:根据《机动车运行...
开小车超过4小时扣几分? 开小... 开小车超过4小时会扣6分。需要注意的是,这种情况下的连续开车4个小时未休息的处罚分为两种情况,而且都...
拿到驾驶证为什么查不到成绩? ... 查询驾驶证成绩时,若已拿到驾驶证却无法查到成绩,可能的原因主要有:首先,平台因素可能是关键。在完成学...