字节开源MoE关键优化技术大模型训练成本可再省40%_科学探索

创始人

2025-03-10 19:10:45

0次

3月10日，记者从字节跳动获悉，字节豆包大模型团队宣布开源针对MoE架构的关键优化技术COMET，可将大模型训练效率提升1.7倍，成本节省40%。

上证报中国证券网讯（记者罗茂林）3月10日，记者从字节跳动获悉，字节豆包大模型团队宣布开源针对MoE架构的关键优化技术COMET，可将大模型训练效率提升1.7倍，成本节省40%。

据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万GPU小时训练算力。针对MoE通信瓶颈，COMET通过在计算-通信重叠层面的多项创新，大幅降低了MoE流水线上的通信延迟。

同时，COMET支持业界绝大部分主流大模型，并可以像插件一样接入已有的MoE训练框架，无需进行侵入式改动，也可以与DeepSeek开源的DualPipe方案联用以更大压缩训练成本。该工作以高分入选了全球机器学习系统顶级会议MLSys 2025。

字节成本关键技术 DeepSeek 通信模型训练 DualPipe MLSys 字节跳动 MoE 节豆包

智慧的宝库，知识丰富的人如何巧... 在日常生活中,我们经常会遇到各种各样的问题，从简单的日常琐事到复杂的专业难题，这些问题就像是生活中的...

哪种违章会拍到脸哪种违章会拍... 违章会拍到脸的有：第一种、电子警察，安装位置是交叉路口和路段抓拍行为，包括闯红灯、不按导向行驶、违...

高尔夫仪表盘不亮高尔夫仪表盘... 高尔夫仪表盘不亮的原因可能有多种，下面是一些常见的情况：1. 如果车辆仪表盘的保险丝出现损坏，就会导...

洗车可以冲进气格栅吗洗车可以... 洗车可以使用水枪冲洗进气格栅，但是需要注意一些事项。首先，将水枪的压力调到较低的状态，不要用太高的水...

上汽通用五菱是国企还是私企上... 上汽通用五菱是一家三方合资企业，由上海汽车集团股份有限公司、通用汽车（中国）公司和柳州五菱汽车有限责...

迈腾变速箱油几升迈腾变速箱油... 迈腾的变速箱油用量通常在3.5L左右，若采用重力换油方式，大约需要6升左右的变速箱油。变速箱油在车辆...

腾势和奔驰是什么关系腾势和奔... 腾势与奔驰之间有着深厚的合作关系。腾势汽车，作为一个高端电动车品牌，是由比亚迪汽车与奔驰母公司德国戴...

汉龙汽车属于哪个品牌姹夐緳姹... 汉龙汽车是属于中国的民族品牌，成立于2016年，受到了政府的重点支持。汉龙汽车位于湖北省大冶市，是一...

交强险过期多久不能上路交强险... 交强险是每位机动车车主必须购买的强制保险，保障期内才能上路行驶。一旦交强险过期，车辆就不能上路行驶，...

白车贴黑顶需要备案吗鐧借溅璐... 对于“白车贴黑顶需要备案吗”的问题，答案是不需要。需要注意的是，车辆的车顶更改颜色时，颜色面积不得超...