刚刚，DeepSeek开源V3.2-Exp，公开新稀疏注意力机制DSA_科学探索

刚刚，DeepSeek开源V3.2-Exp，公开新稀疏注意力机制DSA

创始人

2025-09-29 19:16:46

机器之心报道

机器之心编辑部

还是熟悉的节奏！

在假期前一天，DeepSeek 果然搞事了。

刚刚，DeepSeek-V3.2-Exp 开源了！

该模型参数量为 685B，HuggingFace 链接：

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

此外，此次发布竟然也同步公开了论文，公开了 DeepSeek 新的稀疏注意力机制，为我们提供了更多结束细节：

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

DeepSeek Sparse Attention（DSA）稀疏注意力机制

在官方介绍中，DeepSeek 表示 DeepSeek-V3.2-Exp 是实验版本。作为迈向下一代架构的过渡，V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力机制（DeepSeek Sparse Attention，DSA）—— 一种旨在探索和验证在长上下文场景下训练和推理效率优化的稀疏注意力机制。

DSA 也是 3.2 版本的唯一架构改进。

DeepSeek-V3.2-Exp 的架构，其中 DSA 在 MLA 下实例化。

重点要说的是，DeepSeek 称该实验版本代表了他们对更高效的 Transformer 架构的持续研究，特别注重提高处理扩展文本序列时的计算效率。

在 v3.2 版本中，DeepSeek 稀疏注意力 (DSA) 首次实现了细粒度稀疏注意力，在保持几乎相同的模型输出质量的同时，显著提高了长上下文训练和推理效率。

为了严格评估引入稀疏注意力机制的影响，DeepSeek 特意将 DeepSeek-V3.2-Exp 的训练配置与 9 月 22 日刚刚推出的 V3.1-Terminus 进行了对比。在各个领域的公开基准测试中，DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 相当。

更多信息，读者们可以查阅 DeepSeek-V3.2-Exp 的 huggingface 介绍。

值得一提的是，智谱的 GLM-4.6 也即将发布，在 Z.ai 官网可以看到，GLM-4.5 标识为上一代旗舰模型。

最后，有一波小节奏。在模型发布前，已经有网友在 Community 里发帖称：国庆是休息日，请给我们关注的同学一点休息时间。

对此，你怎么看？

机制注意力架构效率 DeepSeek -Exp 模型训练 Sparse 版本 https

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

上一篇：AI百舸争流时代，华为如何帮助行业破浪前行？

下一篇：国庆前放大招！DeepSeek-V3.2-Exp发布并开源，API成本将降低50%以上

热门资讯

财合联盟会员抽奖抽奖仪式一级市... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。随着全民理财时代到...

上海亚商投顾曾宪瑞靠谱吗？退费... 上海亚商投顾曾宪瑞靠谱吗？退费通道开放，虚假荐股骗服务费，被骗均可退！投资有风险，投资需谨慎！针对网...

四川华太新园寓宙授权销售SHA... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。股票市场热度持续攀...

老刘堂主直播间讲课打新股认购湖... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。随着大众理财意识不...

先锋商学院“周聪”认购河南宸邦... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。在股票投资领域，“...

汇正财经29800跟投靠谱吗？... 汇正财经29800跟投靠谱吗？股民被坑维权全过程，核心步骤直接照做就行！　投资有风险，投资需谨慎！针...

在海能投顾交了12800服务费... 在海能投顾交了12800服务费怎么退?投资者亲身经历揭秘:被骗这样追回! 在监管的灰色边缘，众多投资...

龙马工会-公益课直播间旭东老师... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。近期，“原始股”...

海南白沙源物茶产业有限公司买茶... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。近年来“买公司经销...

筑梦学员计划赵东交流圈直播间推... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。“原始股”骗局时有...

四川华太新园寓宙讯息科技集团有... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。最近总有人在微信群...

四川大决.策投资顾问有限公司怎... 　　投资有风险，投资需谨慎！针对网上素未谋面的网友、网上老师推荐网上投资理财、炒期货的、做外汇的、炒...

未来之星计划秦峰老师认购河南宸... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合“原始股”因常被贴上...

湖南侗都生物科技有限公司买侗藏... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。“准上市公司老板”...

万隆证券投顾缴纳服务费可以退吗... 万隆证券投顾缴纳服务费可以退吗？投顾服务费可退，正规退费渠道已开通！投资有风险，投资需谨慎！针对网上...

聚財閣VIP内部89群致远老师... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合近年来，各类网络投资...

河南宸邦数据技术有限公司承诺海... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。随着大众理财意识...

筑梦大讲堂赵东交流圈认购河南宸... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。随着全民理财时代到...

直播间讲课打新股认购湖南侗都生... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。股票市场热度持续攀...

和众汇富1980到底划不划算？... 和众汇富1980到底划不划算？刚开始接触众赢财富通的时候，我其实特别喜欢那种不断获得新认知的感觉。因...

爱赢开福投顾靠谱吗？退费遇到阻... 爱赢开福投顾靠谱吗？退费遇到阻碍不用慌，真实案例带你轻松脱困！　投资有风险，投资需谨慎！针对网上素未...

策马奔腾伯杰、博观、致远老师推... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。随着大众理财意识不...

四川恒旭达智能科技有限公司“被... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。在股票投资领域，“...

筑梦学员计划赵东交流圈直播间推... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。近期，“原始股”...

南京中科微点运维供应链有限公司... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。近年来“买公司经销...

刚刚，DeepSeek开源V3.2-Exp，公开新稀疏注意力机制DSA

相关内容

热门资讯