据智东西,DeepSeek近日开源推测解码框架DSpark及训练框架DeepSpec,推出DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark模型。相关论文由梁文锋署名,联合北京大学完成。
DSpark采用半自回归架构,将并行主干网络与轻量串行模块结合,建立块内token依赖,缓解末尾内容通过率衰减问题。同时引入置信度调度校验机制,根据前缀通过概率与引擎吞吐特征动态调整校验长度。
部署于DeepSeek-V4线上服务系统后,DSpark在保持整体吞吐不变的前提下,将单用户生成速度提升60%至85%,并在严格交互时延约束下避免吞吐率大幅滑坡,推高服务系统的帕累托最优边界。
DeepSpec为全栈代码库,包含数据准备、草稿模型训练及评估脚本,支持MIT许可,目前兼容DSpark、DFlash和Eagle3三种草稿模型算法。开发者可借助该工具为Qwen3、Gemma等模型训练草稿模型,降低推测解码落地门槛。