华为盘古大模型陷“抄袭”阿里千问争议,华为回应:自主训练,合规使用开源组件
创始人
2025-07-07 20:42:48

华为盘古大模型被质疑抄袭阿里通义千问,盘古官方回应否认抄袭

6月30日,华为高调开源其盘古大模型,包括盘古7B稠密模型和盘古Pro MoE 72B混合专家模型。然而,这份成果迅速陷入一场涉及“抄袭”的舆论漩涡。用户HonestAGI在GitHub发布报告指出,盘古Pro MoE 72B模型与阿里巴巴半年前发布的通义千问Qwen-2.5 14B模型在关键参数上呈现“异乎寻常的高度相似”。

HonestAGI的报告称,通过分析模型核心的注意力参数,发现盘古Pro MoE 72B与Qwen-2.5 14B的平均相关性系数高达0.927,远超业内通常的0.7阈值。报告认为,深度学习模型训练具有高度随机性,如此高相似度自然发生的概率极低,质疑盘古模型是在千问基础上进行增量训练,即“站在巨人肩膀上”而非完全从零训练。

面对汹涌质疑,华为旗下负责盘古大模型开发的诺亚方舟实验室于7月5日发布正式声明,明确表示,“盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”

通义千问Qwen系列采用宽松的Apache License 2.0协议,允许商业使用、修改和分发。华为若在使用千问开源代码或组件时遵循了协议要求(保留版权声明、免责条款等),则属于合法合规行为。

此次事件的焦点在于华为是否如HonestAGI指控般,使用了千问的预训练权重进行初始化或增量训练,但双方均未对此提供直接证据。华为称盘古大模型为“从底层硬件到顶层应用的完全自研技术栈”,HonestAGI的报告权威性亦存疑。

目前公开证据显示,华为在盘古大模型开发中使用了包括通义千问在内的开源组件,并履行了相关开源协议的标注义务,这本身不构成法律意义上的抄袭。引发争议的“高参数相似性”指控,其分析方法与结论的有效性尚存争议且缺乏直接验证。事件最终定论,恐需更权威的第三方技术验证或法律裁决。

相关内容

热门资讯

AI助力阿尔茨海默病治疗突破 你知道经常吃鸡蛋可能有助于保持老年时期的头脑敏锐吗?或者阿尔茨海默病实际上与神经元周围的髓鞘退化有关...
开源 AI 及其在当今世界中的... 当团队准备部署大语言模型时,他们面临一个重要选择:是否向全世界公开系统的运作机制,包括参数、训练数据...
北京一副区长停“小电驴”遭“三... “没地停了”“这不让停”“人行通道不能停”……近日,北京一副区长实地体验早高峰停放电动车却遭遇“三连...
打字就能补全句子,讯飞推出个性... 2025科大讯飞全球1024开发者节AI文娱生态战略发布会近日在合肥举办。会上透露,讯飞AI文娱将基...
对话华为樊杰:AI落地浪潮下的... 随着大模型的规模落地,AI发展的主战场正从“模型训练”转向“行业推理”,解决推理效率瓶颈成为释放AI...